PICC用户画像解决方案.docx
- 文档编号:24023033
- 上传时间:2023-05-23
- 格式:DOCX
- 页数:16
- 大小:151.25KB
PICC用户画像解决方案.docx
《PICC用户画像解决方案.docx》由会员分享,可在线阅读,更多相关《PICC用户画像解决方案.docx(16页珍藏版)》请在冰豆网上搜索。
PICC用户画像解决方案
PICC项目用户画像解决方案
1、背景
1.1、用户细分-画像与营销
典型的营销活动相关的数据分析包括以下步骤:
1、收集用户不同方面的数据
2、用户分析与用户细分,分析不同群组的行为与需求
3、建立用户响应预测模型,定位响应可能性较高的用户
4、选择不同的渠道、时间和Offer
5、通过测试和控制组比较分析效果
6、通过营销分析优化下一次的渠道、Offer等
因此用户细分(画像)在营销活动中的作用是理解、定位与筛选用户。
1.2、用户细分-画像的概念
1.2.1、用户行为细分
按照用户行为方式将用户分为不同的群组,可以按照以下几种维度进行细分:
用户购买方式细分(时间、地点、设备、渠道)
用户购买产品细分(产品类别偏好)
例如在保险行业按照用户购买产品细分,可以分为旅游与运输险用户、家庭与责任险用户、车险用户等。
1.2.2、用户价值细分
按照用户产生的价值进行细分,可以分为高价值、普通和低价值用户。
1.2.3、用户需求细分
按照用户人生阶段,可以分为初入职场、家庭建立,财富累积、职业生涯晚期等不同阶段,每个不同阶段的用户有不同的需求。
1.2.4、用户画像
在用户细分的基础上,分析各个群组的其它维度。
例如在购买产品行为细分的基础上,分析各个群组的年龄、性别、浏览、购买方式等,形成完整的用户群组描述。
1.3、用户细分-画像的应用场景
1.3.1、用户获取
根据用户的历史购买金额数据,进行用户价值细分,通过分析当前高价值用户群体的特征,定位与高价值用户类似的用户。
1.3.2、产品定位
根据产品购买行为和产品使用行为数据,分析当前公司已有的用户细分与每个细分所占份额,通过与竞争对手用户细分所占份额进行比较,分析优势细分群体与未覆盖细分群体的市场份额与产品属性偏好,进行新产品的定位。
1.3.3、交叉销售
在向用户销售新产品时,通过分析样本用户中最终购买和未购买用户的个人基本信息、历史购买记录和历史浏览记录,建立购买可能性预测模型,提取在非样本用户中购买可能性较高的那一部分人群,提升转化率。
1.3.4、精准推荐
通过分析用户的购买行为分类、浏览行为分类和年龄、性别等个人基本信息,
找到与指定用户相似的用户群体,计算该用户群体最多购买的产品,向该指定用户进行相似度推荐。
当用户浏览产品A时,分析所有浏览过产品A用户的浏览记录,找到浏览产品A后最有可能浏览的其它产品,进行关联推荐。
2、实施过程
2.1、数据定义
数据集市的目的是整合所有数据挖掘和营销相关的用户数据,确保数据的完整性,以及提升数据挖掘项目的速度。
数据集市中至少应当包括用户基本信息、用户访问记录、用户产品浏览记录、用户购买记录和数据对照字典。
可能的业务场景包括产品关联分析、用户响应预测、用户细分-画像、
2.1.1、用户基本信息
整合之后的用户基本信息应当包括身份识别标识,姓名,性别,年龄、婚姻状况、学历、地区、联系方式、小孩数量等数据,如有其它外部源数据,可通过用户身份信息表进行关联,并导入外部相关标签信息。
用户身份信息表,用于识别并标识唯一用户。
属性
说明
访问标识
主键
访客标识
访问时间
证件类型
证件号码
会员账号
手机号码
邮箱
城市
该表为用户身份信息表,作为数据集市的一个底层表。
用户信息表来源为线上渠道,包括epicc网站、wap端、客户端以及微信页面,主要用于对线上用户的唯一识别及整合客户身份信息。
用户唯一识别规则如下:
(1)优先以证件号码作为唯一用户识别标识,同一访客不同证件号码,将会算不同的用户;不同访客,同一证件号码,会归为同一个客户;
(2)证件号不存在时,以用户用效手机号为唯一识别标识,处理规则同上;
(3)手机号不存在时,以用户会员账号为唯一识别标识,处理规则同上;
(4)会员账号不存在时,以有效的邮箱号码为唯一标识,处理规则同上;
唯一标识确定之后,在整合用户身份信息时,如果存在唯一标识相同,其他身份信息不同,则以访问时间最近一次为准,最终将用户身份信息以唯一识别标识为中心,整合成一条数据;
2.1.2、用户访问记录
用户访问记录表,作为数据集市的一个底层表,存放用户每次访问的相关记录,主要涉及字段如下表:
属性
说明
访问标识
主键
访客标识
访问时间
访问次数
访问深度
登录页面
退出页面
营销渠道
SEM/DSP/EDM/短信
来源类型
搜索引擎
外部关键词
内部关键词
访问渠道
例如Web、APP、WAP
分辨率
操作系统
设备名称
App
运营商
App
下载渠道
App
2.1.3、产品浏览表
产品浏览表,记录线上渠道用户每次访问的产品浏览记录
访问标识
主键
访客标识
产品A浏览数量
产品B浏览数量
产品C浏览数量
········
2.1.4、产品订单表
产品订单表,记录线上渠道用户每次访问的产品订购数量
访问标识
主键
访客标识
产品A订单数量
产品B订单数量
产品C订单数量
··········
2.1.5、订单明细表
用户订单明细记录至少应当包括订单标识,访问标识,访客标识,订够时间,购买产品,购买金额等。
订单编号
主键
访问标识
访客标识
订购时间
购买产品
购买金额
··········
2.1.6、业务数据库数据
业务数据库数据主要为客户交易数据、CRM数据库以及其他渠道数据等
2.1.7、数据对照字典
对照数据字典用于当数据中记录的是代码而不是名称时,用于查询对应的名称。
对照数据也可以用于对被对照数据的分类,例如产品的分类。
2.1.8、用户信息汇总
用户信息汇总作为所有分析的基础,为数据库中的视图,定期进行更新。
用户信息汇总包含以下:
用户基本信息:
身份识别标识
性别
年龄
城市
用户访问记录:
最近三个月Web访问次数
最近三个月WAP访问次数
最近三个月APP访问次数
用户浏览记录:
最近三个月A产品浏览次数
最近三个月B产品浏览次数
最近三个月C产品浏览次数
最近三个月D产品浏览次数
最近三个月E产品浏览次数
用户购买数据:
最近N月A产品购买数量
最近N月A产品购买金额
最近N月B产品购买数量
最近N月B产品购买金额
最近N月C产品购买数量
最近N月C产品购买金额
最近N月D产品购买数量
最近N月D产品购买金额
最近N月E产品购买数量
最近N月E产品购买金额
最近N月购买总数量
最近N月购买总金额
最大购买金额
最小购买金额
最近一次购买时间
最近一次购买金额
用户标签:
浏览行为分类:
访问渠道偏好、来源渠道偏好、搜索引擎偏好、关键词偏好、访问时长、访问频次、营销渠道偏好、产品浏览偏好等
用户信息分析:
年龄段分类、职业、性别、家庭(婚姻、小孩、父母)、联系方式真实度评估
购买行为分类:
购买记录、购买时间偏好、购买产品偏好、支付方式分类
用户价值分类(根据保险购买记录、保费金额、理赔信息等判断):
价值评估、资产评估(房屋、车辆、企业资产等)
兴趣爱好类:
旅游偏好、宠物偏好
2.1.9、数据集市逻辑设计
2.2、数据获取
2.2.1、线上行为数据
Web、WAP、APP等从Insight获取
2.2.2、业务数据
从公司内部业务数据源获取
2.2.3、外部数据
引入或购买外部数据
2.3、数据处理
2.3.1、用户识别
通过访客标识(Cookie)和证件号码进行唯一用户。
如果没有证件号码,则通过手机号码识别唯一用户。
如果没有手机号码,则通过登录账号识别唯一用户。
如果没有登录账号,则通过邮箱识别唯一用户。
2.3.2、用户浏览行为整合
根据访问级别的用户浏览记录,通过访客标识和身份标识进行浏览数据的处理和汇总,最后形成用户级别的浏览行为汇总。
2.3.3、用户投保行为整合
通过处理访问级别的订单记录和CIF数据库提供的部分实际成单数据,进行用户投保记录的整合,最后形成用户级别的投保行为汇总。
2.3.4、用户投保行为分类标签生成
通过选取样本用户的投保行为数据,包括各产品的投保数量和投保金额,进行主成分分析和聚类分析,确定分类标签的含义,训练分类预测模型,预测非样本用户的分类标签,从而生成所有用户的投保行为分类标签。
2.3.5、用户购买可能性分析
通过分析近N个月内浏览过某产品的所有用户的用户基本信息、投保行为和浏览行为,以购买或未购买该产品为目标变量,建立分类预测模型,分析购买可能性最高的用户群组特征,预测在将来浏览该产品的用户的购买可能性,进行用户定位和精准营销。
2.3.6、产品首页的关联推荐
选取近N个月内的访问级别的产品浏览记录,如果浏览过某产品则记为1,没有浏览过则记为0,生成行数据代表一次访问,列数据为是否浏览过产品的矩阵,进行关联分析,得到同一次访问中浏览产品的关联规则,为每个产品提取浏览关联度最高的M个产品并写入数据表中。
2.3.7、订单支付完成页面的关联推荐
选取近用户级别的产品浏览记录,如果购买过某产品则记为1,没有购买过则记为0,生成行数据代表一个用户,列数据为是否购买过产品的矩阵,进行关联分析,得到同一用户购买产品的关联规则,为每个产品提取购买关联度最高的M个产品并写入数据表中
2.4、数据挖掘模型
2.4.1、主成分分析
在数据维度较多,例如用户可能购买的产品类别达几十种时,可以通过主成分分析,在保留大部分原有信息的情况下,推导出反映用户行为的由原有维度线性组合而成的主要复合维度。
通过对这些主要的复合维度而不是原有的几十个维度进行分析,可以减少计算的复杂度。
通过分析主要复合维度,也可以辅助对产品进行分类。
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
…
Z
C1
2
3
4
3
0
0
0
0
1
0
0
1
9
5
3
0
0
…
4
C2
0
0
0
0
4
2
5
2
0
0
0
0
1
0
0
0
0
…
1
C3
1
0
1
1
3
4
5
6
0
0
0
0
0
0
5
6
3
…
8
表1主成分分析之前的用户产品购买数据
P1
P2
P3
P4
P5
P6
C1
15
0
17
3
0
16
C2
0
20
1
0
15
17
C3
2
17
0
22
0
19
表2主成分分析之后的用户产品购买数据
2.4.2、聚类分析
通过将用户总体分为几个不同的组间差异较大、组内相似度较高的群组,可以更容易和高效地理解用户特征。
聚类分析通过计算用户维度数据之间的相似度或者距离,将用户总体分为不同群组。
通过分析群组与总体之间以及群组与群组之间各个度量平均值之间的差异,例如不同产品类别购买数量之间的差异,描述各个细分用户的购买行为。
P1
P2
P3
P4
P5
P6
分类
C1
15
0
17
3
0
16
a
C2
0
20
1
0
15
17
b
C3
2
17
0
22
0
19
c
C4
11
0
12
3
0
9
a
C5
0
23
2
0
17
13
b
C6
0
16
1
0
15
19
b
表3利用主成分分析之后的数据进行聚类分析
P1
P2
P3
P4
P5
P6
分类
性别
年龄
渠道
浏览
金额
C1
15
0
17
3
0
16
a
男
34
…
…
500
C2
0
20
1
0
15
17
b
男
23
…
…
700
C3
2
17
0
22
0
19
c
女
26
….
…
600
C4
11
0
12
3
0
9
a
女
28
…
…
400
C5
0
23
2
0
17
13
b
男
31
…
…
300
C6
0
16
1
0
15
19
b
女
41
…
…
900
表4聚类分析之后分析其它维度进行完整的用户描述
2.4.3、多元分类模型
进行聚类分析之后,可以以所在群组编号为目标变量,整合用户的产品购买数量、个人基本信息、浏览数据和其它任何感兴趣的数据,建立分类模型,更深入地描述各个分类的用户特征。
P1
P2
P3
P4
P5
P6
性别
年龄
渠道
浏览
金额
时间
分类
C1
15
0
17
3
0
16
男
34
…
…
…
…
a
C2
0
20
1
0
15
17
男
23
…
…
…
…
b
C3
2
17
0
22
0
19
女
26
…
…
…
…
c
C4
11
0
12
3
0
9
女
28
…
…
…
…
a
C5
0
23
2
0
17
13
男
31
…
…
…
…
b
C6
0
16
1
0
15
19
女
41
…
…
…
…
b
表5利用分类模型更深入地描述各个分类的用户特征
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PICC 用户 画像 解决方案