RFM模型算法.docx
- 文档编号:12476161
- 上传时间:2023-04-19
- 格式:DOCX
- 页数:12
- 大小:37.22KB
RFM模型算法.docx
《RFM模型算法.docx》由会员分享,可在线阅读,更多相关《RFM模型算法.docx(12页珍藏版)》请在冰豆网上搜索。
RFM模型算法
RFM模型
———————————————————————————————————————
一、RFMT模型介绍
在营销活动中,每个客户的价值因其购买能力和实际需求的不同而各不相同,寻找一种工具来辨别客户价值至关重要。
客户价值模型的建立可以对客户进行排序分类,然后对客户进行个性化营销。
本文为南航精准营销体系的建立引入了RFMT模型,它以客户关系领域广泛用来衡量客户价值和描述客户行为的RFM模型为基础,拓展而成。
RFMT模型有四个指标,如下
●R(Recency)
R表示用户最近一次购买南航机票的时间间隔。
理论上,最近一次消费时间越近的用户应该是比较好的用户,对提供即时的商品或是服务也最有可能会有反应。
R指标主要刻画了用户对南航网站的关注程度。
●F(Frequency)
F表示用户在限定时间内购买机票的频率,消费频率越高的用户,其满意度和忠诚度也就越高。
F指标主要刻画了用户对南航的忠诚度。
●M(Monetary)
M表示用户在限定时间购买南航机票的平均金额。
消费金额是所有数据库报告的支柱,直接反应了南航的盈利情况。
M指标主要刻画了用户的购买力。
●T(Topest)
T表示单次购买的最高金额,反映的是客户一次性消费的最高能力。
RFMT模型以上述四个指标为替代变量,通过指标标准化和赋予权重来计算客户价值,然后根据用户价值来进行均值聚类分析,将用户分成不同的类别,作为南航精准营销的基础。
二、RFMT模型建立
●研究对象:
南航购票客户
●客户定位:
姓名+证件号码
●数据:
2013年1月1日——2013年1月31日的官网销售数据
●20万条销售记录
●模型涉及:
数据分析、网站营销、网站推广
●执行问题:
数据提取用时久,需设备支持。
1、指标权重确立
本文用层次分析法来确定模型各个指标的权重,层次分析法(AnalyticHierarchyProcess简称AHP)是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法,步骤如下:
1.1建立判断矩阵
首先进行人为的定性判定,因为在价值评估中客户的消费额对于企业的利润贡献度较大,所以一般来说M应该具有最高的重要性;F重在衡量客户的忠诚度,忠诚度越高,对于企业的价值也越高,所以F也会占到一定的比例;而最高消费额T在一定程度上可以体现客户的消费能力,这个因素对于区分价格敏感型的客户有参考作用;R最近一次消费则是关系到一个客户的最近情况,由于对与航空业来说客户的需求不连续,所以R指标对于衡量客户价值权重不高,但从理论上说最近有购买的客户会比更长时间之前购买的客户对南航具有更高的产品关注度,营销效果也会好点,所以把R也当作其中一个指标参考。
对于这四个指标,首先需要通过专家评估法来对各项指标进行两两对比,对比的标准如下图所示:
表层次分析法标度表
标度
定义与说明
1
两个元素对属性具有同样的重要性
3
两个因素比较,一个因素比另外一个元素稍微重要
5
两个因素比较,一个因素比另外一个元素明显重要
7
两个因素比较,一个因素比另外一个元素非常重要
9
两个因素比较,一个因素比另外一个元素极端重要
2,4,6,8
表示需要在两个标准中折衷
1/bij
两个元素间的反比较
本文采用专家评估法来确定指标之间的重要性,其中根据实际情况,专家人群选取了论文小组成员。
首先评估人员对四个指标进行定性判定。
由于在价值评估中客户的消费额对于企业的利润贡献度较大,所以一般来说M应该具有最高的重要性;F重在衡量客户的忠诚度,忠诚度越高,对于企业的价值也越高,所以F也会占到一定的比例;而最高消费额T在一定程度上可以体现客户的消费能力,这个因素对于区分价格敏感型的客户有参考作用;R最近一次消费则是关系到一个客户的最近情况,由于对与航空业来说客户的需求不连续,所以R指标对于衡量客户价值权重不高。
然后根据定性判断来对各指标进行两两对比,取评估人员的平均值,可得:
R
F
M
T
R
1
1/5
1/7
1/4
F
5
1
1/2
2
M
7
2
1
3
T
4
1/2
1/3
1
1.2归一化处理
①矩阵每一列元素的总和
R
F
M
T
R
1
1/5
1/7
1/4
F
5
1
1/2
2
M
7
2
1
3
T
4
1/2
1/3
1
各列之和
17.00
3.70
1.98
6.25
②归一化处理
R
F
M
T
R
0.06
0.06
0.08
0.14
F
0.29
0.27
0.25
0.32
M
0.41
0.54
0.51
0.48
T
0.14
0.04
0.17
0.06
③判断矩阵的特征向量
R
F
M
T
各行之和
R
0.06
0.05
0.07
0.04
0.33
F
0.29
0.27
0.25
0.32
1.13
M
0.41
0.54
0.51
0.48
1.44
T
0.14
0.04
0.17
0.06
0.32
对向量
=(0.22,1.13,1.44,0.32)T进行归一化处理,得R、F、M、T判断矩阵的特征向量:
W=(0.13,0.34,0.43,0.10)
1.3计算判断矩阵的最大特征根λmax
4.05,其中(Bw)i表示向量Bw的第i个元素。
1.4一致性检验
矩阵一致性指标CI,
0.02;
RI取值表:
n
1
2
3
4
5
6
7
8
9
10
RI
0
0
0.58
0.9
1.12
1.24
1.32
1.41
1.45
1.49
计算随机一致性比率CR,
0.022<0.1;
当CR<0.1时,认为层次总排序通过一致性检验。
所以最后确定R、F、M、T的权重分别为0.13,0.34,0.43,0.10。
故,(WF,WR,WM,WT)=(0.13,0.34,0.43,0.10)
2、R、F、M、T值的标准化
对各属性进行规格化变换,规格化变换又称为极差正规比变换,它是从数据矩阵中的每一个变量最大值和最小值,并用最大值减去最小值得出极差。
然后用每一个原始数据减去该变量中的最小值,再除以极差,即得到规格化数据,标准化公式:
X’=(X-XMIN)/(XMAX-XMIN)
(1)
X’=(XMAX-X)/(XMAX-XMIN)
(2)
其中,X’是标准化的R,F,M,T值,X是原值,XMAX和XMIN分别是该指标的最大值和最小值。
由于F,M,T指标的影响是正向的,所以适用式
(1),而R得指标影响是负向的,适用式
(2)。
根据2013年1月的销售数据,得XRMIN=0,XRMIAX=30,XFMIN=1,XFMAX=42,XMMIN=0,XMMAX=40690,XTMIN=0,XTMAX=35630。
3、计算单个客户的价值得分
对标准化后的R,F,M,T进行加权求和,得到每个客户的价值得分,公式如下:
SRFMT=Wr*Xr’+Wf*Xf’+Wm*Xm’+Wt*Xt’(3)
式中SRFM表示客户的RFMT价值得分,Wr、Wf、Wm分别表示R、F、M各指标的权重,Xr’、Xf’、Xm’、Xt’分别表示标准化后的R、F、M、T值。
如下表所示:
客户
R
F
M
T
价值
1
13
19
30570
7100
0.72
2
9
18
13870
1950
0.49
3
14
18
29980
7100
0.69
4
5
16
40690
4720
0.8
5
20
14
3280
640
0.27
6
2
14
30790
6300
0.67
7
6
13
5070
1380
0.31
8
1
12
16950
2710
0.45
9
14
12
27970
7100
0.58
10
7
11
3350
1220
0.26
11
0
11
4590
1320
0.29
12
6
11
3960
1020
0.26
13
7
11
5510
980
0.28
14
5
10
6930
1640
0.29
15
3
10
14670
3130
0.39
16
6
10
4110
840
0.25
17
8
10
7660
1950
0.29
18
14
10
6420
1640
0.26
19
15
10
6950
1640
0.27
20
0
10
5660
3000
0.29
21
5
10
5590
1140
0.27
22
9
9
7900
2340
0.28
23
1
9
17060
5950
0.43
24
3
9
2530
690
0.22
4、将客户分类,计算每一类客户的价值得分
使用K-均值聚类法时,需要预先判断其聚类的类别数。
在模型中客户分类通过每个顾客类别RFMT平均值与总RFMT平均值相比较来决定的,而单个指标的比较只能有两种情况:
大于(等于)或小于平均值,因此可能有16种类别,利用SPSS我们也可以知道那位客户属于哪个类别。
通过RFM分析将南航的客户群体划分成重要保持客户、重要发展客户、重要挽留客户、一般重要客户、一般客户等5个级别,各客户级别如下表所示。
客户分级不仅揭示了客户在级别上的差异,而且反映了客户在行为上的特性和变化倾向。
针对不同等级的客户,采取不同的管理策略。
但是,这种分类只是确定了客户的等级,却没有各类客户之间的一个量化的价值比较,因而对各类客户做相应的价值分析是非常有必要的。
标准化的RFM加权分类
客户类别
客户数量
R
F
M
T
每类价值
客户级别
排序
1
5
0.53
0.84
0.52
0.16
0.59
重要保持
1
2
1824
0.89
0.19
0.08
0.05
0.22
重要发展
2
3
18019
0.97
0.03
0.03
0.03
0.15
重要挽留
3
4
4
0.93
0.65
0.65
0.16
0.64
重要保持
1
5
32567
0.29
0.03
0
0
0.07
一般重要
5
6
8
0.53
0.1
0.76
1.01
0.53
重要保持
1
7
16473
0.77
0.05
0.04
0.03
0.14
重要挽留
3
8
8
0.84
0.1
0.76
0.98
0.57
重要保持
1
9
59
0.68
0.13
0.37
0.44
0.34
重要保持
2
10
26949
0.45
0.03
0.02
0.02
0.08
一般重要
5
11
17843
0.87
0.03
0.03
0.03
0.14
重要挽留
3
12
1267
0.53
0.12
0.13
0.14
0.18
重要挽留
3
13
764
0.84
0.09
0.15
0.17
0.22
重要发展
2
14
22817
0.68
0.03
0.03
0.03
0.11
一般
4
15
39924
0.12
0.03
0
0
0.04
一般重要
5
16
21467
0.56
0.03
0.03
0.03
0.1
一般
4
均值
0.66
0.16
0.23
0.21
0.26
客户分类后,并不知道每一类客户的价值差别有多大,相对企业的重要性怎样。
利用AHP法分析得到的RFMT各指标权重,并结合各类顾客的标准化后RFMT指标,可以得到每个类别客户的价值得分。
在进行客户分类后再对客户的类别进行顾客终身价值排序,使得企业能够量化各类客户的价值的差别,弥补了的客户分类方法的不足。
这有助于企业制定更为可行的客户政策。
由于受到成本的制约,南航不可能提供完全的、无差别的个性化服务,只能将资源先集中在少数几类对企业重要的客户上。
按照总得分的排列情况,企业应该优先将资源投放到总得分较高的客户身上。
三、存在问题与优化方向
RFM模型是业界内普遍认可的、可有效区分客户价值的分析方法。
而结合航空业来说,RFM这几个指标在应用中也会有所不同,而这几个指标也是在评估客户价值中比较关键的,要更全面的评估客户的价值,应该需要结合他的个人信息如年龄、收入、职业等,不过这些信息在现阶段数据体系中也不一定有或者可用。
1.R指标问题及优化
问题:
R(Recency)值的是用户最近一次访问网站到某时刻的时间间隔,它衡量的是用户对网站的关注,如果R越小,则表示用户对网站的关注度高,其表现出的用户价值就越高,反之则越低。
●问题
仅用用户最近的一次访问来刻画用户对南航的关注度,并不够全面,比如有A、B两个用户,他们对官网的访问轨迹如下:
从上图可以看出,用户A的R比B小,按照模型用户A的价值会比较高,但是同样可以看出B的访问比较密集,而且次数和A一样。
可能他偶然刚好有一段时间没有访问,所以导致其价值变低。
●优化方案
在以后模型的发展中,可以考虑用户更多的访问次数,而不只是最近的一次,而是最近n次,鉴于不同访问次数时间越靠前其价值越高,所以可以给每一次购买(访问)时间赋予一定权重来描述其重要性,如下:
次数
最近第1次
最近第2次
最近第3次
······
最近第n次
时间间隔
T1
T2
T3
······
Tn
权重
W1
W2
W3
Wn
所以,R代表的时间间隔计算如下
R=
,i=1、2、3····n
比如模型选取最近的4次访问,其权重依次如下0.1、0.2、0.3、0.4,所以R代表的时间间隔:
TR=0.4*T1+0.3*T2+0.2*T3+0.1*T4
如果能够记录用户的每次来访,就可以将所有的访问纳入R的计算中,使得模型更加全面。
2.指标自身问题
根据根据美国数据库营销研究所ArthurHughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:
消费(Recency)、消费频率(Frequency)、消费金额(Monetary),因此建立了RFM模型来衡量客户价值,而本文建立的RFMT模型是由RFM模型变化拓展而来,其中新增了T,表示该段时间内用户消费的最高金额。
●问题1:
指标间存在一定的相关性
对于模型中的四个指标R、F、M、T,R与F有较大的相关性,F越大的时候R越大的几率较大;M与T有较大的相关性,M越大的时候T越大的几率较大,在价值衡量模型中出现相关性较大的指标,这样模型会显得冗余。
一个优秀的模型的标志是用最少数量的指标来刻画模型特征,所以在后期可以对RFMT模型进行精简,抓住主要的F(消费频率)和M(消费总金额)指标来进行分析。
●问题2:
指标局限性
RFMT是衡量用户的价值的代表性指标,描述的主要是用户行为特征。
这些指标还不能涵盖用户绝大多数的行为特征,所以说该模型具有局限性。
同时,本文用R(时间间隔)来描述用户对网站的关注程度,但是更好的标准应该是用户对南航官网的访问频率,它可以更好地判断一个用户对机票的需求程度,访问越频繁的代表越有需求。
但是现有数据并不支持将客户每次的访问都记录下来,而且也不能知道访问的是否是同一个人。
●优化方案
在可获取前提下,深入研究有哪些因素可以作为衡量用户价值的指标因素。
后期可以做模型扩展,将用户的其他特征指标加进来,比如职位、收入等个人信息,建立一个更加全面和准确的用户价值体系。
3.模型落实问题
在此,我们利用RFMT模型只做到了分析这一个月的时间内的单个客户的价值、客户分类及每类的重要程度。
接下来要做的是:
优化模型、研究南航全部的销售数据、如何利用得出的结论进行营销。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- RFM 模型 算法