现代统计R软件论文数据分析银行电话营销成功率探究docxWord文件下载.docx
- 文档编号:21859791
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:21
- 大小:467.71KB
现代统计R软件论文数据分析银行电话营销成功率探究docxWord文件下载.docx
《现代统计R软件论文数据分析银行电话营销成功率探究docxWord文件下载.docx》由会员分享,可在线阅读,更多相关《现代统计R软件论文数据分析银行电话营销成功率探究docxWord文件下载.docx(21页珍藏版)》请在冰豆网上搜索。
这一年龄段的人们基本上事业有成,收入稳定,对产品合同的签订可能会产生一定影响。
(二)工作
工作变量为分类变量,包括管理人员、蓝领、技师、行政人员、服务行业、退休、企业家、女佣、个体经营者、学生、失业、未知十二个类别。
图2样本数据客户工作类型分布
在银行的客户中,行政人员、蓝领、技师的人数分别位于前三位;
不考虑工作未知的情况,学生、女佣和失业的人数较少。
表2不同工作客户与合同签订结果
job
y
ratio
1
admin.
420
58
87.87%
12.13%
blue-collar
877
69
92.71%
7.29%
entrepreneur
153
15
91.07%
8.93%
housemaid
98
14
87.50%
12.50%
management
838
131
86.48%
13.52%
retired
176
54
76.52%
23.48%
self-employed
163
20
89.07%
10.93%
services
379
38
90.89%
9.11%
student
65
77.38%
22.62%
technician
685
83
89.19%
10.81%
unemployed
115
13
89.84%
10.16%
unknown
31
7
81.58%
18.42%
表2是不同职业的人群对于电话营销的接受情况,可以看出,学生和退休人员虽然在银行客户中的人数较少,但其对于存款合同的接受率分别达到了23.48%和22.62%。
相对的,工作为“蓝领”的客户人数虽然相对较多,但是其合同的成功签订率只有7.29%。
造成差异的原因可以从不同工作类别的人群的特别推断。
退休人员的消费倾向不足,主要为了老年的生活而采用储蓄的方式管理现有的财产。
对学生而言,这一群体几乎没有其他的可投资项目,因此也更多的选择了储蓄存款管理资金。
蓝领工人的收入较低,为了维持基本的生活需要,可能没有多余的财产需要银行保管。
(三)婚姻状况
分类变量,包括已婚、离婚以及单身三类人群。
表3婚姻状况与合同签订比率
marital
divorced
451
77
85.42%
14.58%
married
2520
277
90.10%
9.90%
single
1029
167
86.04%
13.96%
已婚的客户存款合同的签订率要低于单身和离异的客户,可能是由于后两者更多的为今后的生活考虑,增加存款,尽可能的节约消费。
已婚的人群在赡养老人、照顾孩子方面的开销会比较大,可能暂时没有闲置资金。
(四)受教育情况
包括初等教育、中等教育、高等教育及未知
表4受教育情况与合同签订率
education
primary
614
64
90.56%
9.44%
secondary
2061
245
89.38%
10.62%
tertiary
1157
193
85.70%
14.30%
168
不考虑受教育情况未知的情形,随着受教育程度的增加,合同的签订率是逐渐增加的,说明随着教育水平的深入,人们储蓄的意识越来越强。
(五)是否存在信用卡违约情况
表5信用卡违约情况与结果
default
no
3933
512
yes
67
9
(六)年度结余
图3年度结余分布直方图图4结余金额与营销结果关系
表6年度结余统计量
年度结余
(balance)
单位:
欧元
-3313
444
1480
71188
1423
图3是年度结余的分布直方图,呈现明显的右偏分布,最低值为-3313欧元,最高值为71188欧元,差距很大。
图4是不同的结余与是否合同签订成功的关系,可以看出,结余过高或过低的客户都未成功签订,成功签订存款合同的客户的平均结余要略高于未成功签订的客户,但总体看分布更为集中。
(七)是否有住房贷款
表7住房贷款情况与合同签订结果
housing
1661
301
84.66%
15.34%
2339
220
91.40%
8.60%
(八)是否有个人贷款
表8个人贷款情况与合同签订结果
loan
3352
478
87.52%
12.48%
648
43
93.78%
6.22%
(九)联系的方式
分类变量包括固定电话、移动电话以及未知
表9联系方式与结果
contact
cellular
2480
416
85.64%
14.36%
telephone
257
44
85.38%
14.62%
1263
61
95.39%
4.61%
以固定电话或移动电话联系的成功率接近,说明这两种方式可能对成功率的影响不大。
(十)上次联系是某一月的哪一天
这个变量描述是一个月中的哪一天与客户联系,对最终的结果可能影响不大(除了某些比较迷信的客户),在接下来的建模过程中会有体现。
(十一)上次联系是哪个月
图5与客户联系的月份分布
表10不同月份的合同签订成功率
month
jan
132
16
feb
184
82.88%
17.12%
mar
28
21
57.14%
42.86%
apr
237
56
80.89%
19.11%
may
1305
93
93.35%
6.65%
jun
476
55
89.64%
10.36%
jul
645
91.36%
8.64%
aug
554
79
sep
35
17
67.31%
32.69%
oct
37
53.75%
46.25%
nov
350
89.97%
10.03%
dec
11
55.00%
45.00%
一年中的三月、十月、十二月合同签订的成功率都达到了40%以上,月份对最终结果可能存在较为显著的影响。
与某一具体日期相比,月份更多的反映季节变化、消费习惯变化等信息,对结果的影响也更加明显。
(十二)上次联系的通话时间(秒)
图6通话时间与营销结果的关系图
从图6可以看出,与成功签订合同的客户的通话时间明显高于未成功签订合同的客户。
说明该变量对因变量可能存在显著影响。
(十三)此次营销活动联系某一特定客户的次数
(十四)距离上次联系某一客户经过的天数
(十五)此次营销活动之前联系某一客户的次数
十三、十四、十五三个变量反映联系某一客户的频率,其对结果的影响未知,可能有些客户因为频率过高感觉被打扰从而拒绝签订合同,而另一些客户可能会被说服。
(十六)此前营销活动的结果
包括四种情况:
成功、失败、其他、未知
表11此前营销结果与本次营销结果关系表
poutcome
failure
427
63
87.14%
12.86%
other
159
80.71%
19.29%
success
46
35.66%
64.34%
3368
337
90.90%
9.10%
可以看出,之前的营销的结果对此次营销活动的影响较大,之前成功营销的客户本次营销活动的成功率达到了64.34%,远高于之前未成功或其他结果的客户。
本次研究的因变量为客户是否签订定期存款合同。
将客户与银行签订合同设为虚拟变量1,未成功签订设为0。
建立因变量与自变量的广义线性模型。
图7营销结果比例图
样本数据中,成功签订合同的比例约为11.52%
四、建立模型
(一)选择模型数据
为了测试模型的效果,将样本数据分为测试集test和训练集train,各占50%。
以训练集的数据为依据建立广义线性模型,以测试集的数据检验预测结果。
(二)建立模型
1.probit模型glm1
glm(formula=y1~job+marital+education+default+balance+housing+loan+contact+day+month+duration+campaign+pdays+previous+poutcome,family=binomial(link=probit"
),data=train)
结果为:
由probit模型的结果可知,在0.001的显著性水平下显著的变量有截距项(Intercept)、联系方式(contact)未知(unknown)、月份(month)中的十月、通话持续时间、之前营销结果(poutcome)成功(success);
在0.01显著性水平下显著的变量包括在银行有住房贷款和个人贷款、月份中的三月和九月;
在0.05显著性水平下显著的变量有婚姻状况(marital)中的已婚、受教育情况(education)未知、月份中的一月;
在0.1的显著性水平下显著的变量有工作(job)的失业(unemployed)以及月份中的五月。
为检验probit模型整体的显著性,建立probit空模型glm01,与全模型进行偏差分析,检验显著性。
空模型为:
glm(formula=y1~1,family=binomial(link="
probit"
偏差分析
out1<
-anova(glm01,glm1)
out1
deviance1<
-out1$Deviance[2]
d1<
-1-pchisq(deviance1,41)
最终得到的d1接近0,小于显著性水平,说明模型整体是显著的。
2.logistic模型glm2
glm(formula=y1~job+marital+education+default+balance+housing+loan+contact+day+month+duration+campaign+pdays+previous+poutcome,family=binomial(link="
logit"
由logistic模型的结果可知,在0.001的显著性水平下显著的变量有联系方式(contact)未知(unknown)、月份(month)中的十月、通话持续时间、之前营销结果(poutcome)成功(success);
在0.01显著性水平下显著的变量包括截距项(Intercept)、在银行有住房贷款和个人贷款、月份中的三月和九月;
在0.05显著性水平下显著的变量有婚姻状况(marital)中的已婚、受教育情况(education)未知、;
在0.1的显著性水平下显著的变量有月份中的一月和五月。
为检验logistic模型整体的显著性,建立logistic空模型glm02,与全模型进行偏差分析,检验显著性。
out2<
-anova(glm02,glm2)
out2
deviance2<
-out2$Deviance[2]
d2<
d2
最终得到的d2接近0,小于显著性水平,说明模型整体是显著的。
3.筛选变量
为筛选显著的变量,根据AIC准则及BIC准则,分别建立probit方法下的AIC、BIC模型,logistic方法下的AIC和BIC模型。
Probit.AIC模型:
筛选出的变量有婚姻状况(marital)受教育情况(education)、是否有住房贷款(housing)、是否有个人贷款(loan)、联系方式(contact)月份(month)、通话持续时间(duration)、之前营销活动的结果(poutcome)。
Probit.BIC模型:
筛选出的变量有是否有住房贷款(housing)、是否有个人贷款(loan)、联系方式(contact)、通话持续时间(duration)、之前营销活动的结果(poutcome)。
Logit.AIC模型:
筛选出的变量有有婚姻状况(marital)受教育情况(education)、是否有住房贷款(housing)、是否有个人贷款(loan)、联系方式(contact)月份(month)、通话持续时间(duration)、距离上次联系某一客户经过的天数(pdays)之前营销活动的结果(poutcome)。
Logit.BIC模型:
筛选出的变量有是否有住房贷款(housing)、是否有个人贷款(loan)、联系方式(contact)、通话持续时间(duration)、之前营销活动的结果(poutcome),与Probit.BIC模型的结果一致。
利用测试集test作预测
p1<
-predict(glm1,test)
p2<
-predict(probit.aic,test)
p3<
-predict(probit.bic,test)
p4<
-predict(glm2,test)
p5<
-predict(logit.aic,test)
p6<
-predict(logit.bic,test)
结合probit和logistic模型的含义,得到预测结果的矩阵pre
六种模型的预测结果如图8:
从左至右分别为probit全模型、probit.AIC模型、probit.BIC模型、logit全模型logit.AIC模型、logit.BIC模型.
图8预测结果差异图
可以看出,各模型对于结果的预测值差异并不大,BIC模型预测结果要比其他模型略高。
五、模型分析
FPR的含义为真实值为0,预测值为1的情况占真实值为0的情况的比例,TPR为真实值为1,预测值也为1的情况占真实值为1的情况的比例。
根据FPR与TPR,作ROC曲线,表示不同模型的预测结果差异。
一般而言,要求FPR越小越好,TPR越大越好。
因此,六条曲线中,越靠近TPR轴的曲线的预测效果越好。
从ROC曲线可以看出,六种模型的预测效果十分接近,大致可以看出probit.aic曲线比其他曲线稍稍接近纵轴,即以probit方法所做的广义线性回归经AIC准则筛选变量后的模型的效果最好。
下面以Probit.AIC模型进行分析:
图9预测效果(TPR-FPR)
(一)婚姻状况
“divorced”为对照变量,当married与single同时为0时,表示离异状态;
当married为1,single为0时,表示已婚状态;
当marrried为0,single为1时,表示单身状态。
表3只考虑婚姻状况对结果的影响,从系数的估计值看,已婚状态对营销结果为1(即成功)的负相关程度更大,符合从表3的结论。
(二)受教育情况
接受高等教育的客户对营销成功有促进作用。
这类客户的储蓄意识可能较其他客户稍强。
(三)住房贷款、个人贷款
拥有住房贷款和个人贷款的客户对存款合同推销成功有不利影响,参数估计值均为负。
可能的原因是是这些客户更多的是将资金用于还贷而非储蓄存款。
(四)联系方式
当客户是以固定电话接听时,对营销成功有微弱的不利影响,参数估计值只有-0.003。
实际上,以何种方式联系客户对银行而言的差别并不明显。
(五)月份
在影响显著的月份中,一月、五月、十一月对成功营销存在负面影响,三月、九月、十月对成功营销有促进作用。
(六)通话持续时间
一般而言,通话时间越长,产品介绍的越详细,越有可能被客户接受。
回归结果也符合这一常理。
(七)之前营销活动结果
之前营销活动结果变量(poutcome)为success的参数估计值为0.8262,对营销成功有促进作用。
结合表11可以看出,之前营销成功此次再次成功的比例达到了64.34%,说明之前成功营销对此次能够顺利推销产品有重要影响。
六、结论及建议
结合以上分析,可以得出以下几点结论,对商业银行提出相应建议:
(一)建立激励客户忠诚和约束客户流失的机制
之前的成功营销会对今后银行营销的成功起到显著的促进作用,因此,银行应采取措施提高客户忠诚度。
所谓客户忠诚,是指客户一再重复购买,而不是偶尔重复购买同一服务的行为。
忠诚的客户是银行最基本的、可以信赖客户。
这些客户可能因为对银行的信任、偏爱而购买银行的服务,在需要时会增加购买量,因此,这些客户会为银行带来更大的利润。
银行应防止忠诚的客户流失。
具体的措施包括:
第一,加强银行内部管理,为维护客户关系提供坚实保障。
寻找更优秀的员工作为客户经理,加强对员工的培训,建立有效的激励制度激发员工的工作热情。
第二,提高服务的独特性和不可替代性。
让客户意识到其享受的服务是独一无二的,量身定做的,有效降低竞争对手对客户的诱惑,增加客户对银行的依赖性。
第三,以银行自身的忠诚交换客户的忠诚。
忠诚是银行与客户双向的、互动的。
银行应当处于困境中的客户雪中送炭,培养未来可能的忠诚客户。
(二)建立客户分类信息系统
不同职业、婚姻状况、受教育情况、资金状况的客户对电话营销的成功率都有一定的影响,银行可以建立相关的数据库,将银行客户的数据进行分类管理,这样在进行电话营销时会更有针对性,提高营销的成功率。
(三)注意电话营销的技巧
虽然目前电话营销的应用在银行业、保险业比较普遍,但居民对电话营销的反感心理仍比较重,这极大的降低了电话营销的成功率。
从上述分析可知,通话持续时间、联系的方式、日期都对结果有一定的影响,可见,电话营销的技巧是十分重要的。
为避免接听电话者迅速挂断电话,需要销售员有较高的沟通能力与技巧。
同时应注意控制通话时间,过长的通话会让接听者感觉厌烦,时间过短则无法起到推销产品的作用。
参考文献:
[1]康立民.大数据时代电话销售在个人客户分层营销方面的探索[J].金融管理与研究,2013(第8期).
[2]高心共,雷美茂.论电话营销在我国的应用[J].福建商业高等专科学校学报,1999(第8期).
[3]安贺新,苏朝晖.商业银行客户关系管理[M].清华大学出版社,2013.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 统计 软件 论文 数据 分析 银行 电话 营销 成功率 探究 docx