关于航空客运的信息挖掘.docx
- 文档编号:42942
- 上传时间:2022-10-01
- 格式:DOCX
- 页数:12
- 大小:635.58KB
关于航空客运的信息挖掘.docx
《关于航空客运的信息挖掘.docx》由会员分享,可在线阅读,更多相关《关于航空客运的信息挖掘.docx(12页珍藏版)》请在冰豆网上搜索。
关于航空客运的信息挖掘
摘要
为了提高航空的上座率,对样本数据进行挖掘进行客户流失预测、客户细分及客户价值评估。
基于logistic回归分析建立客户流失预测模型,得出每个客户的流失倾向概率。
定义一阈值为0.5,若流失倾向概率大于0.5,则该客户的预测状态为流失;反之,则非流失。
建立RFM模型将客户划分为重要保持客户、重要发展客户、重要挽留客户、忠诚型一般客户、低价值客户五个类别。
最后,综合分析客户的类型和流失状态,分析不同客户的特征,得到以下结果:
不同类别客户的指标平均值都不相近,易识别;单从各个类别客户来讲,各指标情况在流失客户与非流失客户中有一定的差异。
针对不同的客户,可以采取不同的营销活动来提高上座率:
针对重要保持客户,进行客户保持。
针对重要发展客户,进行客户发展。
针对重要挽留客户,进行流失预警。
针对忠诚型一般客户,进行交叉销售。
关键词:
客户流失预测客户细分客户价值评估 logistic回归分析 RFM模
型
目录
关于航空客运的信息挖掘 1
摘要 1
1.挖掘目标 3
2.分析方法与过程 4
2.1.客户流失模型 4
2.1.1.数据样本 4
2.1.2.Logistic回归分析 4
2.1.3.结果分析 5
2.2.客户细分及客户价值评估 8
2.2.1.航空公司客户细分参数的确定 8
2.2.2.航空公司客户细分的具体步骤 8
2.2.3.结果分析 9
3.结论 10
4.参考文献 12
1.挖掘目标
市场竞争异常激烈的今天,如何识别有价值的客户是企业营销策略的一个非常重要的环节。
我们希望通过从大量的旅客乘机记录中对航空公司的客户进行行为分析,采用数据挖掘技术,达到以下目标:
对客户进行流失倾向评分,预测流失情况;进行客户细分,将客户划分为五类;客户价值评估,挖掘出有价值的客户综合分析客户流失与客户细分结果,提出有效方案以进行更精确地营销,从而实现提升航空客运的上座率目标。
2.分析方法与过程
2.1.客户流失模型
客户流失是指客户因某种原因而离开为其服务公司的一种常见行为。
由于各种因素的不确定性和市场不断的增长以及一些竞争对手的存在,很多客户不断地从一个公司转向另一个公司,其目的是为了求得更低的价格和更好的服务。
一般来说,流失客户可分为自愿流失和非自愿流失,而航空公司的流失客户基本上是属于自愿流失的。
客户流失预测主要是对客户现所处状态的一种预测,通过模型计算出客户流失倾向概率,给定一阈值与概率进行比较。
当流失倾向概率大于阈值时,则将该客户预测为流失;若流失倾向概率小于或等于阈值时,则预测结果为非流失。
在本题中,我们定义流失客户为:
最后一次乘机时间至观察窗口末端时长>=观察窗口内最大乘机间隔。
并以1标记流失客户,0标记为非流失客户。
总共可得到非流失客户数为38519,流失客户为24468。
2.1.1.数据样本
同时尽可能收集能影响客户流失的各种因素,包括:
入会时间,第一次飞行时间性别、会员卡级别、年龄、飞行次数、基本积分、总加权飞行公里数、平均乘机时间间隔、其他积分、非乘机的积分变动次数等等。
为了能更好的分析数据随季度的变化情况,我们引入了趋势值和变动值:
趋势值:
表示8个季度内属性增大或减小的速度与方向,以一元线性回归的斜率表示。
斜率大于0,表示增大,斜率越大,增加速度越大;斜率小于0,表示减小,且斜率越小,减小的速度越大。
波动值:
表示8个季度内属性的变化幅度,以样本的方差表示。
方差越大,表示数据变化幅度越大越不稳定;方差越小,表示数据变化幅度越小越稳定。
对于数据缺失的情况,SPSS中带有处理缺失值的方法:
剔除法当缺失值非常少的时候,可对缺失的数据进行删除或报告。
替代法SPSS中可以选择以变量均值、临近点的均值、临近点的中位值、线性内插发或线性趋势法来替换缺失的数据。
2.1.2.Logistic回归分析
客户流失状态只有两种情况,即流失与非流失,这两种状态分别用1和0
表示。
因此我们可以采用多因素非条件 logistic回归模型为基本依据,通过
logistic回归建立客户流失概率预测模型进行评价,从而得出每个客户的流失倾向概率。
设客户的流失情况为
即为逻辑回归函数,是典型的增长函数,能很好体现概率P和自变量间的非线性。
得到每个客户的流失倾向概率后,给定阈值0.5,当流失倾向概率大于0.5,则预测结果为流失;若流失倾向概率小于0.5,则预测结果为非流失。
2.1.3.结果分析
借助SPSS软件对数据进行logistic回归分析,筛选出对模型影响较大的指标,经过多次筛选结果显示观测窗口季度平均飞行次数X1、积分兑换次数X2、非乘机的积分变动次数X3、平均乘机时间间隔X4、飞行次数波动值X5、飞行次数趋势值X6、年龄X7对回归模型较为显著影响。
Logistic回归分析结果
为:
表一 Logistic回归分析模型系数综合检验
表二Logistic回归分析模型汇总
表三Logistic回归分析分类表
表四Logistic回归分析方差中的变量
结果显示,模型的卡方值较大,Sig=0.000,说明模型整体是显著的。
而Cox&SnellR方NagelkerkeR方的值在0.5左右,说明模型拟合情况一般。
预测的准确值达87%这情况还是令人满意的。
同时7个指标的sig<0.01,即自变量与
LogitP之间的线性关系是显著的。
ROC曲线下面积为0.919,与机会线下的面积比较具有显著性差异,Sig=0.000<0.01,说明所建立的概率预测模型预测效果显著,能较为准确的预测客户流失的概率。
2.2.客户细分及客户价值评估
客户细分的概念是美国市场学家温德尔.史密斯于20世纪50年代中期提出来的。
所谓客户细分,是以消费者需求为出发点,根据消费者购买行为的差异性,把消费者体划分为类似性购买群体的过程。
分属于同一客户群的消费者具备一定程度的相似性,而不同的细分客户群间存在明显的差异性。
客户细分的目的,就是要更精确地回答谁是我们的客户,客户到底有哪些实际需要企业应该去吸引哪些客户,应该重点保持哪些客户,应该如何迎合重点客户的需求等重要问题,进而使客户关系管理真正成为业务获得成功、扩大产品销量的助推器。
客户细分是客户关系管理的基础,也是核心。
根据帕累托定律(2/8定律):
20%的顾客给企业带来80%的销售利润。
企业投入大量资源来争取客户的目标应该定位于能为企业带来大量利润的那小部分客户群体,让他们长期成为自己的关系客户,而由此可以节省争取其他客户的成本。
航空公司的各种资源是有限的,面对数量众多的常旅客,如何对这些客户进行细分,更有效地判断有价值客户,了解他们的特征和实际需求,对不同价值的客户采取不同的营销策略,将有限的资源投放到最有价值的客户身上,实现精准化营销,提高企业的竞争力,最终实现提升航空客运的上座率目标。
2.2.1.航空公司客户细分参数的确定
基于许多数据库营销的经验,营销专家鲍比斯通(BobStone)提出了RFM细分,通过三项变量,即最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)来细分客户,用于识别最有价值的客户。
RFM指标高的客户可能更愿意并更有兴趣与企业进行交易,因此具备更高的客户价值。
RFM指标较差的客户代表了较少的业务机会,表明该客户价值较低。
因此,RFM模型可以帮助企业决定向谁促销,采用最优化的营销手段来获取和保留最有价值的客户,避免投资到效果很差的客户身上,吸引高价值客户,并以此来增进客户忠诚。
研究证明,基于权重的RFM方法是一种有效的客户细分方法。
我们根据航空公司独有的特点,对传统的RFM指标做了适当的调整,确定了L、R、F、
M、C五个指标作为航空公司客户细分的参数。
L代表客户关系长度(从入会之日算起),R代表客户最近一次消费距今时间长度,F代表客户在一定时间内的消费频率,M代表客户在一定时间内的升级里程(“升级里程”是指航空公司会员通过乘坐本公司及航空合作伙伴的有效航班所累积的基本飞行里程),C代表客户在一定时间内所乘航班的平均舱位折扣系数(即会员在一定时间内乘坐舱位对应折扣系数平均值)。
2.2.2.航空公司客户细分的具体步骤
1主要分析方法
(1)对于五个指标的重要程度不同,在查阅资料后,我们给定L、R、F、M、
C的相对
重要性(即权重)如下:
L=0.1,R=0.1,F=0.2,M=0.2,C=0.4
(2)快速聚类法。
快速聚类法计算量非常小,从而可以有效地处理多变量
大样本数据
而不占用太多的内存空间和计算时间。
2基本步骤
(1)将LRFMC各指标标准化(反向指标R要与正向指标区别处理)并加权;
(2)确定聚类的类别数量为5,应用快速聚类法对加权后的指标进行聚类;
(3)将每类客户的LRFMC平均值和总LRFMC平均值作比较,通过对比得到每类客户LRFMC的变动情况。
分析每类客户的特点,在此基础上定义客户类型;可将航空公司的客户群体划分成重要保持客户重要发展客户、重要挽留客户、忠诚型一般客户、低价值客户等五个级别。
针对不同等级的客户,航空公司可以采取不同的管理策略。
(5)客户价值比较分析。
客户分类后,并不知道每一类客户的价值差别有多大,相对企业的重要性怎样。
根据比较每类中心各指标的平均值加权得分的大小来对各类客户进行排序,客户价值排名靠前的客户相对排名靠后的客户对于企业来说更为重要。
2.2.3.结果分析
根据上述步骤,在SPSS软件中进行操作。
结果显示,经过100次迭代后,聚类中心内没有改动或改动较小而达到收敛。
聚类情况如下图所示。
3.结论
本文通过对航空公司的会员数据进行客户流失模型、客户细分和客户价值评估分析,将由客户流失预测模型得出的客户流失状态和RFM模型得出的客户类别进行综合分析。
对于航空公司在提高上座率这方面来说,更需要的是应针对各类客户不同情况能够采取恰当行动的完整方案,而非仅仅一个名单。
分别统计五类客户的不同流失状态下会员卡级别、年龄、观测窗口最大乘机间隔、总累计积分、观测窗口总加权飞行公里数的情况:
从中我们可以得知:
不同类别客户的指标平均值都不相近,易识别。
单从各个类别客户来讲,年龄、观察窗口内最大乘机间隔、总累计积分、观测窗总加权飞行公里数在流失客户与非流失客户中有一定的差异,这样说明了我们的型的准确性、有效性。
①发现机会:
前文已经建立客户流失预测模型,然后对在网客户进行流失倾向的评分,按倾向高低判别。
并对全体客户的分群来识别出真正的挽留机会,并非流失倾向越高就越值得挽留。
比如可以按照客户价值进行分群,优先考虑对中高价值客户的挽留;同时根据客行为分群,判别出哪些客户可能已经用了竞争对手的服务,或者属于欺诈类型的客户,对这批客户的挽留可能是没有成效的,不应视为挽留机会。
②制订策略:
经过第一个步骤,我们可以从预测名单中圈定了值得挽留的客户。
但是一般来说,这批客户依然数目较大,难以逐
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 航空 客运 信息 挖掘