移动通信中商业数据挖掘.docx
- 文档编号:26956728
- 上传时间:2023-06-24
- 格式:DOCX
- 页数:7
- 大小:79.13KB
移动通信中商业数据挖掘.docx
《移动通信中商业数据挖掘.docx》由会员分享,可在线阅读,更多相关《移动通信中商业数据挖掘.docx(7页珍藏版)》请在冰豆网上搜索。
移动通信中商业数据挖掘
移动通信中商业数据挖掘
在移动通信中的商业数据挖掘
摘要
本文简单介绍了何为数据挖掘技术,数据挖掘所需要的条件、数据仓库的建立,以及为什么要应用在移动通信中和在移动通信中经常用的两种算法-关联规则挖掘和K最近邻算法,并且较为详尽地阐述了它们的工作原理。
目前移动通信运营商大都具有客户服务呼叫中心、业务受理网站、业务运营系统等。
分散的各个信息系统都各自比较完整地管理者客户某一部分的信息,海量的客户数据、账务数据、市场营销数据以不同的数据结构和访问方式分散地存放在物理上或者逻辑上隔离的数据库中,形成数个彼此独立缺乏联系的信息数据库,这些数据库中有大量冗余和不一致存在,对于数据挖掘过程中数据必须具有单一试图的要求不能满足。
关键词:
数据挖掘移动关联规则挖掘K最近邻算
主要观点
1.数据挖掘技术将是一种运营商作为优化移动互联网服务的管道,能够对管道数据分
析,把握客户的使用趋势,习惯和规律的,让管道“人性化”,让服务“利润化解决方案。
2.移动中的数据挖掘是它把人们对数据的应用从低层次的简单查询,提升到从数据中
挖掘知识,提供联规则挖掘和K最近邻算法。
3.移动通信数据挖掘数据挖掘技术,挖掘出移动商务潜在和当前高价值客户所具有的特征
从而为企业进一步开展客户营销更好的抓住目标客户节约广告成本提供一种便于操作可行方法
1绪论
随着移动互联网的高速发展手机购物逐渐受到市场中多方的关注。
业界也普遍预测在2012年随着智能手机的市场化普及速度和深度的加快随性随地以及时间碎片化为主要特征的新电商环境将加速电商推陈出新,我国手机用户达到7.38亿,全球手机用户数量超过50亿。
伴随着手机用户数量的快速增加和移动通信技术的技术革新,从3G到4G的进步,移动通信市场竞争惨烈。
数据挖掘技术将是一种解决方案。
运营商作为提供移动互联网服务的管道,只有能够对管道数据进行分析,把握客户的使用趋势,习惯和规律,才能让管道更“智能化”,让管道“人性化”,让服务“利润化[1]。
1.1当前运营商挖掘移动数据方式
客户价值挖掘能够对客户的使用行为,发展趋势等信息进行有效分析利用,用来指导运营商的价值拓展。
首先运营商要对客户服务进行针对性的资源和服务倾斜。
据权威统计,移动互联网客户较全网客户个人价值要高出全网客户25%以上;而且这个趋势有更进一步扩展之势,其中新客户和发烧友客户具有较大弹性空间。
新客户作为业务拓展使用的潜力人群,发展势头强劲;发烧友客户具备强大的“品牌意志力”能够更多的推广运营商的业务体验,从而带来更好的业务“利润”增值。
再者,运营商针对性的分级进行服务支撑,目前新浪微博,facebook社区等的广泛使用已经成为用户进行互联网交流的重点平台。
因此可以加强对这些业务的监控分析,并将这些业务优先迁入IDC,提供给客户更快捷的入口以及更优质的网络服务,以降低公司与其他运营结算成本的同时提升客户满意度。
然后,对客户的集中使用业务时间和客户业务等级进行有效的推广服务,采用多元化营销提升针对性的业务群体扩充。
比如在用户集中上网的时间段晚上21点之后,采用多维度营销,增大营销成本和业务体验机会;对于每周手机上网20次以上的客户进行重点业务推荐。
未来更精准的分析用户行为的软件能够更准确的提供更多的应用服务,增大使用的命中率。
类似于推荐类业务分成将成为未来的主流盈利途径之一。
最后,运营商还需要在一些细节方面入手,在研究用户的使用行为的同时对于关注度急剧上升的业务进行重点“掘金”,加大对于新兴业务的投入,以求在每轮业务高峰到来前进行优势布局,提升品牌忠诚度和战略价值。
例如,可以在MM平台增加相关热门书籍和热门连续剧片段的下载,把这些热门剧集带来更多的客户价值提升到运营商品牌战略中。
[2]
2.1移动通信的数据挖掘条件
目前移动通信运营商大都具有客户服务呼叫中心、业务受理网站、业务运营系统等。
分散的各个信息系统都各自比较完整地管理者客户某一部分的信息,海量的客户数据、账务数据、市场营销数据以不同的数据结构和访问方式分散地存放在物理上或者逻辑上隔离的数据库中,形成数个彼此独立缺乏联系的信息数据库,这些数据库中有大量冗余和不一致存在,对于数据挖掘过程中数据必须具有单一试图的要求不能满足。
从图1可以比较形象地看出分散的数据库的弊端。
图1
这些系统都是事物型的联机处理系统,实时处理在线事物,即处于不断的变化当中。
不能形成一个稳定的分析环境。
之所以要这样,是因为数据挖掘需要在数据仓库的基础上进行大数量级的频繁操作,具体包括查询、分析、取样等等。
这样把之前各个独立的数据库系统联合在一块便形成了可供数据挖掘用的数据仓库[3]。
数据仓库有很多新的特征,一般来说,数据仓库是面向特定主题的,有特定的挖掘目标,在一定的时期之内要保持相对稳定。
数据仓库的数据来源于各个联机事务处理系统,这些系统以固定格式把原系统中的信息提交给数据仓库,具体包括客户基本资料,客户消费记录,客户呼叫对象记录等信息。
数据仓库在接受到这些信息之后,按照特定组织规则进行分类、存储,然后进行特定目的的分析和数据挖掘。
数据仓库和传统的联机处理系统关系如图2所示。
图2
3.1数据挖掘算法在移动通信中的实际应用
在移动通信行业的数据仓库中,运用较多的数据挖掘算法是关联规则挖掘和邻近算法(k最近邻算法)。
3.1.1关联规则挖掘
关联规则挖掘是数据挖掘领域研究的一个重要课题。
Agrawal1994等人首先提
了从顾客交易数据库中发现用户购买模式的相关性问题并提出了挖掘频繁项目集的Apriori算法。
关联规则挖掘是帮助发现大量数据库中项集之间的关联关系。
关联规则的定义是设I={1i,2i,…,mi}为所有项目的集合D为事务数据库事务,T是一个项目子集(TI)。
每一个事务具有唯一的事务标识Tid。
设A是一个由项目构成的集合称为项集。
事务T包含项集A当且仅当AT即给定一个事务集。
挖掘关联规则就是在这个事务集中产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则其中较著名是Apriori算法。
Apriori算法是使用层次顺序搜索的循环方法产生频繁项集即用频繁k-项集探索产生(k+1)-项集。
首先找出长度为1的频繁项集记为1L,1L用于产生频繁2-项集2L的集合而用于产生频繁3-项集3L的如此循环下去直到不能找到新的频繁k-项集找每个KL需要扫描数据库一次。
关联规则数据挖掘算法分两个步骤首先根据最小支持度阈值找出数据集D中所有频繁项目集其次根据频繁项目集和最小置信度阈值产生所有关联规则。
[4]
3.1.2邻近算法
图3
图3中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色正方形?
如果在K=3的时候,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果在K=5的时候决定,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。
K最邻近(k-nearestneighbor,KNN)分类算法,是一个理论上研究比较多的方法,也是比较简单比较容易实现的机器学习方法之一。
K最近邻方法的原理是:
决定一个新样本属于哪个类别,主要是根据新样本选定范围内哪种类别的对象最多决定的。
K最邻近算法中,被选择的类比对象都是已经正确分类的对象。
KNN算法判别新样本的类别归属,只是根据最近的样本数目来判别,并不太依赖极限定理。
对于在特定范围内存在较多交叉或者重复度很高的样本空间来说,KNN是比较理想的算法。
[5]
KNN算法除了可以用于分类,另外还可以用于回归。
通过计算一个样本周围的k个最近邻居,将这些邻居各个属性的平均值赋给该样本,就可以得到该样本的属性。
更加精确的方法是将不同距离的邻居对该样本产生的影响给予不同的权值(weight),如权值与距离成反比
KNN算法在分类时有个主要的不足:
当样本的比例不平衡时,如一个类的样本容量比其他类样本容量大很多的时候,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。
因此可以采用增加权值的方法(和该样本距离小的邻居权值大)来修正。
该方法另外一个缺点是计算时间较长,因为对于存在大量类别点的样本来说,需要及时所有点到每一个样本的距离,时间复杂度为n*m。
对于样本空间很大的数据仓库来说,在计算之前要进行剪辑,剔除无用点,减少计算量。
这种方法比较适用于大数量的样本空间,对于数目较少的样本空间可能导致较大误差。
采用KNN算法时比较容易把新的客户经行分类,参照分类结果的类别特征,为新客户提供符合其自身特点的个性化服务。
4.结论
海量数据中,其实存在着很多特点的联系模式,在竞争激烈的移动通信市场,哪家公司能够更早,更精确地发现其中的秘密,就能在竞争中取得优势。
中国已经成为当今世界上最大的移动商务市场拥有移动商务最广泛的客户资源具有强大的移动商务运用与增值的空间。
2010年各商家开始重视移动商务的客户人群如iPhoneAppStore模式的成功正是强调了“以客户为中心”、“为客户提供一站式服务”的成功。
本文主要通过数据挖掘技术挖掘出移动商务潜在和当前高价值客户所具有的特征从而为企业进一步开展客户营销更好的抓住目标客户节约广告成本提供一种便于操作可行的方法。
[6]
参考文献
[1]刘荣,陈晓红.基于数据挖掘的移动通信客户消费行为分析[M].北京:
计算机应用与软件,2006.2.
[2]周戈.移动通信数据业务容量的规划方法分析.深圳,中国联通深圳分公司,2007.3
[3]周颖.基于数据挖掘技术的移动通信行业客户细分.上海上海交大学报,2007.3
[4]贺海涛,.精准营销挖掘移动通信市场,经济师报2007.10
[5]何玉莹.电信运营商移动互联网运营策略浅析.广西:
广西大学2010.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 移动 通信 商业 数据 挖掘