数据挖掘应用于微博营销论文.docx
- 文档编号:8811512
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:28
- 大小:411.45KB
数据挖掘应用于微博营销论文.docx
《数据挖掘应用于微博营销论文.docx》由会员分享,可在线阅读,更多相关《数据挖掘应用于微博营销论文.docx(28页珍藏版)》请在冰豆网上搜索。
数据挖掘应用于微博营销论文
2013年6月20日
学院计算机科学与技术学院
专业网络工程
学生姓名XX
学号XXXXXX
指导教师姓名XXXXX
-----特征行为分析模块
数据挖掘在微博营销的应用
淮北师范大学
数据挖掘关于微博营销的应用
-----特征行为分析模块
摘要:
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。
该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。
程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。
同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。
经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。
通过对微博用户的信息和关系数据进行决策树分析、相关性分析和关联规则来挖掘用户特征,并对微博网络进行核心用户发掘。
结果表明:
微博中的名人具有关注数小,被关注数大的特征;用户趋向于通过关注他人和积极发布微博文章两种方法来提高被关注度;愿意公布性别或自我描述的用户,通常愿意公布地址和发布博文,而不愿意公布地址、性别或自我描述的用户,通常不愿意公布其他两项;对微博网络进行核心用户挖掘并进行个性化营销是可行的。
目录:
1.引言
微博作为Web2.0时代新生网络应用形式,在最近几年中得到了迅猛的发展。
新浪微博中一条用户状态限定280字符的内容长度,不但更适合现代社会快速生活节奏的需要,而且也更方便用户通过移动通信终端上传和分享自己感兴趣的微博信息。
在美国,微博网站Twitter自2006年创建以来,用户数量在近几年中突飞猛进,其中2009年Twitter的用户增长率达到25.65%,是社交网站Facebook与LinkedIn增长率总和的10倍。
在中国,已有14%的互联网用户开始使用微博,而新浪微博的市场份额占有率接近87%,是中国微博产业的主导力量。
微博是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过网页,WAP以及各种客户端组件登录到个人社区,以140字左右的文字更新信息,并实现即时分享。
微博具有技术门槛低、内容简单、交互性强等特点,虽然这是一个全新的平台,但在我国却呈现出井喷式发展的特点,特别是新浪、腾讯、网易等大型互联网公司的门户型微博,它们的用户数在短时间内就破亿。
所以利用微博用户的基本信息数据和关注数据,通过决策树分析、相关分析、关联规则、社区挖掘等数据挖掘技术对微博的用户特征及核心用户进行分析,以揭示微博用户的特征及进行个性化营销的可行性。
2.数据挖掘的概述
2.1数据挖掘的概念
随着信息技术的迅速发展,数据库的规模不断扩大,从而产生了大量的数据。
为了给决策者提供一个统一的全局视角,在许多领域建立了数据仓库,但大量的数据往往使人们无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些信息的需求。
因此,需要一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘(Data Mining)技术由此应运而生,数据挖掘技术也正是伴随着数据仓库技术的发展而逐步完善起来的。
但是并非所有的信息发现任务都被视为数据挖掘,例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。
数据挖掘是一个以数据库、人工智能、数理统计、可视化四大支柱技术为基础,我们知道,描述或说明一个算法设计分为三个部分:
输入、输出和处理过程。
数据挖掘算法的输入是数据库,算法的输出。
是要发现的知识或模式,算法的处理过程则设计具体的搜索方法。
从算法的输入、输出和处理过程三个角度分,可以确定数据挖掘主要涉及三个方面:
挖掘对象、挖掘任务、挖掘方法。
挖掘对象包括若干种数据库或数据源,例如关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据库、多媒体数据库、历史数据库,以及万维网(WEB)等。
挖掘方法可以粗分为:
统计方法、机器学习方法、神经网络方法和数据库方法。
统计方法可细分为:
回归分析、判别分析等。
机器学习可细分为:
遗传算法等。
神经网络方法可细分为:
前向神经网络、自组织神经网络等。
数据库方法主要是多维数据分析方法等。
数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:
规则、概念、规律及模式等。
它可帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。
数据挖掘的过程也叫知识发现(KDD Knowledge Discovery in Database)的过程,它是一,它是一门涉及面很广的交叉性新兴学科,涉及到数据库、人工智能、数理统计、可视化、并行计算等领域。
数据挖掘是一种新的信息处理技术,其主要特点是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,并从中提取辅助决策的关键性数据。
数据挖掘是知识发现(KDD)过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns),它并不是用规范的数据库查询语言(如SQL)进行查询,而是对查询的内容进行模式的总结和内在规律的搜索。
传统的查询和报表处理只是得到事件发生的结果,并没有深入研究发生的原因,而数据挖掘则主要了解发生的原因,并且以一定的置信度对未来进行预测,用来为决策行为提供有利的支持。
2.2数据挖掘的常用技术
机器学习、数理统计等方法是数据挖掘进行知识学习的重要方法。
数据挖掘算法的好坏将直接影响到所发现知识的好坏,目前对数据挖掘的研究也主要集中在算法及其应用方面。
统计方法应用于数据挖掘主要是进行数据评估;机器学习是人工智能的另一个分支,也称为归纳推理,它通过学习训练数据集,发现模型的参数,并找出数据中隐含的规则。
其中关联分析法、人工神经元网络、决策树和遗传算法在数据挖掘中的应用很广泛。
(一)关联分析法。
从关系数据库中提取关联规则是几种主要的数据挖掘方法之一。
挖掘关联是通过搜索系统中的所有事物,并从中找到出现条件概率较高的模式。
关联实际上就是数据对象之间相关性的确定,用关联找出所有能将一组数据项和另一组数据项相联系的规则,这种规则的建立并不是确定的关系,而是一个具有一定置信度的可能值,即事件发生的概率。
关联分析法直观、易理解,但对于关联度不高或相关性复杂的情况不太有效。
(二)人工神经元网络(ANN),是数据挖掘中应用最广泛的技术。
神经网络的数据挖掘方法是通过模仿人的神经系统来反复训练学习数据集,从待分析的数据集中发现用于预测和分类的模式。
神经元网络对于复杂情况仍能得到精确的预测结果,而且可以处理类别和连续变量,但神经元网络不适合处理高维变量,其最大的缺点是不透明性,因为其无法解释结果是如何产生的,及其在推理过程中所用的规则。
神经元网络适合于结果比可理解性更重要的分类和预测的复杂情况,可用于聚类、分类和序列模式。
(三)决策树(DT)是一种树型结构的预测模型,其中树的非终端节点表示属性,叶节点表示所属的不同类别。
根据训练数据集中数据的不同取值建立树的分支,形成决策树。
与神经元网络最大的不同在于其决策制定的过程是可见的,可以解释结果是如何产生的。
决策树一般产生直观、易理解的规则,而且分类不需太多计算时间,适于对记录分类或结果的预测,尤其适用于当目标是生成易理解、可翻译成SQL或自然语言的规则时。
决策树也可用于聚类、分类及序列模式,其应用的典型例子是CART(回归决策树)方法。
(四)遗传算法(GA)是一种基于生物进化理论的优化技术。
其基本观点是“适者生存”原理,用于数据挖掘中则常把任务表示为一种搜索问题,利用遗传算法强大的搜索能力找到最优解。
实际上遗传算法是模仿生物进化的过程,反复进行选择、交叉和突变等遗传操作,直至满足最优解。
遗传算法可处理许多数据类型,同时可并行处理各种数据,常用于优化神经元网络,解决其他技术难以解决的问题,但需要的参数太多,对许多问题编码困难,一般计算量大。
(五) 聚集发现 聚集是把整个数据库分成不同的群组。
它的目的是要群与群之间差别很明显,而同一个群之间的数据尽量相似。
此外聚类分析可以作为其它算法(如特征和分类等)的预处理步骤,这些算法再在生成的簇上进行处理。
与分类不同,在开始聚集之前你不知道要把数据分成几组,也不知道怎么分(依照哪几个变量)。
因此在聚集之后要有一个对业务很熟悉的人来解释这样分群的意义。
很多情况下一次聚集你得到的分群对你的业务来说可能并不好,这时你需要删除或增加变量以影响分群的方式,经过几次反复之后才能最终得到一个理想的结果。
聚类方法主要有两类,包括统计方法和神经网络方法。
自组织神经网络方法和K-均值是比较常用的聚集算法。
(六)关联分析和序列模式分析 关联分析,即利用关联规则进行数据挖掘,关联分析的目的是挖掘隐藏在数据间的相互关系。
序列模式分析和关联分析相似,但侧重点在于分析数据间的前后序列关系。
序列模式分析描述的问题是:
在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个交易序列数据库上,返回该数据库中出现的高频序列。
在进行序列模式分析时,同样也需要由用户输入最小置信度C和最小支持度S。
此外还有统计分析和可视化技术等,在此不再赘述。
三、结束语
网络的发展为用户提供了多种新的信息服务,因特网以其丰富的内容、强大的功能以及简单的操作,在各种信息服务方式中脱颖而出,成为未来信息服务的主要方向。
但当前因特网信息服务中更多的是单向、被动的服务模式,而网上用户信息需求的挖掘,可以改进因特网与用户的交互,使因特网与用户真正融为一体,不再是操作与被操作的关系。
数据挖掘技术的应用,使因特网能根据用户的需求采取更主动、更有针对性的服务,并且可以建立一种个性化的信息服务系统,针对不同用户的信息需求,提供不同的信息服务。
而个性化服务系统的建立,则依赖于用户信息需求的挖掘。
数据挖掘技术及其应用是目前国际上的一个研究热点,并在许多行业中得到了很好的应用,尤其是在市场营销中获得了成功,初步体现了其优越性和发展潜力。
在信息管理领域,综合应用数据挖掘技术和人工智能技术,获取用户知识、文献知识等各类知识,将是实现知识检索和知识管理发展的必经之路。
2.3数据挖掘应用的交易的运营模式
新浪微博需要对照数据情况进行全面的数据挖掘,这将非常有利于新浪产品的改进和运营策略的提出。
2009年8月,新浪网加入微博领域,借助网站平台及名人资源优势启动内测,引来众多网民关注与参与。
2010年8月正是新浪微博“出生”一周年,至此新浪微博已有213种应用推出,据“新浪小秘书”微博透露,新浪微博目前拥有近百万个新浪认证的“V”帐号,每天发布近千万条微博,日均独立IP达到
24,180,000,日均PV达到199,485,000。
由数据看来,新浪微博的影响力已呈爆发式增长。
?
?
2010年9月9日,新浪发布了国内首份《中国微博元年市场白皮书》。
白皮书披露,今年底,中国互联网微博累计活跃注册账户数将突破6500万个,2011年中将突破1亿,2013年国内微博市场将进入成熟期。
并且,随着用户数的不断增长,新浪微博每天都会产生海量信息。
7月,新浪微博产生的总微博数超过9000万,每天产生的微博超过300万。
每逢社会重大事件,新浪微博的发送量都会在短期内迅速增加,而且会持续相当一段时间。
以南非世界杯为例,在7月12日世界杯决赛上演的当天,新浪微博上的原创微博数高达1904369条。
此后,许多名人针对世界杯的评论被广泛转发;7月28日,新浪微博上的转帖微博数达到199964条,当天总共产生的微博数随之增长到3619603条。
在庞大的用户数量和活跃度的基础上,新浪微博正在积极摸索各种可行的营销途径,包括与APP开发商合作开发软件,与电子商务公司寻找结合点等。
2010年4月,新浪微博对平台网站进行了功能升级,新版本可以支持一个开发者申请多个不同的app?
key(开放平台入口口令)应用,同时app?
key申请者提交后立即可以使用。
也是在4月,新浪微博与开心网正式绑定,分享优秀内容。
?
?
在企业用户方面,目前有2500家企业获得新浪认证,覆盖了汽车、餐饮休闲、影视娱乐、购物商城等30多个行业,包括伊利、中粮、招商银行等在内的大型企业都在尝试最新的营销方式――微博营销,均取得了不错的效果。
人、关系和内容三样东西有机组合,组成了微博。
如果能够将微博的构成元素与电子商务进行结合,其开发空间很大。
截至目前为止,新浪微博已经拥有诸多应用软件合作伙伴,这些应用工具为微博用户提供了娱乐、知识和生活密切相关的工具,增强了用户黏性。
“虽然这些应用目前还没开始收费,但未来潜力巨大。
”新浪微博相关负责人表示,在时机成熟时,新浪也可以与应用软件开发者合作分成广告、收入等。
未来,随着新浪微博用户规模的增多以及功能的不断完善,通过新浪微博进行营销将成为企业营销的一种常态。
从内测之日起,微博项目组的成员都被指派了一个任务——病毒式传播。
项目组中的每个人都需要邀请至少20人注册(合格标准为更换头像,并每日发帖7篇以上),以快速提升产品的人气。
?
泛名人微博,垂直细分微博?
(生活、行业),插件服务、客户端,以及外部合作(媒体节目、展会、论坛合作。
而目前阶段的工作中心将放在“两个目标”和“三个动作”上。
两个目标即泛名人、粉丝;三个动作即找到、吸引、留住。
该份计划还详细阐述了具体的执行策略,比如搜索粉丝网络聚集地,制作名人马甲,仿照新浪博客设计虚拟名人等策略。
“管理”一直是其工作的一部分——比如删掉一些违法的帖子或者是过于低俗的帖子。
3.社交网络与商业应用
3.1社交网络应用的迅猛发展
3.2微博营销与数据挖掘关系
微博中数据挖掘的根本目的并不是为了要获得这些显而易见的刚性数据,而是为了对这些数据进行精炼,从中发现对企业对营销有价值的关联。
微博自身的运行机制,决定了如果要依靠技术手段实施微博营销,数据挖掘就是一个无法绕开的必然选择。
微博中最具营销价值的除了人本身外(针对人的营销不能完全依靠技术,人与人的对话才是最重要的),就是大量的、快速变化的数据。
相对于其他的营销平台,为博营销更需要从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息,甚至是微博用户的心理特征。
微博数据挖掘是为了能有效的采集、处理、展示微博大容量信息。
其中当然包括用户id、姓名、省份、城市、注册时间、微博发布时间、性别、是否是认证用户、好友数、粉丝数、发表的微博条数、发表的微博等。
但这些绝不是全部,甚至可能是微博海量信息内容中价值最低的那部分,所有这些刚性数据,通过微博平台开发的用户接口很容易获取。
但是微博中数据挖掘的根本目的并不是为了要获得这些显而易见的刚性数据,而是为了对这些数据进行精炼,从中发现对企业对营销有价值的关联。
一、数据过滤,微博中存在海量的内容,即便是筛选出可能与企业相关的内容,可能仍然是巨量的数据,一个企业难以消化。
同时微博因为内容的随性和简短,也附加了大量的符号和网络语言,这些为分词带来麻烦。
如果通过从海量微博内容中筛选与企业相关的信息这种方式,很难做到足够的精确。
反过来可以设定与企业自身相关的分词去寻找微博对应的内容,同时辅以特定用户筛选,很容易找到微博中产生的与企业异常相关的内容,并加以跟踪。
从企业自身出发,去微博寻找配对内容和用户的方式能有效解决海量内容难以消化的问题。
二、微博中的内容太过随性,便捷的发布、交互方式带来的一大问题就是信息质量泥沙俱下,信息真假难以识别。
微博用户发布信息并不单纯,所发的信息也并非都是自身本意。
微博的社交关系很容易卷入用户,让用户被动的发布某些正在被传播的信息,以期让自己也成为某个群体内的一份子。
不少微博用户转发某个内容并不是赞同或反对,甚至并不是发自内心的愿意去转发,仅仅是为了表达我是一份子、或者我认可发布者、或者重在参和。
在这种情况下信息与用户实际上是割离的,只有历史跟踪历史数据才能判断是否是用户的真实意愿,对非原创微博大多要经过这种判断。
三、随着微博向社交网络演进,微博平台内的信息形式会越来越不一致,现在绝大多数是以文本的方式呈现,未来会有大量的普通用户会被分流到一个个具体的应用。
虽然应用的底层和数据接口大都是一样的,但每个应用本身的呈现方式和信息、用户在其中的流转方式都不一致,很难实现统一处理。
除了数据挖掘算法本身的改进,与微博平台底层更为紧密的捆绑才能在数据获取上有更多的优势。
4.商业智能系统在电子商务中的应用分析
1研究设计
1.1样本来源
利用网络爬虫通过站点开放的API可直接获取到站点
服务器上的数据。
通过网络爬虫从网易微博上获取到微博
用户的一手资料,包括用户的基本信息,如昵称、性别、
地址、描述、被关注数、关注数以及微文数等属性,还有
用户的关系信息,如用户的关系模式以及关系端等,并以
这些数据作为用户特征分析以及核心用户挖掘的基础。
1.2研究方法和思路
1.2.1名人挖掘微博的同质化问题突出,竞争重点并
不在产品的功能上,而在于拥有名人的数量,所以有必要
对微博中的名人进行分析,发现微博中名人的特征,以便
微博企业对他们进行个性化服务。
利用C5.0算法,根据
用户的名人标识以及其他用户信息,分析名人的用户特
征。
C5.0算法是决策树模型的经典算法之一,它的基本
思想是利用信息论原理对大量样本的属性进行分析和归纳
而产生树的结构或规则,其目的是使系统的熵最小,以提
高算法的运算速度和精确度。
主要包括两个阶段:
①拆分
阶段。
根据能够带来最大信息增益的字段对样本进行拆
分,再根据另一个字段进行拆分,直到样本子集不能拆分
为止。
②修剪阶段重新检验最低层次的拆分,对模型值没
有显著贡献的样本子集进行修剪。
1.2.2普通用户挖掘微博中的普通用户是微博的主流
用户,更是商家进行微博营销的最终目标,有必要了解他
们在期望提高被关注度时的行为趋势,有利于微博企业提
高用户的活跃度。
利用相关性理论,对用户的关注数、微
文数和被关注数3项信息进行分析,根据分析结果,可推
算用户以提高关注数为目标的行为趋势。
相关系数r用来
表示两个变量之间线性关系的程度,主要有Pearson相关
系数、Spearman相关系数和Kendall相关系数3种。
当研
究数据总体分布未知、总体呈现非正态分布以及数据为顺
序级变量时,可应用基于秩次的Spearman相关系数
2实证研究
首先利用网络爬虫通过网易微博的API成功从站点上
爬取了3793条用户信息数据,20498条关系数据,然后
利用这些数据进行用户特征分析以及核心用户挖掘。
2.1名人特征
微博由于内容简单、交互性强,吸引了大量名人入
住,他们依靠自身的影响力无需采取任何行动便能吸引大
量粉丝关注,并通过了身份认证。
在爬取到的3793个用
户中,有84个用户通过名人认证。
利用Clementine软件
的C5.0决策树模型分析发现名人存在一个特征,即关注
数小于500,被关注数大于10000,而微文数却不及被关
注数的千分之一。
这说明微博中的名人通过自身的影响力
便能吸引大量粉丝关注,而无需关注他人或发布微博,这
种现象即为“名人效应”。
值得一提的是,微博中的名人
效应会大大影响一般用户特征的定量分析,所以在后续研
究之前需要剔除名人样本。
2.2普通用户特征
微文数和关注数是衡量用户在微博中活跃程度的重要
因素,而被关注数是衡量用户在微博中影响力的重要因
素,通常是用户最关心的因素。
了解被关注数、微文数和
关注数之间的关系,有助于微博企业了解用户的行为趋
势,以确保用户的活跃程度。
为了消除名人效应的影响,
首先去除具有名人效应的用户以及被关注数、关注数和微
文数其中任何一个为0的用户,然后利用SPSS软件进行
以微文数和关注数作为控制变量的偏相关分析基本不存在关系。
被关注数与微文数的相关系数为0.596,相关概率为
0.000,表现出中度正相关性。
结合表2分析说明,当受
到关注数的影响时,被关注数和关注数之间存在关系。
即
如果用户很少关注别人,那么即使用户发布再多微文,其
他用户也不大会去关注他。
总的来说,用户在以提高被关
注数为目标时,趋向于通过关注他人和积极发布微文两种
方法相结合的方式来进行,而不是采取单一行动。
2.3行为特征
利用Clementine软件的Apriori模型,对用户信息中的
性别、地址、描述、被关注数、关注数以及微文数等属性
进行支持度为50%,置信度为90%的关联规则分析。
分
析结果表明:
①愿意公布性别的用户,有90%以上的可
能性敢于填写地址。
②愿意填写自我描述的用户,有
90%以上的可能性愿意公布自己的地址。
③不愿意公布地
址、性别和自我描述其中一项的用户,有90%以上的可
能性不愿意公布其他两项。
④愿意公布地址、性别和自我
描述其中一项的用户,有90%以上的可能性愿意发布博
文。
⑤不论用户愿不愿意公布地址、性别和自我描述,有
90%以上的可能性都愿意关注他人。
这些行为特征都符合一般用户的心理特点,因为用户
如果对网络环境比较信任,便敢于公布自己性别、地址等
私密信息。
相反,便不愿意公布自己的任何信息。
微博企
业可以根据这些特点对用户进行引导,帮助用户建立信任
感,以提高他们的忠诚度和活跃度。
2.4核心用户挖掘
微博是一个典型的社会网络,并能够根据用户之间关
系的紧密度来构建小社区,从而发现小社区的特性以及其
中的核心用户,以便微博企业为核心用户提供个性化服务
以及差异广告的投递。
考虑到社会网络图显示的清晰度,
本研究从数据库中随机抽取了102个用户及其与之相关的
关系数据作为实验数据,并利用UCINET软件进行社区网
络分析及核心用户挖掘。
2.4.1社会网络整体分析首先将102个用户的关系数
据转换成邻接矩阵。
其中,“行”表示关注者,“列”表
示被关注者。
“1”表示存在“关注”关系,“0”则表示
不存在“关注”关系,然后利用UCINET软件将用户之间
的关系用网络图直观地表现出来,具体情况如图2所示。
该社会网络的网络密度为0.104,聚类系数为0.216,
平均距离为2.328。
网络密度只有0.104,说明网络中各
节点之间存在的连线较少,节点之间的总体联络的紧密程
度较弱;聚类系数只有0.216,平均距离为2.328,小世
界特征不明显,可进一步细分。
从而利用基于Girvanand
Newman’s算法的应用程序对整体网络进行社区挖掘。
2.4.2社区挖掘利用UCINET软件进行基于Girvanand
Newman’s算法的社区划分,通过设置区间范围,选择出
模块度值最大的划分方式,具体结果如图3所示。
从图3可以看出,社会网络总共划分出7个社区,社
区用户数分布不均匀。
2.4.3挖掘核心用户在社区网络中,往往存在居于核
心地位的用户,这种重要程度通常用点度中心度来测量。
点度中心度越大,说明该用户与其他人的联系越多,在社
区中地位越重要,即是核心用户的几率也就越大。
文章利
用UCINET软件计算4个社区的每个成员在社区中的点度
中心度来判定核心用户。
结果表明:
在社区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 应用于 营销 论文
![提示](https://static.bdocx.com/images/bang_tan.gif)