决策树在推荐系统中的应用PPT推荐.pptx
- 文档编号:13003382
- 上传时间:2022-10-02
- 格式:PPTX
- 页数:29
- 大小:4.63MB
决策树在推荐系统中的应用PPT推荐.pptx
《决策树在推荐系统中的应用PPT推荐.pptx》由会员分享,可在线阅读,更多相关《决策树在推荐系统中的应用PPT推荐.pptx(29页珍藏版)》请在冰豆网上搜索。
主要思想:
利用用户的过去的偏好、习惯或者寻找有共同爱好的用户来预测并推荐适合其需要的信息或商品协同过滤给用户推荐那些和他有共同,兴趣爱好的用户喜欢的物品,而ItemCF给用户推荐那些和他之前喜欢的物品类似的物品。
一.背景知识及研究意义(2/4),5,物品。
当新用户或新项目进入系统时,由于缺乏用户或项目的评价资料与历史偏好,无法为新用户推荐或推荐新物品。
推荐系统存在的问题“稀疏性”问题随着推荐系统用户和项目数量的增加,由于用户评价过的项目占全体项目数量的比例很小,推荐算法的计算不准确,无法产生正确的推荐集合。
当用户和项目数目较大时,计算复杂度增加,该算法的效率也会明显降低。
系统只能推荐与用户过去爱好相似的项目,无法推荐新的,“冷启动”问题,一.背景知识及研究意义(3/4),6,RFM模型,RFM模型,衡量指标:
原因有两个:
1.通过减少客户的数量,降低了,推荐的计算复杂度,从而提高,是衡量客户价值和创利能力的重要工具了和推手荐段的效率。
2.确保系统的目标用户为那些有很高的RFM得分的顾客,他们更有可能购买推荐的商品。
因此,这种方法还提高推荐的,最近一次消费(Recency)准确性。
:
客户最近一次购买的时间有多远消费频率(Frequency):
表示客户在最近一段时间内购买的次数消费金额(Monetary):
客户在最近一段时间内购买的金额目标:
根据这3个指标从大量的用户中筛选出相对重要的目标用户,一.背景知识及研究意义(4/4),7,决策树通过决策树模型(decisiontree)分析用户对一些商品的偏好来预测该用户对目标商品是否感兴趣从而形成推荐。
类型:
ID3,C4.5,CART,缺失值处理,丢弃,计算属于某一类的概率,大纲,8,一.背景知识及研究意义二.基于决策树的推荐算法三.实例研究,四.展望与问题,二.基于决策树的推荐算法,9,二.基于决策树的推荐算法(1/9),10,目标用户的选择,用户偏好兴趣分析,商品关系分析,推荐规则的产生,生成推荐列表,通过RFM分值对用户筛选,C4.5决策树算法,基于决策树的推荐算法的基本框架:
问题定义用户对物品的,偏好值进行标准化根据用户的偏好聚类,推荐问题定义目标客户的问题:
推荐系统关注怎么样的客户?
是所有客户还是选择部分顾客?
推荐系统应该推荐物品给什么样的客户?
预测问题:
预测顾客会关注或喜欢怎么样的商品?
应该推荐给顾客怎么样的商品是他感兴趣的?
11,二.基于决策树的推荐算法(2/9),目标用户的选择使用的模型:
RFM模型方法:
根据最近购买R,购买频率F和购买花费C3个参数,生成每个客户的RFM分数。
然后筛选获得较高RFM分数的用户作为重要的目标用户步骤1:
定义RFM每个属性的度量获取每个客户的交易数据,按三个参数的数据降序排列,并划分为五个相等的部分,每个部分等于所有的客户的20%。
给每一个属性的每个部分分别赋值(5、4、3、2、1),指的是客户为企业收入的贡献大小。
步骤2:
生成目标客户RFM得分得到每个客户3个属性RFM的分数后,通过相加得到RFM的总分步骤3:
筛选重要的目标用户生成目标客户RFM得分,通过设定最小RFM值来过滤客户得分,以确保过滤后的顾客更可能会选择推荐物品。
12,二.基于决策树的推荐算法(3/9),二.基于决策树的推荐算法(4/9),13,用户偏好分析在这个阶段,算法中用到了标准化相对消费(NormalizedRelativeSpending)。
主要分成四个步骤来进行:
STEP:
获得用户的绝对消费,()中表示第个用户,表示第个用户对第个商品的消费。
STEP:
获得用户的绝对消费比(标准化),14,STEP:
计算用户标准化的相对消费,标准化相对消费是用户对该物品的消费比与所有用户对该物品的平均消费比的比值。
衡量的是相对于其他所有用户,该用户对该物品的兴趣有多大。
二.基于决策树的推荐算法(5/9),二.基于决策树的推荐算法(6/9),15,Step4:
发现用户的偏好,代表着用户对物品是感兴趣的,商品关联分析这个阶段首先根据用户的偏好对他们聚类,然后通过C4.5决策树模型发现在相同的用户类中商品的关联。
STEP1:
根据用户偏好聚类根据每个用户对个物品的偏好是否等于,将所有用户分成个类,每个类对应一个物品在类中,所有用户对物品的偏好为每个类中用户具有相同兴趣爱好的可能性较大。
16,二.基于决策树的推荐算法(7/9),商品关联分析STEP:
商品数据转换,17,二.基于决策树的推荐算法(8/9),二.基于决策树的推荐算法(9/9),18,类标号属性,分裂属性商品关联分析STEP:
产生决策树分类预测模型分别对每个类进行决策树分析,将是否对每个类对应的物品有偏好作为决策树分析的分类属性。
并将每个类中的的数据作为训练集,将剩余的的数据作为测试集,大纲,19,一.背景知识及研究意义二.基于决策树的推荐算法三.实例研究,四.展望与问题,三.实例研究,20,为了在零售业务中解决推荐问题,推荐系统在以下环境中进行了开发和实施。
实验平台:
CPU:
奔腾IV2.4GHz存储:
1gb内存,160G硬盘操作系统:
WindowsXP数据库:
SQLServer2005开发语言:
VisualBasic实验数据来源:
一个在台湾的知名零售企业获得的客户数据,总计150万多个事务,和近500000名客户,时间跨度从2006年到2007年,21,三.实例研究(1/3),决策树(在1007商品类中),22,三.热点的技术问题探讨(2/3),1,购买1004号商品,N,Y,3,2,类:
是(对1007号商品有兴趣),4,5,N,购买1003号商品Y,类:
是,规则结果(在1007商品类中),23,三.热点的技术问题探讨(3/3),处理缺失值,24,70%作为训练数据集,30%作为测试数据集,大纲,25,一.背景知识及研究意义二.基于决策树的推荐算法三.实例研究,四.展望与问题,四.问题与展望,26,三.热点的技术问题探讨(1/2),27,本文的创新点提出了一种新颖的商品推荐方法,以及一个推荐系统来实现这种方法。
该方法具有以下特征:
通过RFM分数来筛选出了重要的目标客户,提高推荐的准确性也降低了计算的复杂度。
大多数以前的研究人员采用皮尔逊相似度(Resnicketal,1994)或余弦相似度(KerypisKonstan,&
Riedl2001)来获得客户的相似之处,从而以发现客户的喜好,而本研究应用了客户对商品的评分值来发现客户的偏好,一定程度上也降低了计算的复杂度。
使用了C4.5决策树来探索商品之间的联系,而不是采用关联规则(Agrawal,Imielinski,&
Swami,1993)。
存在的问题,28,仅仅强调了该算法的新颖性与可能的优势,并没有与一些传统的协同过滤算法作实证研究的比较。
三.热点的技术问题探讨(2/2),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策树 推荐 系统 中的 应用