数据仓库及数据挖掘专业技术第五章关联规则.docx
- 文档编号:12579091
- 上传时间:2023-04-20
- 格式:DOCX
- 页数:20
- 大小:2.92MB
数据仓库及数据挖掘专业技术第五章关联规则.docx
《数据仓库及数据挖掘专业技术第五章关联规则.docx》由会员分享,可在线阅读,更多相关《数据仓库及数据挖掘专业技术第五章关联规则.docx(20页珍藏版)》请在冰豆网上搜索。
数据仓库及数据挖掘专业技术第五章关联规则
第5章关联规则方法
5.1关联规则的概念和分类
5.1.1关联规则的概念
5.1.2关联规则的分类
1.基于规则中处理的变量类别分类
2.基于规则中数据的抽象层次分类
3.基于规则中涉及的数据维数分类
4.基于模式与规则之间的相互关系分类
5.2Apriori算法
5.2.1产生频繁项集
1.求频繁1项集L1
2.求频繁k+1项集Lk+1(即执行apriori-gen(Lk))
图5-1示例数据库
5.2.2产生频繁项集的实例
1.第1次迭代,产生频繁1-项集
3.第3次迭代,产生频繁3-项集
5.2.3从频繁项集产生关联规则
5.3FP-Growth算法
5.3.1FP-Growth算法计算过程
图5-2示例数据库
图5-3FP-tree
5.3.2FP-Growth算法示例
图5-4I5的条件模式树
5.4利用SQLServer2005进行关联规则挖掘
1.数据准备
图5-5客户基本情况表
图5-6贷款余额表
图5-7合并表数据
图5-8合并产生的表
2.实现挖掘任务
图5-9启动MicrosoftVisualStudio
图5-10新建AnalysisServices项目
图5-11AnalysisServices项目信息
图5-12新建数据源视图
图5-13数据源视图向导
图5-14选择数据源
图5-15选择表和视图
图5-16命名数据源视图
图5-17数据源视图具体信息
图5-18新建挖掘结构
图5-19数据挖掘向导欢迎界面
图5-20选择创建挖掘结构所用的方法
图5-21选择挖掘结构所用的数据挖掘技术
图5-22选择数据源视图
图5-23指定表类型
图5-24指定列
图5-25指定列内容和数据类型
图5-26为挖掘结构命名
图5-27挖掘模型
图5-28设置算法参数
图5-29参数设置
图5-30启动部署
图5-31显示部署进度
图5-32处理挖掘结构和所有模型
图5-33选择挖掘结构
图5-34处理成功
3.查看挖掘结果
图5-35加载挖掘模型进度
图5-36查看项集
图5-37设定支持度和项集尺寸
图5-38查看规则
图5-39显示依赖关系
图5-40查找感兴趣的结点
图5-41“房地产开发”的关系网络
图5-42选择事例表
图5-43选择可预测列
图5-44显示提升图
图5-45显示分类矩阵
习题5
1.说明关联规则挖掘的目的和作用。
2.简要说明在频繁模式发现技术中,产生候选项集和不产生候选项集两种技术各自的特点和优缺点。
3.图5-1所示的数据库,如果分别设定最小支持度s=10%和s=40%,置信度c=70%,计算该示例数据库中的频繁项集和规则。
4.根据图5-3所示的FP-tree,找出以I4,I3,I1,I2为后缀的频繁模式。
5.根据图5-3所示的FP-tree,找出其中所有的关联规则及他们的置信度。
6.练习使用SQLServer2005的关联规则挖掘模型。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 专业技术 第五 关联 规则