决策树实验报告.docx
- 文档编号:30086511
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:20
- 大小:1.40MB
决策树实验报告.docx
《决策树实验报告.docx》由会员分享,可在线阅读,更多相关《决策树实验报告.docx(20页珍藏版)》请在冰豆网上搜索。
决策树实验报告
LIAOCHENGUNIVERSITY
计算机学院实验报告
【2015~2016学年第1学期】
【一、基本信息】
【实验课程】
商务智能
【设课形式】
独立□非独立
【课程学分】
4
【实验项目】
实验三数据挖掘
【项目类型】
基础□综合□设计研究创新□其它[]
【项目学时】
【学生姓名】
王昭
【学号】
2013204636
【系别专业】
信息管理与信息系统
【实验班组】
2013级7班组台
【同组学生】
【实验室名】
【实验日期】
【报告日期】
【二、实验教师对报告的最终评价及处理意见】
实验成绩:
(涂改无效)
指导教师签名:
年月日
注:
要将实验项目、实验课程的成绩评定及课程考核办法明确告知学生,并报实验管理中心备案
【三、实验预习】
实验目的和要求:
理解数据挖掘过程,并设计数据挖掘应用案例。
实验内容和原理或涉及的知识点(综合性实验):
利用SQLServer2008BI开发环境创建一个具有决策树算法的挖掘结构。
(还可以建立“Microsoft聚类分析”挖掘模型和“MicrosoftNaiveBayes”挖掘模型,选作)
实验条件(实验设备、软件、材料等):
SQLServer数据库引擎
AnalysisServices
BusinessIntelligenceDevelopmentStudio
AdventureWorks2008R2DW2008示例数据库
实验设计方案(实验方法、步骤、操作过程、设计型实验、实验数据记录表格):
1、启动SQLServer2008BI的开发环境;
2、创建一个AnalysisServices项目,定义一个单个数据源,并向数据源视图添加一个表子集;
3、使用“数据挖掘向导”来创建TargetedMailing挖掘结构,在此挖掘结构中,创建一个具有决策树算法的挖掘模型;
4、理解决策树模型。
实验预习成绩(涂改无效)
合格□
不合格□
【四、实验过程、数据和实验结果记录】
实验方法、步骤、操作过程的记录描述或程序代码。
实验过程中输入/输出数据、程序运行结果的记录。
(可加附页)
(1)准备AnalysisServices数据库
1.打开程序->MicrosoftSQLServer2008->SQLServerBusinessIntelligenceDevelopmentStudio,启动SQLServer2008BI的开发环境。
2.在“文件”菜单上,指向“新建”,然后选择“项目”。
选中“项目类型”窗格中的“商业智能项目”。
选中“模板”窗格中的“AnalysisServices项目”。
在“名称”框中,将新项目命名为ASDataMining2008。
单击“确定”。
3.在BusinessIntelligenceDevelopmentStudio中,选择“项目”菜单中的“属性”。
在“属性页”窗格左侧的“配置属性”下,单击“部署”。
在“属性页”窗格右侧的“目标”下,确保“服务器”名称为localhost。
如果使用的是其他实例,请键入该实例的名称。
单击“确定”。
4.在“解决方案资源管理器”中,右键单击“数据源”文件夹,然后选择“新建数据源”。
在“欢迎使用数据源向导”页面中,单击“下一步”按钮
在“选择如何定义连接”页上,单击“新建”向AdventureWorksDW2008R2数据库中添加连接。
(注意此步骤前必须已经启动了sqlserver和sqlserverAnalysisservices,并确认两者的登录身份为localSystem)
在“服务器名称”框中,键入或选择安装了AdventureWorksDW2008R2的服务器的名称。
例如,如果是在本地服务器上承载该数据库,请键入localhost。
如果使用的是其他实例,请键入该实例的名称。
在“登录到服务器”组中,选择“使用Windows身份验证”
连接到一个数据库时,选择AdventureWorksDW2008R2数据库,然后单击“确定”。
单击“下一步”
5.在“模拟信息”页中,单击“使用服务帐户”,再单击“下一步”。
在“完成向导”页中,请注意数据源名称默认为AdventureWorksDW2008R2。
单击“完成”。
此时,解决方案资源管理器的“数据源”文件夹中将出现刚创建的新数据源AdventureWorksDW2008R2。
6.在解决方案资源管理器中,右键单击“数据源视图”并选择“新建数据源视图”。
在“欢迎使用数据源视图向导”页中,单击“下一步”。
在“选择数据源”页的“关系数据源”下方,选择在上一个任务中创建的AdventureWorksDW2008R2数据源。
单击“下一步”。
7.在“选择表和视图”页上,选择下列对象,然后单击右箭头键,将它们包括在新数据源视图中:
ProspectiveBuyer(dbo)-预期自行车购买者的表
vTargetMail(dbo)-有关以前的自行车购买者的历史数据的视图
单击“下一步”。
在“完成向导”页上,系统默认将数据源视图命名为AdventureWorksDW2008R2。
将该名称更改为TargetedMailing,然后单击“完成”。
新数据源视图随即在“TargetedMailing.dsv[设计]”选项卡中打开
(2)生成TargetedMailing结构
1.在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”。
在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,
再单击“下一步”。
在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?
”下,选择“Microsoft决策树”。
2.单击“下一步”。
在“选择数据源视图”页上的“可用数据源视图”窗格中,选择TargetedMailing。
可单击“浏览”查看数据源视图中的各表,然后单击“关闭”返回该向导。
单击“下一步”。
制定表类型,指定定型数据。
实验方法、步骤、操作过程的记录描述或程序代码。
实验过程中输入/输出数据、程序运行结果的记录。
(可加附页)
在“指定列的内容和数据类型”页上,单击“检测”运行用来确定每列的默认数据类型和内容类型的算法。
在“创建测试集”页上,将“测试数据百分比”保留其默认值:
30。
对于“测试数据集中的最大事例数”,请键入1000。
单击“下一步”。
在“完成向导”页上的“挖掘结构名称”中,键入TargetedMailing。
在“挖掘模型名称”中,键入TM_Decision_Tree。
选中“允许钻取”复选框。
单击“完成”。
(3)处理挖掘模型
1.在BusinessIntelligenceDevelopmentStudio的数据挖掘设计器中,单击“挖掘结构”选项卡或“挖掘模型”选项卡。
TargetedMailingMiningStructure显示在“属性”窗格中。
确保按F4可以打开“属性”窗格。
确保CacheMode已设置为KeepTrainingCases。
HoldoutSeed设置为12。
.在“挖掘模型”菜单上选择“处理挖掘结构和所有模型”。
如果更改了结构,系统将提示你们在处理模型之前生成和部署项目。
单击“是”。
在“处理挖掘结构-TargetedMailing”对话框中单击“运行”。
实验结果分析
三个级别的决策树的预览图
四个级别的决策树的预览图:
把购买的与非购买的设置不同的背景颜色
在NumberChildernAtHome不等于1上看出(0表示非购买)数量是1313(1表示购买)数量是519
在Age>=38and<45节点上看出购买的是2559,非购买的是1454
(2)钻取到事例数据
钻取年龄与地区,年龄与收入可看出,两个表哥是一样的
BikeBuyer与所有属性的联系图:
年龄与BikeBuyer的关系最强烈:
地区与BikeBuyer的联系低于年龄,但也有较强的联系:
记录成绩(涂改无效)
合格□
不合格□
【五、实验结果分析】
根据理论知识对所得到的实验数据或结果进行解释、分析。
对实验结果所作的一般性的判断、归纳、概括,实验的心得体会、建议等。
1.通过这次的实验,又进一步的了解数据库AnalysisServices的功能,掌握了它的一些间的应用能力,和一些基本的操作。
2.通过应用数据库AnalysisServices的一些功能,能够分析一些数据之间的联系,有利于做出判断与决策。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策树 实验 报告