数据挖掘Weka软件实验报告Word格式.docx
- 文档编号:17821721
- 上传时间:2022-12-11
- 格式:DOCX
- 页数:18
- 大小:1.13MB
数据挖掘Weka软件实验报告Word格式.docx
《数据挖掘Weka软件实验报告Word格式.docx》由会员分享,可在线阅读,更多相关《数据挖掘Weka软件实验报告Word格式.docx(18页珍藏版)》请在冰豆网上搜索。
XXX
班级
信管111
学号
2011215XXX
成绩
实验项目
据挖掘应用实验(Weka)
实验目的
至少掌握一种数据挖掘工具,并能正确地使用;
利用所掌握的数据挖掘工具进行分类分析、关联分析、聚类分析等。
实验要求
至少熟悉一种挖掘工具,并使用该挖掘工具进行分类、关联和聚类分析;
阅读教材P139-156,边阅读,边操作;
实验数据可用系统自带的,也可以从网上下载,也可以自行创建;
算法自行选择,可以针对一个数据集选择多个算法进行比较分析,也可以每个算法选择不同的数据进行分析;
学会并熟悉通过网络解决问题的能力;
将本次试验的操作过程及分析结果填写在实验报告中。
实验内容及实验结果
1.安装Weka,进行Weka的可视化界面,对数据进行处理和分析
这是Weka的初始启动界面,点击Explorer进入可视化界面。
2.数据文件
利用Weka分析数据,首先要打开数据文件。
点击界面最左侧的open按钮。
3.打开weather数据集,单击屏幕上的Edit按钮,显示数据集内容。
4.数据项处理
需要关联分析之前,要把两个连续类型的属性先进行离散化处理。
点击Filter选区的Choose按钮,选择unsupervised|attribute|Discretize命令
单击Close回到主界面
选择Apply前的数据,修改参数。
在第一栏中输入2-3,bins中输入3。
如下图所示:
单击ok回到主界面,单击Apply执行离散化操作。
离散化结束后,单击Edit按钮,查看离散化后的数据。
点击Save按钮保存数据,文件名为weather-disc.arff
5.关联分析
打开数据集weather-disc.arff,选择Associate选择卡,单击choose后面的文本框。
在参数设置对话框中设置参数。
根据要求修改数据。
如下:
点击OK回到主界面。
单击start按钮执行关联规则的发现。
6.分类
Weka实现的分类算法很多,在主界面的classify选择卡中提供。
还是以weather数据集为对象。
打开weather数据集后,选择classify选择卡,单击choose按钮。
选择trees类型。
在trees类型下选择J48,回到主界面,在Testoptions选区中选择Usetrainingset选项。
单击Moreoptions…按钮,选择outputpredictions。
点击start,开始决策树的构建。
如果有测试集,选择suppliedtestset选项,然后单击set,选择测试集文件,我选择的是weather。
点击start开始决策树构建。
交叉验证,选择选项cross-validation,并输入折的数目。
Folds输入10意味着进行十折交叉验证。
点击start查看生成的决策树可视化结果。
右键单击resultlist区域中的结果,选择visualizetree命令,生成可视化决策树。
可视化决策树如下图:
7.数据规范化与聚类(选择的数据文件为Iris)
在进行聚类之前先要数据规范化,在preprocess选项卡中单击choose按钮,选择normalize命令。
回到主界面,单击choose后面的文本框,设置参数
单击Apply进行规范化,单击Edit查看结果。
使用K-均值聚类方法,选择Cluster选项卡
单击choose按钮,选择simplemeans命令。
回到主界面,打开参数设置对话框。
修改参数如下:
回到主界面,选择classertoclusterevaluation选项,单击start显示数据如下:
如果采用密度的聚类方法DBSCAN,在choose中选择DBScan
点击OK回到主界面,单击start。
如果选择层次聚类方法,则在choose下选择HierarchicalClusterer命令。
修改参数如下;
点击ok回到主界面,点击start查看结果。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 Weka 软件 实验 报告