数据挖掘.docx
- 文档编号:7777167
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:10
- 大小:18.12KB
数据挖掘.docx
《数据挖掘.docx》由会员分享,可在线阅读,更多相关《数据挖掘.docx(10页珍藏版)》请在冰豆网上搜索。
数据挖掘
实验1建立多维数据模型
实验目的:
从示例数据库中导出数据,建立并部署“销售分析”多维数据集,实现对公司的销售状况做分析研究。
实验内容:
1.创建一个新的数据仓库分析项目。
2.定义数据源。
3.定义数据源视图。
4.定义多维数据集。
5.部署“销售分析示例”项目。
6.浏览已部署的多维数据集。
7.提高多维数据集的可用性和易用性。
实验步骤:
1.创建一个新的数据仓库分析项目。
打开VisualStudio2005新建项目,选择AnalysisServices项目,并将项目名称更改为“销售分析示例”。
具体操作路径:
选择“开始”----“所有程序”----MicrosoftSQLServer2005命令,再单击SQLServerBusinessIntelligenceDevelopmentStudio,将打开MicrosoftVisualStudio2005开发环境。
2.定义数据源。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“销售分析数据源”。
3.定义数据源视图。
选择“数据源视图”文件夹,新建一个数据源视图。
数据源选择上一步新建的“销售分析数据源”。
在“可用对象”列表框中,选择下列表。
DimCustomer(客户维表)。
DimGeography(地理维表)。
DimProduct(产品维表)。
DimTime(时间维表)。
FactInternetSales(网上销售事实表)。
在定义好的数据源视图中可以修改表的默认名称,让视图更易理解。
4.定义多维数据集。
右键单击“多维数据集”,从弹出的快捷菜单中选择“新建多维数据集”命令;已选中“使用数据源生成多维数据集”选项和“自动生成”选项;在“时间维度表”下拉列表中选择“时间”别名。
下一步设置时间维,将时间属性名称映射到已指定为“时间”维度的维度表中的相应列。
选择事实表的度量值(去掉不是度量值的列),可以对度量值重新命名。
设置和效验维度的属性及层次结构,在“查看新建维度”页上,通过展开树控件显示该向导检测到的三个维度的层次结构和属性,查看其中每个维度的维度层次结构(可根据需要去掉部分维度属性)。
在维度设计器的“维度结构”选项卡上,可以添加、删除和编辑层次结构,级别和属性。
5.部署“销售分析示例”项目。
部署配置。
在解决方案资源管理器中,右键单击根结点“销售分析示例”项目,从弹出的快捷菜单中选择“属性”命令。
在弹出的对话框中更改“数据库”对应值为AnalysisServices。
部署项目。
在解决方案资源管理器中,右键单击“销售分析示例”项目,从弹出的快捷菜单中选择“部署”命令,或者在菜单栏中选择“生成”菜单,单击“部署销售分析示例”。
6.浏览已部署的多维数据集。
部署完成后,就可以根据需要浏览多维数据集中的实际数据了。
7.提高多维数据集的可用性和易用性。
●修改度量值的有关属性。
●修改维度的层次结构和有关属性。
●增加维度属性。
●将命名计算列作为维度的成员名称。
●重新部署并查看更改。
●灵活快速的导出各类统计报表。
实验2关联规则应用
实验目的:
掌握在SQLServer2005中实现关联规则的挖掘。
实验内容:
1.创建AnalysisServices项目。
2.创建数据源。
3.创建数据源视图。
4.创建关联挖掘结构。
5.设置关联规则挖掘的参数。
6.建立关联规则挖掘模型。
7.查看挖掘结果。
实验步骤:
1.创建AnalysisServices项目。
打开VisualStudio2005新建项目,选择新建AnalysisServices项目,并将项目名称更改为“AdventureWorks”。
2.创建数据源。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“AdventureWorksDW”。
3.创建数据源视图。
在解决方案资源管理器中,右击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令。
系统将打开数据源视图向导。
在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建的AdventureWorksDW数据源。
单击“下一步”按钮,在“选择表和视图”页上选择下列各表,然后单击右箭头键,将vAssocSeqLineItems和vAssocSeqOrders包括在新数据源视图中,单击“下一步”按钮。
在“完成向导”页上,默认情况下,系统将数据源视图命名为AdventureWorksDW。
单击“完成”按钮。
4.创建关联挖掘结构。
在解决方案资源管理器中,右键单击“挖掘结构”,从弹出的快捷菜单中选择“新建挖掘结构”命令。
在“选择定义方法”页中,确保已选中“从现有关系数据库或数据仓库”选项,再单击“下一步”按钮。
在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?
”列表框中选中“Microsoft关联规则”选项,再单击“下一步”按钮。
“选择数据源视图”页随即显示。
默认情况下,“可用数据源视图”下的AdventureWorksDW为选中状态。
单击“下一步”按钮,在“指定表类型”页上选中vAssocSeqOrder表右边的“事例”复选框,选中vAssocSeqLineItems表右边的“嵌套”复选框。
单击“下一步”按钮,在“指定定型数据”页上依次清除CustomerKey右边的“键”复选框和LineNumber右边的“键”和“输入”复选框。
选中Model列右边的“键”和“可预测”复选框。
然后,系统也将自动选中“输入”复选框。
单击“下一步”按钮,在“指定列的内容和数据类型”页上单击“下一步”按钮。
在“完成向导”页的“挖掘结构名称”中输入Association。
在“挖掘模型名称”中输入Association,再单击“完成”按钮。
5.设置关联规则挖掘的参数。
打开“算法参数”对话框,在“算法参数”对话框的“值”列中设置一下参数。
MINIMUN_SUPPORT=0.01
MINIMUN_PROBABILITY=0.1
然后单击“确定”按钮。
6.建立关联规则挖掘模型。
选择“挖掘模型”菜单的“处理挖掘结构和所有模型”选项,系统将打开“处理挖掘结构-Association”对话框。
单击“运行”按钮,系统将打开“处理进度”对话框,以显示有关模型处理的信息。
7.查看挖掘结果。
处理完成之后,选择“挖掘模型查看器”,第一个页面是挖掘到的频繁集,第二个页面则是查看挖掘出来的规则。
实验3决策树应用
实验目的:
掌握在SQLServer2005中决策树方法的使用。
实验内容:
1.创建AnalysisServices项目。
2.创建数据源。
3.创建数据视图。
4.创建决策树挖掘结构。
5.设置决策树挖掘结构的相关参数。
6.建立决策树挖掘模型。
7.查看挖掘结果。
实验步骤:
1.创建AnalysisServices项目。
打开VisualStudio2005新建项目,选择新建AnalysisServices项目,并将项目名称更改为“决策树”。
2.创建数据源。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“决策树”。
3.创建数据源视图。
在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。
在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。
在“选择数据源”页中再次单击“下一步”按钮。
在“选择表和视图”页上,选择dbo.vTargetMail视图,然后右击,将它包括在新数据源视图中。
4.创建决策树挖掘结构。
在解决方案资源管理器中,右击单击“挖掘结构”,然后选择“新建挖掘结构”,系统打开数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。
在“选择定义方法”页上,从在“从现有关系数据库或数据仓库”,再单击“下一步”按钮。
在选择“数据挖掘技术”页的“您要使用何种数据挖掘技术?
”下拉列表中选择“Microsoft决策树”选项。
单击“下一步”按钮,默认选中AdventureWorksDW。
单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选中vTargetMail右边“事例”列中的复选框。
单击“下一步”,出现“指定定型数据”页。
确保已选中CustomerKey列右边“键”列中的复选框,选中类别属性BikeBuyer列右边的“输入”和“可预测”复选框,并且从属性列表中选择16个描述属性,选中相应的“输入”复选框。
单击“下一步”按钮,在随后的“指定列的内容和数据类型”页上,单击“下一步”按钮,出现“完成向导”页。
在“挖掘结构名称”文本框中输入DecisionTree,在“挖掘模型名称”文本框中输入DecisionTree,之后单击“完成”按钮。
由此决策树挖掘结构创建完成,系统将打开挖掘结构设计器,显示AdventureWorksDW挖掘结构视图。
5.设置决策树挖掘结构的相关参数。
6.建立决策树挖掘模型。
选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”,在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”窗口。
处理进度完成之后,单击“关闭”按钮,建模完成。
7.查看挖掘结果。
再次选择“挖掘模型查看器”选项卡,由vTargetMail数据集生成的决策树。
实验4K-means应用
实验目的:
掌握在SQLServer2005中的K-means应用。
实验内容:
1.创建AnalysisServices项目。
2.创建数据源。
3.创建数据源视图。
4.创建k-means挖掘结构。
5.设置k-means挖掘结构的相关参数。
6.建立k-means挖掘模型。
实验步骤:
1.创建AnalysisServices项目。
打开VisualStudio2005新建项目,选择新建AnalysisServices项目,并将项目名称更改为“K-means”。
2.创建数据源。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“k-means”。
3.创建数据源视图。
在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。
在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。
在“选择数据源”页中再次单击“下一步”按钮。
在“选择表和视图”页上,选择dbo.vTargetMail视图,然后右击,将它包括在新数据源视图中。
4.创建k-means挖掘结构。
在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。
在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”按钮。
在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术”下拉列表中选择“Microsoft聚类分析”选项。
单击“下一步”按钮,在随后出现的“选择数据源视图”页上,选中默认的AdventureWorksDW。
单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选中TargetMail表右边“事例”列中的复选框,单击“下一步”按钮。
在随后“指定定型数据”页,确保已选中CustomerKey列右边的“键”列中的复选框,并且从属性列表中描述16个描述属性,并且选中相应的“输入”复选框。
在“指定列的内容和数据类型”页上,单击“下一步”按钮,出现“完成向导”页。
在“挖掘结构名称”文本框中输入Cluster,在“挖掘模型名称”文本框中输入Cluster,之后单击“完成”按钮。
由此k-means挖掘结构创建完成。
5.设置k-means挖掘结构的相关参数。
在“挖掘模型”选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框。
可以为要更改的算法设置新值。
6.建立k-means挖掘模型。
选择“挖掘模型查看器”选项卡,建立部署项目。
在“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页。
处理进度完成之后,单击“关闭”按钮,建模完成。
7.查看挖掘结构。
再次选择“挖掘模型查看器”选项卡,由TargetMail数据集得到的k-means聚类结果。
实验5贝叶斯网络应用
实验目的:
掌握利用SQLServer2005中的贝叶斯网络解决一个简单的预测和诊断问题。
实验内容:
1.在SQLServer2005中创建一个新的数据库BayesDatabase。
2.创建一个新的数据表Table_2。
3.向数据表Table_2中输入数据。
4.创建新的商业智能项目BayesProject。
5.建立BayesA中的数据连接,连接到数据库BayesDatabase。
6.建立BayesA中的数据源视图,在建立视图的过程中选择数据库中的表格Table_2。
7.创建挖掘结构。
8.预测和诊断。
实验步骤:
1.在SQLServer2005中创建一个新的数据库BayesDatabase。
2.创建一个新的数据表Table_2。
3.向数据表Table_2中输入数据。
4.创建新的商业智能项目BayesProject。
打开VisualStudio2005新建项目,选择新建AnalysisServices项目,并将项目名称更改为“BayesProject”。
5.建立BayesA中的数据连接,连接到数据库BayesDatabase。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“BayesProject”。
6.建立BayesA中的数据源视图,在建立视图的过程中选择数据库中的表格Table_2。
7.创建挖掘结构。
在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。
在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”按钮。
在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术”下拉列表中选择“MicrosoftNaïveBayes”选项。
在“指定定型数据”页中,设定表Table_2中列A为“输入”和“可预测”,列B为“输入”和“可预测”,列C为“输入”和“可预测”,列mark为“键”。
8.预测和诊断。
选择“挖掘模型预测”选项卡,进入预测的界面。
然后选择Table_2为事例表,随后单击工具条上的“单独查询”按钮,得到输入界面。
将各个值输入,单击“切换到查询结构视图”,得到预测结果。
在输入数据完成并选择了预测变量之后,单击“切换到查询结果视图”得到诊断结果。
实验6神经网络应用
实验目的:
掌握利用SQLServer2005中的数据挖掘功能,进行神经网络的训练和预测。
实验内容:
1.创建示例数据库。
2.创建新项目。
3.创建数据连接。
4.建立数据源视图。
5.建立挖掘结构。
6.部署项目。
7.进行数据预测。
实验步骤:
1.创建示例数据库。
首先新建数据库NeuralDatabase,然后在数据库中新建表Table_1,之后给表Table_1中添加数据。
2.创建新项目。
打开VisualStudio2005新建项目,选择新建AnalysisServices项目,并将项目名称更改为“NeuralProject”。
3.创建数据连接。
在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。
启动新建数据源向导,单击“新建”按钮。
出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLEDB\MicrosoftOLEDBProviderforSQLServer”选项。
选择数据源帐号为“使用服务帐号”并命名数据源为“NeuralProject”。
4.建立数据源视图。
建立NeuralProject中的数据源视图,在建立视图的过程中选择数据库中的表格Table_1。
5.建立挖掘结构。
在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。
在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”按钮。
在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术”下拉列表中选择“Microsoft神经网络”选项。
在弹出的“选择数据源视图”窗口中选择数据源视图NeuralProject,并单击“下一步”按钮,将数据表Table_1的类型选择为“事例”类型。
然后对Table_1表的各个列指定类型:
mark列为键类型,x1,x2,x3规定为输入类型,y规定为可预测类型。
6.部署项目。
7.进行数据预测。
部署成功后,即可得到数据分析图表。
也可以通过选择“挖掘模型预测”选项卡,进行数据预测。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘