数据仓库与数据挖掘课程设计报告模板文档格式.doc
- 文档编号:13168877
- 上传时间:2022-10-07
- 格式:DOC
- 页数:17
- 大小:295.50KB
数据仓库与数据挖掘课程设计报告模板文档格式.doc
《数据仓库与数据挖掘课程设计报告模板文档格式.doc》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘课程设计报告模板文档格式.doc(17页珍藏版)》请在冰豆网上搜索。
2.设计星型架构多维数据集(Sales)
3.设计存储和数据集处理
4.OLAP分析
三、人力资源数据OLAP分析
2.设计父子维度的多维数据集(HR)
3.修改多维数据集(HR)的结构
4.设计存储和数据集处理
5.OLAP分析
四、数据仓库及多维数据集其它操作
2.设置数据仓库及多维数据集角色及权限
3.查看元数据
4.创建对策
5.钻取
6.建立远程Internet连接
五、数据仓库高级操作
2.创建分区
3.创建虚拟多维数据集
4.DTS调度多维数据集处理
5.备份/还原数据仓库
六、数据挖掘
2.创建揭示客户模式的决策树挖掘模型
3.决策树挖掘结果分析
4.创建聚类挖掘模型
5.聚类挖掘结果分析
6.创建基于关系数据表的决策树挖掘模型
7.浏览“相关性网络”视图
一、建立数据仓库数据库结构和设置数据源
1、任务描述
数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。
然后跟预先设置好的ODBC数据源建立连接。
2、建立数据仓库数据库
(1)展开树视图的AnalysisServers;
(2)单击服务器名或右击选择连接,与AnalysisServers建立连接;
(3)右击服务器名,然后单击“新建数据库”命令;
(4)在“数据库”对话框中输入数据库名“教程DW”,单击<
确定>
;
3、设置数据源
(5)展开刚创建的“教程DW”数据库,可看到如下项目:
数据源、多维数据集、共享维度、挖掘模型、数据库角色
(6)右击“教程DW”数据库下的“数据源”文件夹,然后单击“新数据源”命令;
(7)在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“MicrosoftOLEDBProviderforODBCDrivers”;
(8)单击“连接”选项卡,选择建好的ODBC数据源“FoodMart2000”;
(9)单击<
按钮关闭“数据链接属性”对话框
图表1连接数据源
二、销售数据OLAP分析
1.任务描述
以多维方式建立数据模型可简化联机业务分析,提高查询性能。
通过创建多维数据集,AnalysisManager可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。
2.设计星型架构多维数据集(Sales)
星型架构的多维数据集由一个事实数据表和链接到该事实数据表的多个维度表组成。
下面针对FoodMart超市1998年的销售业务数据,建立一个多维数据集,以便按产品和顾客2个主题展开分析。
具体操作如下:
(1)展开树窗格的“教程DW”,右击“多维数据集”,选择“新建多维数据集”→“向导…”菜单命令,打开如下“多维数据集向导”对话框。
(2)向多维数据集添加度量值(事实):
(3)单击<
下一步>
,在“从数据源中选择事实数据表”步骤中,展开“FoodMart”数据源,然后单击“sales_fact_1998”;
(4)单击<
,设置多维数据集的度量值列:
store_sales、store_cost、unit_sales;
(5)单击<
,建立维度表。
单击<
新建维度>
,打开“维度向导”对话框;
1)向多维数据集添加时间维:
(1)选择维度类型为“星型架构:
单个维度表”;
(2)单击<
,选择维度表“time_by_day”;
,选择维度类型为“时间维度”;
,选择时间级别为“年、季度、月”;
,单击<
,输入时间维名称:
Time,并设为“共享”方式,单击<
完成>
,OK!
2)向多维数据集添加产品维:
(1)再次单击<
(2)选择创建维度的方式为“雪花架构:
多个相关维度表”;
,选择维度表“Product”和“product_class”;
,查看连接方式,在这里可删除不要的连接,添加需要的连接;
,依次选择product_category、product_subcategory和brand_name三个维度级别;
(6)单击<
,指定成员键列步骤中,不需改变主键列;
(7)单击<
,在“高级选项”步骤中,根据需要选择;
(8)单击<
,输入产品维名称:
Product,并设为“共享”方式,单击<
3)向多维数据集添加客户维度:
(2)选择创建维度的方式为“星型架构:
,选择维度表“Customer”;
,选择维度类型为“标准维度”;
,依次选择Country、State_Province、City和lname四个维度级别;
,输入客户维名称:
Customer,并设为“共享”方式,单击<
4)生成多维数据集:
(1)回到多维数据集向导对话框,这里已 到了新建的4个维度;
,在“是否计算事实数据表行数提问时,单击<
是>
,开始计算。
(3)计算完成后,命名多维数据集为:
Sales,单击<
(4)关闭向导,随之启动多维数据集编辑器,其中可看到刚刚创建的多维数据集。
单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子
图表2“Sales多维数据集编辑器”窗口
3.设计存储和数据集处理:
设计好Sales多维数据集的结构之后,需要选择数据的存储模式(MOLAP、ROLAP或HOLAP),并指定要存储的预先计算好的值的数量,然后用数据填充多维数据集。
本例选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。
(1)展开树窗格,右击“Sales”多维数据集,选择“设计存储…”菜单命令,弹出“存储设计向导”对话框;
也可在多维数据集编辑窗口中选择“工具|设计存储…”菜单命令,打开“存储设计向导”对话框;
,然后选择“MOLAP”作为数据存储类型;
,设置聚合选项为“性能提升达到”,并输入“40”作为指定百分比,以此优化能力平衡查询性能和存储空间大小。
开始>
,完成后可看到“性能与大小”图,从中可看出增加性能提升对使用额外磁盘空间的需求。
,选择“立即处理”,并单击<
,系统开始进行数据处理,处理聚合一般要花费较长一些时间。
(6)处理完成后点击<
关闭>
,回到AnalysisManager窗口。
(7)接下来就可浏览多维数据集的数据了。
4.OLAP分析:
联机分析处理(OLAP)是使用多维数据表达式(称为多维数据集)提供对数据仓库数据进行快速访问的常用方法。
多维数据集为维度表中的数据和数据仓库中的事实数据表建立模型,并为客户端应用程序提供完善的查询和分析功能。
图表3OLAP分析图
三、人力资源数据OLAP分析
1.任务描述:
建立一个人力资源(HR)多维数据集,以进行雇员工资分析。
先把Employee维度创建为父子维度,然后使用该维度以及常规维度来生成HR多维数据集
2.设计父子维度的多维数据集(HR):
(1)展开“教程DW”,右击“共享维度”,选择“新建维度|向导”菜单命令,打开“新建维度向导”对话框。
(2)单击<
,选择维度结构为“父子:
单个维度表中相关的两列”;
(3)单击<
,选择维度表employee;
(4)单击<
,选择employee_id为成员键,选择supervisor_id为父键列,选择full_name为成员名。
(5)单击<
,直到最后一步,输入维度名称:
employee;
(6)单击<
,回到维度编辑器。
OK!
3.修改多维数据集(HR)的结构
(1)展开“教程DW”,右击“多维数据集”,选择“新建多维数据集|向导”菜单命令,打开多维数据集向导对话框。
(2)点击<
,选择salary(工资)作事实数据表;
(3)点击<
,选择salary_paid、vacation_used为度量值列;
(4)点击<
,选择Employee(雇员)、Store(商店)、Time(时间)作维度;
(5)点击<
,在提示是否计算事实数据表行数时选“是”。
最后输入人力资源多维数据集的名称NR,点击<
(6)回到编辑器窗口,手工建立time_by_day表到salary表的联接,再建立store表到employee表中的联接,删除多余的联接。
最后如下图所示。
4.设计存储和数据集处理
本例选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。
图表4性能与大小
5.OLAP分析
四、数据仓库及多维数据集其它操作
1任务描述
多维数据集角色用于定义可以访问和查询多维数据集的用户或组,指出其可以访问的对象,以及对这些对象的访问类型。
角色是保护多维数据集内对象和数据安全的主要方法,可以在多维数据集的不同粒
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 课程设计 报告 模板