数据仓库系统的生命周期.ppt
- 文档编号:1758869
- 上传时间:2022-10-23
- 格式:PPT
- 页数:45
- 大小:1.71MB
数据仓库系统的生命周期.ppt
《数据仓库系统的生命周期.ppt》由会员分享,可在线阅读,更多相关《数据仓库系统的生命周期.ppt(45页珍藏版)》请在冰豆网上搜索。
1,第2章数据仓库系统的生命周期,2.1自上而下与自下而上2.2数据集市设计阶段2.3系统方法架构2.4测试数据集市小结,2,2.1自上而下与自下而上,自上而下需求分析全局业务需求,计划如何开发数据仓库、设计数据仓库并将数据仓库作为一个整体实现。
特点周期长、成本高自下而上数据仓库以逐增方式构建,以迭代构建方式创建几个数据集市,以实际数据为基础特点见效快、成本低,3,2.1自上而下与自下而上,数据仓库的构建过程,4,2.1自上而下与自下而上,数据仓库设计的大体步骤需求分析概念模型设计;技术准备工作;逻辑模型设计;物理模型设计;数据仓库生成;数据仓库运行与维护。
5,2.1自上而下与自下而上,概念模型设计界定系统边界要做的决策类型有哪些?
决策者感兴趣的是什么问题?
这些问题需要什么样的信息?
要得到这些信息需要包含原有数据库系统的哪些部分的数据?
确定主要的主题主题域及其内容主题域的公共码;主题域之间的联系;充分代表主题的属性组。
6,2.1自上而下与自下而上,技术准备工作技术评估管理大数据量数据的能力;进行灵活数据存取的能力;根据数据模型重组数据的能力;透明的数据发送和接收能力;周期性成批加载数据的能力;可设定完成时间的作业管理能力。
7,2.1自上而下与自下而上,技术准备工作技术环境准备预期在数据仓库上分析处理的数据量有多大?
如何减少或减轻竞争性存取程序的冲突?
数据仓库的数据量有多大?
进出数据仓库的数据通信量有多大?
直接存取设备;网络;管理直接存取设备的操作系统;进出数据仓库的界面(主要是数据查询和分析工具)。
8,2.1自上而下与自下而上,逻辑模型设计分析主题域范围不能太大,也不能太小确定粒度层次划分粒度:
指数据仓库的数据单位中保存数据的细化或综合程度的级别,细化程度越高,粒度级别越小。
如:
按月、季度、年层次划分数据粒度层次划分决定数据仓库的数据量和所适合的查询类型确定数据分割策略分割:
将数据分散到各自的物理单元中,以便能分别独立处理。
分割策略:
按日期、地域、业务领域等。
9,2.1自上而下与自下而上,逻辑模型设计(续)关系模式定义定义主题中表之间的联系记录系统的定义选择好的数据,10,2.1自上而下与自下而上,物理模型设计确定数据的存储结构因素:
存取时间、存储空间利用率和维护代价确定索引策略建立专用、复杂的索引以提高查询效率确定存储分配存储分配参数进行优化确定数据存放位置硬盘、磁带等,11,2.1自上而下与自下而上,数据仓库的生成设计接口从面向应用和操作的环境生成完整的数据;数据类型的转换;数据的清洗;数据的集成;数据的增量更新。
数据加载确定数据装入的次序;清除无效、错误或过期数据;数据粒度管理;数据刷新等。
12,2.1自上而下与自下而上,数据仓库的使用和维护建立DSS应用理解需求,改善和完善系统维护数据仓库,13,2.2数据集市设计阶段,设计阶段,14,2.4系统方法架构,数据驱动的方法,15,2.4系统方法架构,需求驱动的方法,16,2.5测试数据集市,测试类型单元测试集成测试体系结构测试可用性测试安全测试错误模拟测试性能测试容错性测试,17/38,2.6常用的服务器端分析工具,SQLServer2005ManagementStudio(数据管理)AnalysisServices(分析服务)IBM公司的DB2OLAPServer(OLAP服务器)。
18/38,2.6.1SQLServerAnalysisServices,组件SQLServerIntegrationServices(SSIS)SQLServerAnalysisServices(SSAS)SQLServerReportingServices(SSRS)平台BusinessIntelligenceDevelopmentStudio,19/38,2.6.1SQLServerAnalysisServices,组件的结构,20/38,2.6.1SQLServerAnalysisServices,启动,21/38,2.6.1SQLServerAnalysisServices,SQLServerBusinessIntelligenceDevelopmentStudio,22/38,2.6.1SQLServerAnalysisServices,SSIS、SSAS、SSRS,文件-项目,23/38,2.6.1SQLServerAnalysisServices,SQLServerManagementStudio,24/38,2.6.1SQLServerAnalysisServices,连接服务,25/38,2.6.1SQLServerAnalysisServices,分析服务的特点易用性;灵活的数据存储模型;伸缩性;集成;支持大量的API和函数;分布式处理能力;服务器端结构的高速缓存。
26/38,2.6.1SQLServerAnalysisServices,分析服务的体系结构,27/38,1.服务器端体系结构,2.6.1SQLServerAnalysisServices,28/38,2.6.1SQLServerAnalysisServices,2.客户端体系结构,29/38,2.6常用的客户端分析工具,ExcelCrystalAnalysis,30/38,2.6常用的客户端分析工具,Excel可以连接到分析服务器的功能可以脱机方式分析数据。
Excel可以使用数据透视表服务连接任何的ODBC数据源,然后产生一个多维数据集文件,模拟OLAP服务的多维数据分析。
还可以帮助用户绘制统计图表,从而更直观地展示多维数据分析的结果。
31/38,2.6常用的客户端分析工具,Excel选择数据源,32/38,2.6常用的客户端分析工具,Excel连接数据库服务器,33/38,2.6常用的客户端分析工具,Excel选择数据库和表,34/38,2.6常用的客户端分析工具,Excel设置保存数据文件,35/38,2.6常用的客户端分析工具,Excel设置显示方式,36/38,2.6常用的客户端分析工具,Excel浏览数据的初始界面,37/38,2.6常用的客户端分析工具,Excel浏览数据,38/38,2.6常用的客户端分析工具,CrystalAnalysisBusinessObjects公司在报表系列产品中的一种。
侧重于多维数据分析。
结构化的多维报表。
全面的分析和格式功能针对Web设计,39/38,2.6常用的客户端分析工具,CrystalAnalysis启动,40/38,2.6常用的客户端分析工具,CrystalAnalysis启动,41/38,2.6常用的客户端分析工具,CrystalAnalysis连接数据源,42/38,2.6常用的客户端分析工具,CrystalAnalysis连接数据源成功显示,43/38,2.6常用的客户端分析工具,CrystalAnalysis连接数据源成功显示,44/38,2.6常用的客户端分析工具,CrystalAnalysis选择模板,选择模板-点击“ok”,45,小结,数据仓库构建步骤数据集市设计系统方法架构,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 系统 生命周期