如何在数据仓库使用Microsoft的特性.docx
- 文档编号:24359831
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:24
- 大小:34.51KB
如何在数据仓库使用Microsoft的特性.docx
《如何在数据仓库使用Microsoft的特性.docx》由会员分享,可在线阅读,更多相关《如何在数据仓库使用Microsoft的特性.docx(24页珍藏版)》请在冰豆网上搜索。
如何在数据仓库使用Microsoft的特性
TNQ400-13:
如何在数据仓库中使用Office2000特性
结合演示脚本及PowerPoint演示文稿
演讲者:
MichaelL.Flakus
我叫MichaelL.Flakus,是BEST咨询公司的高级顾问,我将做一个关于如何在数据仓库中使用Office2000特性的讲座。
[下一张幻灯片:
理解本讲座所需必要条件]
要想从这个讲座中获得最多的收获,你应当对Office2000和MSSQLServer7.0有一个基本的理解。
[下一张幻灯片:
今天你将学到什么]
在这个讲座中,我将介绍在Excel及Web中使用数据透视表(PivotTable)和数据透视图(PivotChart)功能分析OLAP数据的技巧。
另外,我将概述如何使用MicrosoftOLAPSQL服务创建多维数据库。
[下一张幻灯片:
相关术语的定义]
首先,让我们从一些术语开始。
OLTP——联机事务处理——是一个涉及一些传统操作系统的术语,这些系统独立地读、写、修改和删除记录,或在用户所发起的事务中进行上述操作。
另一方面:
OLAP——联机分析处理——这个术语指对数百万个通常在一段指定时间内发生的事务的“事后”处理。
这种分析有助于用户了解其公司或组织的业绩,以及识别其正在面对的挑战的特征。
OWC——OfficeWeb组件——包含于Office2000中,它们完成与其它Office应用程序类似的工作,但运行于Internet环境中。
这些组件包括:
电子表格组件
数据透视表组件
图组件
数据源组件
稍后,我将详细进行介绍。
OLAPCube——是一个用于简化OLAP类型查询的多维数据库结构。
OLAP.cub文件——是一种与OLAP多维数据集结构类似的独立文件,但它不需要运行MSOLAP服务以便访问数据。
EXCEL、OWC(OfficeWeb组件)和其它应用程序使用数据透视表(PivotTable)服务访问数据。
通常后者的性能较低,而OLAP.cub文件更为轻便。
MDX——多维扩展——是一种在语法上类似于SQL的查询语言,它显著增强了对OLAP类型查询的支持。
有几本书中介绍了有关MDX的内容。
在此演示文稿的最后提到了其中的两本。
[下一张幻灯片:
数据仓库框架]
为了给今天的讨论创建一些相关环境,让我们来看一看数据仓库的框架。
深青色(即左上角)的区域代表了从可操作的支持OLTP的系统,到多维、支持OLAP的数据库内部的数据流。
蓝色(即右上角)的区域包含了使终端用户能够访问数据所需的机制和处理。
我将介绍Excel的数据透视表(PivotTable)和数据透视图(PivotChart)特性,以及OfficeWeb组件(OWC)的数据透视表(PivotTable)和图(Chart)如何支持框架中的这一段。
[注意——在OWC中将组件称为“图(Chart)”并非一个错误]
橙色的区域包含源数据存储库组件。
绿色区域提供系统管理功能。
在《MicrosoftSQLServer7.0数据仓库框架》白皮书中,对该框架进行了更加详细的描述。
[推荐者说明——为了更好地理解这个框架,你也许要阅读《MicrosoftSQLServer7.0数据仓库框架》,网址:
[下一张幻灯片:
软件和组件]
这个讲座中使用了下列Office2000软件组件:
Excel数据透视表(PivotTable)和数据透视图(PivotChart),以及OfficeWeb组件(OWC)数据透视表(PivotTable)和图(Chart)。
另外:
ExcelMicrosoft查询用于将OLAP数据源连接到Excel。
Microsoft查询是一个用于建立到外部数据库的连接,以及创建检索数据所需的查询的通用工具。
它是一个可选组件,并且当使用一个已经定义了连接的Excel工作簿时,因为数据源连接信息已经储存在Excel工作簿文件中,所以并不要求使用它。
InternetExplorer(IE)4.01或更高版本要求使用OfficeWeb组件(OWC)。
其它浏览器通常不支持其工作。
在没有任何插件的情况下,NetscapeNavigator4.5不能自动支持COM控件,因此,OfficeWeb组件甚至不能装入。
[下一张幻灯片:
软件安装提示]
软件安装提示在标准Office2000安装程序中提供MS查询,使在Excel中使用数据透视表和数据透视图的用户创建和打开连接。
对于打开其他用户创建的Excel工作簿数据透视图和数据透视表的用户来说,不需要MS查询。
这样的连接信息,一旦在MS查询中创建,便会存储中Excel文件中。
[下一张幻灯片:
OLAP数据源选项]
Office2000组件支持对两种类型的OLAP数据源的连接:
OLAP服务提供者和脱机多维数据集文件(通常使用.cub作为文件扩展名)。
OLAP服务提供者既可以是MicrosoftOLAP提供者,也可以是第三方OLAP提供者。
对于MicrosoftOLAP提供者,Office2000组件包含了数据源驱动程序和客户软件,用于访问由MicrosoftSQLServerOLAP服务创建的数据库。
对于第三方OLAP提供者,需要安装额外的驱动程序和客户软件,以便使用Excel数据透视表(PivotTable)和数据透视图(PivotTable)特性。
这些第三方产品必须遵守OLE-DBforOLAP标准,并且与Office相兼容。
第二类数据源是脱机多维数据集文件,它包含OLAP数据或有限多维数据集文件。
下一张幻灯片中有关于这个选项的更多信息。
[下一张幻灯片:
关于脱机多维数据集文件]
通过使用Excel2000数据透视表(PivotTable)和数据透视图(PivotChart),可以从OLAP服务器数据库访问数据,你可以创建自己的脱机多维数据集文件,它包含OLAP服务器数据源的子集或全部数据。
即使从网络断开或服务器不可用,这个本地.cub文件允许你继续使用数据。
在创建.cub文件后,在服务器数据库改变时,你可以对它进行更新,并且在任何时候,你都可以在文件和服务器数据库之间切换连接方式(假设你已经连接到网络)。
你不必为使用脱机多维数据集文件创建单独的数据源,但是如果你将脱机多维数据集文件保存在一个共享网络位置上,其他用户可以创建数据源来访问这个文件,并且基于它产生报表。
我将在第一个演示中介绍如何创建脱机多维数据集文件。
[下一张幻灯片:
创建一个数据源]
对于任意一个OLAP数据源选项,你都可以使用Microsoft查询创建它的一个连接。
数据源提供Excel连接到OLAP数据库或.cub文件所需的必要信息,包括它的名称和位置、使用的驱动程序以及数据库所需的所有额外信息。
你可以使用数据透视表(PivotTable)和数据透视图(PivotChart)向导创建数据源,或是在Microsoft查询中创建数据源,并且当在Excel中创建视图时使用该数据源。
当创建一个数据源时,需要说明是访问一个OLAP数据库数据库,还是一个脱机多维数据集文件。
同样,在第一个演示中我们将看到如何进行这些工作。
[下一张幻灯片:
数据透视表与OLAP数据源的交互作用]
在Office2000中,数据透视表(PivotTable)功能可以直接与MSOLAP服务数据库一起工作。
这意味着整个数据集不必再通过网络全部发送到本地工作站,被用户格式化为数据透视表结构,并且当数据改变时被完全更新。
当选择数据进行分析时,工作站上的数据透视表(PivotTable)服务创建一个MDX查询,接着它被发送到OLAP服务器并执行,之后只有这个查询的结果返回到工作站。
特别是与数据仓库这种规模的数据库一起工作时,极大地改善了性能,。
[下一张幻灯片:
今天的演示情景]
在这个讲座中,我将做三个演示。
在第一个演示中,Northwind的销售代表需要分析公司的销售数据,并且在他们的旅程中携带这些数据。
在第二个演示中,整个Northwind公司对数据仓库越来越感兴趣。
同时因为这是大多数成功数据仓库项目中的典型。
现在IT部门需要提供对OLAP数据库广泛、安全的访问。
第三个演示,由于大多数对数据仓库所做的工作发生在向用户提供数据之前。
我将简要介绍一下创建一个OLAP数据库的过程。
这仅仅是一个概述。
在这个演示文稿的最后,我将提供一些值得参考的额外信息来源。
[下一张幻灯片:
演示1]
要理解什么是数据透视表(PivotTable),以及它如何从OLAP数据库中展现数据,最简单的方法是实际地进行操作。
在第一个演示中,Northwind销售部门中的用户需要分析公司的销售数据,以便改进他们的工作效率。
IT部门已经使用MSOLAP开发了一个OLAP数据库,并且指导用户如何使用Excel2000数据透视表和数据透视图特性来浏览和研究其中的数据。
我们现在进行第一个演示。
在这个演示中,我使用Excel2000来连接一个OLAP数据源,浏览多维数据集信息,并将多维数据集数据存储到一个脱机.cub文件中。
首先,我使用Excel中的数据透视表和数据透视图报表向导来连接到OLAP服务器,并在工作簿中创建数据透视表结构。
在数据菜单上,我选择数据透视表和图表报告。
在“请指定待定分析数据的数据源类型”下面,单击外部数据源,之后单击下一步。
在向导的第2步中,Excel需要知道数据所在的位置。
单击获取数据按钮。
此刻,如果尚未安装MS查询,则它将开始安装。
因为我已经安装过了,所以我们可以继续。
我选择OLAP多维数据集选项卡。
接着选择新数据源并单击确定。
在第一栏中,我将输入数据源的名称,在这个例子中,我选用的名称是“NorthwindSalesCubes”。
在OLAP提供者一栏下,选用OLAPProviderforOLAPService,并单击连接。
在这个例子中,我将输入服务器名称。
如果你注意一下的话,会发现这里还有一个CubeFile选项。
稍后我们将使用它连接到一个脱机多维数据集。
在这个例子中,我们将连接到一台处于活动状态的服务器。
接下来我们将选择希望从中获取数据的数据库。
我们将使用Northwind_OLAP数据库并单击完成。
在Northwind_OLAP数据库中存在两个多维数据集,我们将使用这个连接,建立到名为Sales的多维数据集的连接。
单击确定,现在,我们已经建立了连接。
单击下一步。
现在屏幕询问我们是要创建一个新的工作表,还是使用一个已经存在的工作表来存放多维数据集,我们直接单击完成。
在这里我们可以看到数据透视表。
此刻,我已在工作簿中定义了一个到OLAP服务器数据源的数据透视表连接,并且将使用该连接的数据透视表放置在这个工作表上。
这里是数据透视表工具栏,它对选择和操纵工作区中数据提供访问工具。
数据透视表工具栏还显示了一个可用数据的列表,以便将这些数据拖放到数据透视表工作区上。
现在我将选取放置于数据透视表工作区上的数据。
我们将顾客放到过滤区域。
选择时间并将其拖到行区域。
选择顾客并将其拖到列区域。
此刻,没有数据显示出来,因此让我们选择一个度量,从图片中可以看到这些是维信息,并且可以看到这里是一些度量。
我们将选择行项目汇总并将其拖到数据或数据透视表的度量段中,此时,建立了一个查询,它访问OLAP数据源并返回数据。
现在我将格式化这个报表,以便创建一个更易于管理的报表。
在这个例子中,我单击格式按钮,选择报表类型-4,确定。
正如你所看到的那样,产品这一列移到了左边。
在这个例子中,我有一个额外的偏爱,想将年份从列中移走,因此选择它。
现在,我们可以看到所有数据显示在一个格式化过的报表中。
此外,关于行项目汇总的数据没有显示为货币类型。
我想将它变为货币类型。
选择行项目汇总,在数据透视表菜单中选择字段设置。
按数据按钮,选择货币,将负数改为红色并单击确定,再次单击确定。
你会看到此数据透视表中的所有数字都变成了货币格式。
现在,我将保存这个文件,以便我们可以在后面的演示中使用它。
我将把它另存为Northwind.xls。
保存Excel工作簿的操作同时保存了多维数据集的连接信息,以及所执行的格式操作,但是它并不保存数据。
数据是从OLAP数据源中动态、交互地查询出来的。
现在我将继续深入下去,获取更多关于1997年每个季度的详细信息。
为了做到这一点,我单击年份选项卡,通过两次单击取消对’96的选择,并双击’97。
我可以展开它,并且再次重复这个操作,你可以看到所发生的现象。
通过单击获取’97年,通过双击获取各个季度。
选择确定,此时’97年、’96年和’98年的信息已经消失。
并且’97年的信息按季度分开。
接下来我将查询销售数据,以便回答一些更多的问题。
一个问题是,“1997年11月在美国谷类作物和食品的销售情况如何?
”,我们可以从这里看到谷类作物和食品的信息,但是此处显示的是所有客户的信息。
而我仅想选取在美国的情况。
在这个例子中,我可以前往过滤区域,展开所有客户,选择美国,并单击确定。
我需要的是’97年11月的数据,因此,我可以双击第四季度,此时,可以看到’97年11月的销售额是1992美元。
下一个我要问的问题是“’97年第一季度糖果销售的情况与’98年同期相比如何?
”,这次我们将通过一个稍有不同的方法来完成这个工作。
我们将向下选择一年,同样,我们将展开’97年和’98年。
因为只想看到每一年的第一个季度,我们将取消对每一年中其它季度的选择并单击确定。
在本例中,可以看到对于糖果来说,’97年第一季度的销售额为5387美元,而1998年第一季度的销售额为10134.20美元。
现在,我想产生一个数据透视图,以显示每个特定客户的销售情况。
我将回到原先的情况,并显示我们如何对所有客户进行这个工作。
单击确定。
选择数据透视表区域中的一个单元格,之后单击图表按钮,就创建了一个数据透视表中数据的图表。
我想要重新格式化这个图表。
右键单击并选择图表类型。
在本例中,我选择一个聚簇列并单击确定。
我们曾提到过想要显示一个特定客户,在本例中,我们挑选Belgium(比利时),之后可以看到在比利时的销售情况以及不同产品的种类。
对这个图表剩下的工作类似于我们刚刚所看到的。
我们不再需要查看’97年各季度的所有销售数据。
让我们回来看一看数据透视表和工作表,可以看到,我们在图表中对所使用的列和维的改变已经反映到数据透视表和工作表中了。
我要向你们显示的下一个特性,是如何创建一个本地多维数据集(Cube)文件。
在这个过程中,我使用数据透视表组件,将多维数据集的一个片断保存在本地硬盘上。
这个工作允许我在旅程中携带数据,并且当我回来并重新连接到网络后,可以用最新的数据刷新多维数据集。
在数据透视表工具栏上单击数据透视表菜单,并选择客户/服务器设置菜单项。
在弹出的对话框中,单击创建本地数据文件按钮。
单击下一步。
在这里,我们选择维信息以及在所选维中的级别。
在本例中,你可以看到客户没有使用粗体,并且所有维信息中没有一个使用粗体。
我想要做的是获取关于所有客户的信息,因此单击客户使其变为粗体,你可以看到所有客户都已选中。
对于雇员,我不需要任何有关他们的信息。
但我需要所有的产品信息,因此同样单击产品以使其加粗显示。
发货人,我不关心。
但对于时间,我需要自始至终使用以天为单位的时间信息。
单击下一步。
在本例中,我们将选择的下一个内容,是将要包含到脱机多维数据集中的数据范围。
在本例中,我想要包含所有度量。
我想要包含所有国家的数据,全部的产品种类都已选中,并且对于年份来说,我想获得所有年份的数据。
单击下一步。
系统将提示我输入一个名称,然后单击完成。
现在,我们就创建一个用于在旅途中携带的脱机多维数据集文件。
一旦你创建了一个多维数据集,实际的工作表将指向多维数据集而非OLAP数据源。
所有的操作都将与我们前面看到的一样。
我们可以在一个季度上双击。
你可以看到本例中执行的操作与前面是类似的。
然而,如果你拥有一个非常庞大的数据库,你会发现操作所涉及的数据范围只限于脱机多维数据集中的数据。
我们将关闭这个工作表并创建一个新的。
在本例中,我会向你们介绍如何连接到刚刚创建的脱机多维数据集。
前往数据菜单,单击数据透视表和数据透视图菜单项,选择外部数据源,单击下一步。
这个起始操作看起来很熟悉。
单击OLAP多维数据集。
你会看到前面所创建的指向OLAP数据库的数据源。
本例中,我们将创建一个指向脱机多维数据集文件的新数据源。
我们把它叫做“我的本地销售信息多维数据集(MyLocalSalesCube)”。
同样,我们选用OLAPproviderforOLAPservices并单击创建连接。
这里,我们将单击多维数据集(Cube)文件单选框,单击省略号进入文件浏览模式。
选择我刚刚创建的SalesCube文件。
单击打开,并单击完成。
单击确定,单击确定,单击完成。
在这里,我们可以看到针对我们前面看到的多维数据集文件的连接。
因为我在前面的操作中少选了几维,所以,可以看到雇员和发货人这两维信息没有显示在这里。
同样可以注意到这里少了一个度量。
这是因为前面所使用的一个度量是计算度量,而计算度量此刻并不包含在.cub文件中。
同样,所有的数据都以相同的方式工作,本例中,我们将选择行项目数量。
可以看到随着时间变化不同客户订购项目的数量。
正如你所看到的那样,我现在正连接到一个本地多维数据集文件并进行脱机工作。
我可以继续使用当前数据进行工作,并且当再次联机后,我可以重新连接到OLAP服务器并刷新数据。
这种刷新既可以是下拉一个与当前多维数据集定义和本地多维数据集相匹配的数据集,也可以是使用数据透视表组件重定义本地多维数据集的连接。
演示1到此为止。
[回到幻灯演示:
数据透视表(PivotTable)选项——OLAP]
当一个数据透视表连接到OLAP数据源时,‘使用表格布局保存数据’特性将不可用。
这是因为,像前面规定的那样,数据放置在OLAP服务器上。
只有数据查询的结果返回到工作站。
‘打开时刷新’功能是可用的,并且当其缺省设置是不可用时,你可能需要建议用户启用这个功能,以保证他们所看到的是最新数据。
‘保存密码’功能缺省是启用的。
根据公司的安全策略,你可能需要指导用户禁用‘保存密码’功能。
该功能设置位于数据透视表选项的外部数据选项中。
其使用的密码以未加密的形式存储于Excel工作簿中。
[下一张幻灯片:
数据透视表(PivotTable)选项——非OLAP]
作为一个注意事项——尽管我今天并未演示,非OLAP数据亦可使用数据透视表和数据透视图特性进行访问。
当使用外部非OLAP数据源进行工作时,用户有两个关键的相关选项需要设置。
一个是:
将所访问到的数据保存在工作簿文件中(缺省值),或交互的访问数据源。
另一个是:
在请求时刷新数据(缺省值),或在每次打开工作簿时刷新数据。
缺省数据为大数据集提供了最佳的性能。
然而,如果数据集比较小,或者需要在界面中使用“活的”数据,那么,在数据透视表选项对话框中改变这些选项的设置将产生积极的影响。
同样,对于非OLAP数据源而言,最好不要选中保存密码选项,因为它在Excel工作簿中以未加密的形式存储。
[下一张幻灯片:
NT集成的安全性]
OLAP仅使用NT集成的安全性。
在Excel工作簿的共享和邮寄方式中,向其他用户发送的只是数据透视表和数据透视图的视图及连接信息,而非低层数据。
没有访问权限的用户将不能看到数据。
脱机.cub文件则没有这种保护——然而,他们可以放置在限制文件访问的文件服务器上。
或者,使用Windows2000时,文件可以进行加密。
[下一张幻灯片:
最佳的性能]
OLAP数据源为大型或频繁刷新的数据集提供最佳的性能。
请记住,当与OLAP服务进行交互时,数据并不下载到工作站。
数据透视表服务创建一个MDX查询,并发送到OLAP服务器。
只有查询结果才返回到工作站。
这与大多数非常优秀的客户/服务器应用程序的操作在结构上是相同的。
当使用一个非OLAP数据源时,整个数据集会下载到工作站上。
如果你正在使用非OLAP数据源,并且下载和刷新的时间开始变得无法忍受,那么你或许应当考虑将数据移植到一个OLAP数据源当中。
其次,当在MS查询中连接一个数据源时,OLAP服务提供者给你访问权限,使你可以访问OLAP数据库或脱机多维数据集文件中所有数据。
其结果是,当你在MS查询中连接一个数据源时,你不必选取和链接数据。
所有数据都是完全可用的并且已为你链接好了。
第三,脱机多维数据集文件不使用NT安全性。
应将它们放置在文件服务器上,并限制对它们的共享访问。
此外,建议用户在提供对包含公司数据的脱机多维数据集的访问权限时要加倍小心。
[下一张幻灯片:
快速问答]
现在,让我们做一个快速问答。
MS查询的用途是什么?
连接OLAP数据的多维数据集。
为什么通常情况下OLAP数据源能够为大型或频繁访问的数据集提供更好的性能?
它们使用客户/服务器结构,并且仅返回用户所选取的数据。
[下一张幻灯片:
Office2000——OfficeWeb组件]
现在我来介绍Office2000中的OfficeWeb组件。
[下一张幻灯片:
OfficeWeb组件]
OfficeWeb组件——包含在Office2000中并且与其它Office应用程序类似,但它在Internet环境中执行操作。
OWC组件包括:
电子表格组件是Excel电子表格的一个微缩版本,它包含完整的电子表格用户界面和再计算引擎,其中再计算引擎支持几乎Excel2000中所有的计算函数。
数据透视表组件设计用于提交交互式数据报告和分析,它提供Excel数据透视表和外部数据的全部功能。
它既可以从通过OLEDB连接的关系数据库中检索数据,也可以从通过OLEDBforOLAP连接的OLAP服务器多维数据集或.cub文件中检索数据。
图组件算得上一个微缩版的Excel图表,它支持Excel2000中大多数二维图表类型和极图(Polarchart)类型。
另一个显著特性是图控件可以一次显示许多小图表,它允许你创建一个小规模的多重设计——换言之,一组有一个属性不同的小图表的集合——并且只要看一眼便可对它们进行比较。
图可以是绑定到电子表格、数据透视表控件或ActiveX数据对象(ADO)记录集上的数据,也可以直接用数值填充。
当绑定到数据源后,无论何时,一旦数据源改变,图控件将会进行更新。
数据源组件是需要从外部数据源获取数据的控件的中枢。
虽然这个控件是不可见的,它广泛用于检索数据、在分层结构或临时OLAP多维数据集中操纵数据,以及在不同的控件间建立数据绑定。
由于它支持与InternetExplorer和VisualBasic中的其它数据源控件相同的标准接口,因此,它可以与那些环境实现交互操作。
今天的演示将示范数据透视表(PivotTable)和图(Chart)组件的使用。
[下一张幻灯片:
演示2]
演示2中,出于对Northwind公司中不断增长的OLAP数据的关注。
IT部门需要广泛、便捷、安全地提供对OLAP数据库的访问。
解决方案——使用Web发布OLAP数据的数据透视表(PivotTable)及图(Chart)视图。
让我们切换到演示电脑上。
为了使我所创建的数据透视表更容易被其他用户访问,我可以将它发布到Web上。
当进行这一工作时,我们会使用OfficeWeb组件创建一个Web数据透视表,其呈现数据的方法与我们在Excel中所看到的大致相同。
为了演示这个操作,我将使用我们在前面创建的数据透视表Northwind.xls。
选择数据透视表,工作表中图表所在的区域。
在文件菜单上,选择另存为Web页。
本例中,我们想要得到独立的表单。
我们希望数据透视表的可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 如何 数据仓库 使用 Microsoft 特性
![提示](https://static.bdocx.com/images/bang_tan.gif)