BI工具调研报告Word文档格式.docx
- 文档编号:16443819
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:13
- 大小:39.08KB
BI工具调研报告Word文档格式.docx
《BI工具调研报告Word文档格式.docx》由会员分享,可在线阅读,更多相关《BI工具调研报告Word文档格式.docx(13页珍藏版)》请在冰豆网上搜索。
1.4.6系统开放性8
2.数据挖掘8
2.1主要功能8
2.2常见算法及模型9
2.3各厂家产品对比9
2.4一般实施步骤11
2.5统一模型11
2.6应用现状12
2.7可能存在的问题12
1.数据分析
1.1四种前端工具
BI前端应用主要为报表、OLAP以及仪表盘、Portal四种。
(1)报表
报表的前端主要是面向设计者和浏览者,因此一般报表产品也都会将设计器和浏览器分开。
CrystalReport、CognosReportNet、HyperionBrio莫不如此。
业界一直流行一个观点——国内的报表非常复杂。
国外的报表工具在前些年似乎并不适应这种中国式报表,因此也就有了中国本土报表工具的生存之地,诸如润乾、华表等。
当然,随着国内企业管理的完善,决策层面对报表的需求也在规范,因此,不论是国外或是国内报表工具,其架构都在趋同。
(2)OLAP
如果说报表还称不上BI的典型应用的话,那么OLAP就当仁不让了。
OLAP的前端主要是将用户的多维分析请求提交给OLAP服务器,并展现返回的数据。
这里的多维分析请求主要包括钻取、切片、旋转等操作。
在电信行业大规模展开经营分析系统的建设初期,曾经对这项应用寄予很大期望的,不过似乎它不怎么争气。
目前已经有标准化组织或企业在定义OLAP前端与服务器数据交换的标准,例如微软、Hyperion、SAS推进的XML,还有基于JAVAAPI的JOLAP。
因此,微软刚收购的ProClarity工具和Hyperion的Brio在OLAP展现上朝这种开放式体系发展也就顺理成章了。
(3)仪表盘
仪表盘这种前端展现形式随着绩效管理软件的兴起正在流行起来,其界面非常简单,非常适合决策者一目了然了解宏观信息。
目前主流的BI厂商BO、Cognos、Hyperion、SAS都有自己的CPM(CorporatePerformanceManagement)产品,当然还有称BPM或EPM的(Business/EnterprisePerformanceManagement)。
这种应用主要是向用户展示绩效指标的状态、进度完成情况,提供异常告警等功能。
可以说这些前端功能都不复杂,主要的难点还是在于绩效指标的定义以及管理流程的规范上面。
(4)Portal
1.2C/SvsB/S
在早期PC机功能尚弱的年代,服务器的计算能力强大,客户端只能做很少的事情;
后来,PC机功能逐渐强大,桌面系统的应用变得丰富起来,C/S体系也逐渐成熟;
到了90年代,三层结构又逐步取代C/S结构,Web应用大行其道,因为其“零客户端”的部署而备受宠爱;
最近几年,AJAX技术出现,应用计算似乎又重新偏向客户端。
在整个软件体系的变迁中,BI产品的前端也跟随这个大趋势。
如今,几乎每个产品都有自己的Web应用,甚至有些产品出现了将所有的应用前端都转成Web界面的趋势。
例如BO,它的报表设计器可以就可以实现在Web上设计报表。
当然,并非所有人都欢迎这种趋势,因为对于决策者,他们希望看到结果,并不需要太多交互,就比较看重界面的简洁;
而对于分析师、设计师来说,他们需要的是功能丰富的客户端,方便操纵数据,定制提供给决策者的界面,因此对于报表设计师来说,Web应用倒觉得有些不爽,因为不如传统C/S客户端那样便捷。
1.3各家产品简介
1.3.1IBM
IBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:
VisualWarehou(VW)、Essbase/DB2OLAPServer5.0、IBMDB2UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。
Sybase提供的数据仓库解决方案称为WarehouseStudio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。
VisualWarehouse(VW)、Essbase/DB2OLAPServer5.0、IBMDB2UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。
其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。
Essbase/DB2OLAPServer支持“维”的定义和数据装载。
Essbase/DB2OLAPServer不是ROLAP(RelationalOLAP)服务器,而是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2UDB数据库中。
严格说来,IBM自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。
例如,它的前端数据展现工具可以是BusinessObjects的BO、Lotus的Approach、Cognos的Impromptu或IBM的QueryManagementFacility;
多维分析工具支持ArborSoftware的Essbase和IBM(与Arbor联合开发)的DB2OLAP服务器;
统计分析工具采用SAS系统。
1.3.2Oracle
Oracle数据仓库解决方案主要包括OracleExpress和OracleDiscoverer两个部分。
OracleExpress由四个工具组成:
OracleExpressServer是一个MOLAP(多维OLAP)服务器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;
OracleExpressWebAgent通过CGI或Web插件支持基于Web的动态多维数据展现;
OracleExpressObjects前端数据分析工具(目前仅支持Windows平台)提供了图形化建模和假设分析功能,支持可视化开发和事件驱动编程技术,提供了兼容VisualBasic语法的语言,支持OCX和OLE;
OracleExpressAnalyzer是通用的、面向最终用户的报告和分析工具(目前仅支持Windows平台)。
OracleDiscoverer即席查询工具是专门为最终用户设计的,分为最终用户版和管理员版。
在Oracle数据仓库解决方案实施过程中,通常把汇总数据存储在Express多维数据库中,而将详细数据存储在Oracle关系数据库中,当需要详细数据时,ExpressServer通过构造SQL语句访问关系数据库。
但目前的Express还不够灵活,数据仓库设计的一个变化往往导致数据库的重构。
另外,目前的Oracle8i和Express之间集成度还不够高,Oracle8i和Express之间需要复制元数据,如果OracleDiscoverer(或BO)需要访问汇总数据,则需要将汇总数据同时存放在Oracle和Express中,系统维护比较困难。
值得注意的是,刚刚问世的Oracle9i把OLAP和数据挖掘作为重要特点。
1.3.3Sybase
其中,WarehouseArchitect是PowerDesigner中的一个设计模块,它支持星形模型、雪花模型和ER模型;
数据抽取与转换工具包括PowerStage、ReplicationServer、CarletonPASSPORT,PowerStage是Sybase提供的可视化数据迁移工具。
AdaptiveServerEnterprise是Sybase企业级关系数据库,AdaptiveServerIQ是Sybase公司专为数据仓库设计的关系数据库,它为高性能决策支持系统和数据仓库的建立作了优化处理,SybaseIQ支持各种流行的前端展现工具(如CognosImpromptu、BusinessObjects、BrioQuery等);
数据分析与展现工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等,PowerDimensions是图形化的OLAP分析工具,它支持SMP和多维缓存技术,能够集成异构的关系型数据仓库和分布式数据集市,从而形成单一的、新型的多维模式;
数据仓库的维护与管理工具包括WarehouseControlCenter、SybaseCentral、DistributionDirector,其中WarehouseControlCenter是为数据仓库开发人员提供的元数据管理工具。
Sybase提供了完整的数据仓库解决方案QuickStartDataMart,具有良好的性能,并支持第三方数据展现工具。
从QuickStartDataMart的名称不难看出,它尤其适合于数据集市应用。
另外,Sybase可以提供面向电信、金融、保险、医疗保健这4个行业的客户关系管理(CRM)产品,在这4个产品中,有80%的功能是共性的,有20%的功能需要Sybase与合作伙伴针对不同需求共同开发。
1.3.4Informix
Informix于1998和1999年相继收购了国际上享有盛誉的数据仓库供应商RedBrickSystem和数据管理软件供应商Ardent,并提供了完整、集成的数据仓库解决方案。
该解决方案还包括一个“快速启动”咨询服务,能够帮助用户快速完成数据仓库或数据集市的开发。
Informix产品能够集成MicrosoftIIS或NetscapeEnterprise/FastTrack服务器,从而支持基于Web的数据仓库应用。
Informix没有提供自己的报表和数据挖掘工具,但他们与Brio和SAS公司建立了战略联盟,并推出了“Informix商务智能联盟计划”。
该计划以Informix为主,结合Brio的前端数据分析和报表功能,以及SAS的数据挖掘功能,形成了一个“BI中心”打包方案。
(今年4月InformixSoftware已被IBM公司收购,此举将给IBM公司数据库及数据仓库产品,从技术和市场占有率上带来极大的提升。
)
1.3.5CA
CA于1999年收购了PlatinumTechnology公司后,得到了完整的数据仓库解决方案,包括:
Erwin数据仓库设计工具、InfoPump数据转换与抽取工具、InfoBeaconROLAP服务器、Forest&Trees前端数据展现工具、Provision系统监视与作业调度工具和DecisionBase元数据管理工具等。
与Informix解决方案相似,CA解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、基于关系数据库的在线分析服务器、系统监视与作业调度、前端数据展现等功能,同时还支持Web应用。
不同之处是Informix提供了专门为数据仓库设计的高性能目标数据库(RedBirck),而CA解决方案则提供ODBC接口,并将数据存储在第三方关系数据库(如Oracle、Sybase、SQLServer、Informix和IBMDB2等)中,其性能要打一些折扣,但开放性要好些。
另外,CA的OLAP服务器目前只能与Microsoft的IISWeb服务器集成。
1.3.6NCR
NCRTeradata是高端数据仓库市场最有力的竞争者,主要运行在NCRWorldMarkSMP硬件的Unix操作系统平台上。
1998年,该公司也提供了基于WindowsNT的Teradata,试图开拓数据集市(DataMart)市场。
总的来看,NCR的产品性能很好,Teradata数据仓库在100GB、300GB、1TB和3TB级的TPCD指标测试中均创世界纪录。
但是,NCR产品的价格相对较高,中小企业用户难以接受。
1.3.7Microsoft
Microsoft将OLAP功能集成到MicrosoftSQLServer7.0中,提供可扩充的基于COM的OLAP接口。
它通过一系列服务程序支持数据仓库应用。
数据传输服务DTS(DataTransformationServices)提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与MicrosoftRepository集成,共享有关的元数据;
MicrosoftRepository存储包括元数据在内的所有中间数据;
SQLServerOLAPServices支持在线分析处理;
PivotTableServices提供客户端OLAP数据访问功能,通过这一服务,开发人员可以用VB或其他语言开发用户前端数据展现程序,PivotTableServices还允许在本地客户机上存储数据;
MMC(MicrosoftManagementConsole)提供日程安排、存储管理、性能监测、报警和通知的核心管理服务;
MicrosoftOffice2000套件中的Access和Excel可以作为数据展现工具,另外SQLServer还支持第三方数据展现工具。
1.3.8SAS
SAS公司在20世纪70年代以“统计分析”和“线性数学模型”而享誉业界,90年代以后,SAS公司也加入了数据仓库市场的竞争,并提供了特点鲜明的数据仓库解决方案,包括30多个专用模块。
其中,SAS/WA(WarehouseAdministrator)是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现等;
SAS/MDDB是SAS用于在线分析的多维数据库服务器;
SAS/AF提供了屏幕设计功能和用于开发的SCL(屏幕控制语言);
SAS/ITSV(ITServiceVision)是IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等。
SAS系统的优点是功能强、性能高、特长突出,缺点是系统比较复杂。
1.3.9BO
BusinessObjects(BO)是集查询、报表和OLAP技术为一身的智能决策支持系统。
它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种数据库,同时它还支持基于Web浏览器的查询、报表和分析决策。
虽然BO在不断增加新的功能,但从严格意义上说,BO只能算是一个前端工具。
也许正因为如此,几乎所有的数据仓库解决方案都把BO作为可选的数据展现工具。
虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止,国内基本上没有成熟的数据仓库解决方案。
1.3.10Hyperion
HyperionEssbaseOLAPServer,在上面有超过100个的应用程序,有300多个用Essbase作为平台的开发商。
具有几百个计算公式,支持过程的脚本预言,及统计和基于维的计算。
强大的OLAP查询能力,利用EssbaseQueryDesigner,商业用户可以不用IT人员的帮助自己构件复杂的查询。
广泛的应用支持,可以扩展数据仓库和ERP系统的价值,建立对电子商务、CRM、金融、制造业、零售和CPG(consumerpackagedgoods)等应用的分析程序。
Speed-of-Thought的响应时间,支持多用户同时读写Web-Enabled的,以服务器为中心的体系结构,支持SMP强大的合作伙伴提供完整的解决方案,60多个包装好的解决方案,300多个咨询和实施公司。
丰富的前端工具,有30多个前端工具可供选择,其中包括Hyperion自己的WiredforOLAP、Spider-ManWebApplication、Objects、EssbaseSpreadsheetAdd-In、WebGateway、Reporting。
HyperionEnterprise,为跨国公司提供的财务整合、报告和分析的解决方案。
有3000多家组织在使用此套系统。
功能丰富:
支持多种财务标准USGAAP,CanadianGAAP,UKGAAP,国际会计标准(ISA),FASB,HGB。
分公司间交易的自动平帐。
FAS52货币转换。
FAS94。
易用:
可通过Excel,Lotus1-2-3和各种浏览器访问系统。
支持公司结构的调整。
跨国公司的支持:
同时支持6种语言及各个不同国家的法律和税收要求。
完整的过程控制和审计跟踪,及安全等级的设置。
能与ERP或其他数据源集成
HyperionPillar,预算和计划工具。
全球用户超过1500家,提供基于活动的预算,基于项目的计划,集中式计划,销售预测和综合计划。
分布式体系结构。
详细计划的制订,允许一线经理制订详细的计划。
复杂的建模和分析能力
1.4各家产品比较
1.4.1特色工具
(1)Cognos&
Microstratagy
在评比中我们发现Cognos与Microstratagy的产品线较齐全,既有前端展示功能,又有后端数据分析与挖掘功能,二者都能够提供比较集成化的方案。
Cognos数据处理速度更快一些,且在预算与规划方面造诣颇深;
而Microstratagy在OLAPServer上的优势使其在处理大数据量数据方面更出色。
由于Cognos早在1969年就已成立,比其他3家都要早20年,这也决定了他们在技术架构上的差异。
不过,Cognos最新的Series7Version2系列产品是三层构架的BPM和BI工具系统。
它的OLAP分析工具PowerPlay,报表制作工具ReportNET以及门户工具Upfront都是完全支持B/S构架的,可以在浏览器里面进行报表定义、DrillUp、DrillDown等操作,而且客户端无须安装任何控件。
服务器软件支持.NET和J2EE两个版本,具有良好的跨平台特性。
(2)BO&
Brio
BO与Brio都是在前端展现方面比较突出,用户接受程度较高。
但二者均无OLAPServer,导致数据监控功能较弱,虽然也可以与微软或Oracle的OLAPServer挂接,但这样毕竟受制于人,给客户提供的方案也不是最集成的。
正是因为这个原因,海波龙才认为对Brio的收购是前端与后端的最完美的结合(不过由于缺少数据挖掘这部分功能,他们所谓的完美似乎也有些牵强)。
1.4.2成本比较
单纯从成本角度考虑,微软的产品算是最能节省成本的,Cognos和MicroStrategy则在同一水平线,都比微软贵一些。
而Hyperion(Essbase)产品比较独立,也曾占有美国OLAP市场最大的份额,其产品价格又要更高一些。
1.4.3市场份额比较
从市场份额来看,就国外的市场报告分析,微软、Cognos、Hyerion三家占据主流。
在国内,目前还没有权威的市场报告,如果仅从所接触到的项目来看的话,用Cognos的很多,买Essbase的也不少。
这些年都是一些大企业建设BI项目,有足够的预算,多选用Cognos、Essbase;
而Microstrategy,进入中国不算早,这几年在政府、金融行业也颇有建树。
若论开发应用,微软的产品向来以友好的用户界面著称,上手迅速。
在OLAP产品上,微软依然发扬了这一优良传统,并有进一步标准化的趋势,开发了OLEDBforOLAP以及MDX(Multi-DimensionalExpress多维表达式);
参与XMLA(XMLforAnalysis)规范制定,也是想作为OLAP服务器和前端分析应用的数据传输标准。
1.4.4简单与复杂
而Cognos以桌面OLAP开始,一直以轻便、快捷的操作闻名。
所谓桌面OLAP,是可以用客户端将cube下载到本地进行访问。
虽然Poweplay早已演变成C/S结构的OLAP服务器,但其轻便的特点还是延续下来,而且提供可以简洁部署且具有交互性的PowerPlayWebExplorer界面。
从互联网上,我们可以很快搜索出许多基于PowerPlayWeb的分析应用。
Essbase作为老牌的OLAP服务器,是一个比较复杂的产品。
所谓复杂,有两层意思,一是提供了丰富的API,让你可以充分定制开发;
二是开发的难度较大,部署起来不容易。
这也是国内很多用户难以将这个产品用好的一大原因。
比较Essbase和Powerplay,会发现截然相反的两个特点:
Essbase的复杂和Powerplay的简洁。
对于这两者,单独说哪一种更好都不够客观,因为当你抱怨Essbase繁杂的接口时,也有人在抱怨Powerplay的定制功能怎么如此之少。
这种情形其实跟这两种产品的定位有关,Essbase比较专注于高性能的多维存储服务,而Powerplay则更专注于快捷的多维访问。
换句话讲,Essbase之于Powerplay正像专业相机之于傻瓜相机,在选哪一个更好的问题上,不同的人肯定有不一样的答案。
当然,如果你想在找复杂和简洁之间找一个中间者,我想微软的AnalysisService就是这样的产品。
不过要注意的是,这个产品和SQLServer绑定得比较紧,这是微软的一贯策略。
1.4.5数据存储方式
根据多维数据存储的位置,OLAP一般分为MOLAP(Multi-DimensionalOLAP)和ROLAP(RelationalOLAP)两种,此外,还有混合的HOLAP(HybridOLAP)。
其中,Cognos的Powerplay、Hyperion的Essbase和微软的AnalysisService这些产品都是MOLAP产品。
.这类产品将数据从关系数据库(甚至是文本文件、Excel文件)中抽取出来,存储在自己的数据库中。
这种数据库跟平常我们所见的Oracle、DB2这类关系数据库不同之处在于,它是专有格式的,且没有标准的访问接口。
因此,这些产品如何实现多维存储也都不尽相同,大致的原理是以编程语言中多维数组的方式存放数据。
度量值存放在数组的单元格中,而数组每个维就对应一个维度,其中,维元素就维的坐标。
可以想象,多维数据库的单元格跟维度、维元素的多少有莫大关系,而随着维度增加,数据库也迅速膨胀。
因此,对于MLOAP产品,多维存储的存储空间、性能自然是比较关键的。
Essbase在这方面提供很多优化工作,但有时候也会显得过于复杂。
Powerplay也提供某些选项,诸如cube分区等,这是比较简单的优化方法。
1.4.6系统开放性
OLAP产品的核心功能是提供多维存储,另外就是能够将OLAP访问操作转换为对数据的请求并返回,这些OLAP访问操作大多是用户通过前端发出的,因此要考虑OLAP产品能够和哪些前端工具对接。
CognosPowerplay是个相对封闭的产品,它有自己的客户端和WebExplorer,你也甭想着用其他前端来访问它。
Hyperion和微软都采用开放式接口,提供丰富的访问API,第三方可以用这些API访问其数据库。
上文曾提到微软开发的MDX和参与的XMLA(XMLforAnalysis)规范,事实上,一些第
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BI 工具 调研 报告