知名厂商的数据库产品对比.docx
- 文档编号:24480963
- 上传时间:2023-05-27
- 格式:DOCX
- 页数:16
- 大小:25.77KB
知名厂商的数据库产品对比.docx
《知名厂商的数据库产品对比.docx》由会员分享,可在线阅读,更多相关《知名厂商的数据库产品对比.docx(16页珍藏版)》请在冰豆网上搜索。
知名厂商的数据库产品对比
数据仓库产品分析报告
目录
内容摘要2
关键字2
正文2
一、知名的数据仓库厂商介绍2
二、数据仓库产品对比2
2.1各数据产品家族对比2
2.2各厂商数据仓库产品列表3
2.3各产品优点对比6
2.4各产品应用提示8
三、DB2与Oracle的数据仓库技术对比9
3.1前言:
9
3.2技术对比:
10
四.结论:
12
五.参考文献:
12
内容摘要
数据仓库的实施是一个相当复杂的过程(包括:
数据仓库的设计建模、数据转换与集成、数据存储与管理、数据的分析和展现及数据仓库的维护和管理)。
并且每个行业都有自己的运行特点,都有自己特定的业务范围,都有自己特定的历史数据,所以企业在制定实施数据仓库解决方案时,不能盲目的选择产品供应商。
在建立数据仓库时,必须紧密结合本行业的特点和本企业的业务发展需求,参考产品提供商的技术特点和他们的成功案例,认真比较后再做出恰当的选择。
在这里主要给出了一些知名厂家的数据仓库产品。
通过对这些厂家的数据仓库产品的对比分析,找出适合我们应用的产品,对今后的学习和项目实践有着深刻的意义。
本文首先对大部分数据仓库产品进行套件和基本功能的介绍,然后根据数据仓库的任务、特点和应该具备的关键能力,重点对其中的两个产品Orcale和DB2的数据仓库技术在索引能力、数据分区、仓库管理器方面研究。
关键字
数据仓库,BusinessObjects、Oracle、IBM、Sybase、Informix、NCR、Microsoft、SAS、CA,DB2,索引能力、数据分区、仓库管理器
正文
一、知名的数据仓库厂商介绍
BusinessObjects,Oracle,IBM,Sybase,Informix,NCR,Microsoft,SAS,CA
二、数据仓库产品对比
2.1各数据产品家族对比
前言:
数据仓库产品大体上可以分为三类:
1.单点产品:
所谓单点产品是指仅局限于数据仓库方案实施中的一部分或某一特定功能,主要是作为第三方产品或者和其它公司的产品结合起来进行使用。
这类产品仅局限于数据仓库方案实施中的一部分或某一特定功能,主要是作为第三方产品或者和其它公司的产品结合起来进行使用。
比较有特色的是BusinessObjects。
2.提供部分解决方案的产品:
目前许多提供数据方案解决方案的供应商,并不能提供构建数据仓库的全部工具,它们还要结合第三方供应商提供的工具才能完成整个数据仓库的构建。
例如:
IBM、Oracle、Sybase、NCR、Informix、Microsoft等公司所提供的数据仓库产品都属于此类范畴。
3.提供全面解决方案的产品:
顾名思义就是有完整的数据仓库解决方案,它具有丰富的行业知识和经验,能够向用户提供完善的数据仓库构造咨询服务、全面的数据仓库产品系列。
下面分别对比各数据仓库产品工具。
2.2各厂商数据仓库产品列表
BusinessObjects
BusinessObjects
集成查询,报表和分析功能的工具
WebIntelligence
世界上第一个通过Web进行查询、报表和分析的决策支持工具
BusinessQuery
第一个可以在MicrosoftExcel中集成企业公共数据源中数据的工具
BusinessMiner
面向主流商业用户的数据挖掘工具,可以实现深入的分析用以发掘深层次的数据之间的关系。
Oracle
Oracle8I
数据仓库的核心
OracleWarehouseBuilder
集成数据建模、数据抽取、数据转移和装载、聚合、元数据的管理等功能。
OracleDeveloperServer
使企业级的应用系统开发工具,支持面向对象和多媒体,可同时生成Client/Server及Web下的应用,具有极高的开发效率及网络伸缩性。
OracleDiscoverer
是最终用户查询、报告、深入、旋转和WEB公布工具,能够帮助用户迅速访问关系型数据仓库,从而使他们作出基于充分信息的决策。
OracleDarwin
使基于数据仓库的数据挖掘工具,简单易用的图形化界面,提供决策树、神经网络等多种数据挖掘方法,支持海量数据的并行处理,分析结果可以和现有系统集成。
IBM
VisualWarehouse(VW)
一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。
Essbase/DB2OLAPServer
支持多维数据库,它是一个(ROLAP和MOLAP)混合的HOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2UDB数据库中。
QUEST
是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。
系统提供多种开采功能,开采算法可适用于任意大小的数据库。
Sybase
WarehouseArchitect
PowerDesigner中的一个设计模块,利用它数据集市或数据仓库设计者可以自动地对已有的关系数据库进行逆向工程,建立目标数据库设计、物理设计和DDL。
PowerStage、ReplicationServer、CarletonPASSPORT
数据抽取与转换工具
AdaptiveServerEnterprise
Sybase企业级关系数据库,它通过多线索体系、并行操作以及对系统的内存、处理器和磁盘资源使用进行控制等手段增强了资源利用率。
AdaptiveServerIQ
Sybase公司专为数据仓库设计的关系数据库
PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo
数据分析与展现工具
WarehouseControlCenter、SybaseCentral、DistributionDirector
数据仓库的维护与管理工具。
Informix
MetaCubeROLAPOption
基于Informix的数据仓库或数据中心提供了全面、简便易用、可扩展和自动化的商业分析环境。
InformixInfoMover
一套集成工具,用于从多个工作资源中抽取、转换和维护数据。
SeagateCrystalInfo
企业级报表、分析系统
IDS以及AD/XP选项
Informix数据仓库系统的核心,提供数据仓库数据的存储功能。
NCR
Teradata
NCR的Teradata是高端数据仓库市场最有力的竞争者,主要运行在NCRWorldMarkSMP硬件的Unix操作系统平台上,提供交互分析、标准报告和多维度分析。
为了开拓数据集市(DataMart)市场1998年,该公司也提供了基于WindowsNT的Teradata。
Microsoft
Sqlserver
通过一系列服务程序支持数据仓库应用
DTS(DataTransformationServices)
提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与MicrosoftRepository集成,共享有关的元数据
MicrosoftRepository
存储包括元数据在内的所有中间数据
SQLServerOLAPServices
支持在线分析处理
PivotTableServices
提供客户端OLAP数据访问功能,通过这一服务,开发人员可以用VB或其他语言开发用户前端数据展现程序,PivotTableServices还允许在本地客户机上存储数据
MMC(MicrosoftManagementConsole)
提供日程安排、存储管理、性能监测、报警和通知的核心管理服务。
SAS提供的工具包括30多个专用模块
SAS/WA(WarehouseAdministrator)
是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现等
SAS/MDDB
SAS用于在线分析的多维数据库服务器
SAS/AF
提供了屏幕设计功能和用于开发的SCL(屏幕控制语言)
SAS/ITSV(ITServiceVision)
IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等
CA
Erwin
数据库/数据仓库模型设计工具
DecisionBase
图形界面的元数据管理和数据转移工具
InfoPump
可编程控制的双向数据转移工具
InfoBeacon
OLAP服务器
Forest&Trees
DSS/EIS开发工具
Repository
企业环境下元数据的集中管理工具
ProVision
数据库性能和操作系统性能管理工具
2.3各产品优点对比
BusinessObjects
集查询、报表和OLAP技术为一身的智能决策支持系统。
使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种平台(所有Windows平台及Unix平台)和多种数据库(如Oracle、informix、Sybase、MicrosoftSQLServer、DB2、CA-Ingres、Teradata、RedBrick、FoxFro、dBase、Access等),同时它还支持Internet/Intranet,可以通过WWW进行查询、报表和分析决策。
Oracle
数据仓库解决方案包含了业界领先的数据库平台、开发工具和应用系统,它能够提供一系列的数据仓库工具集和服务。
它具有多用户数据仓库管理能力,多种分区方式,较强的与OLAP工具的交互能力,及快速和便捷的数据移动机制等特性。
IBM
提供了一套基于可视数据仓库的商业智能(BI)解决方案,具有集成能力强,高级面向对象SQL等特性。
Sybase
数据仓库解决方案以能够支持多种关系型数据库而受到业界推崇。
它能够同时处理几十个即席查询,其Bit_Wisc技术和垂直数据存储技术使系统只访问特定的少量数据,使得查询速度比传统的关系型数据库管理系统快100倍。
Informix
Informix公司日前发布了一个集成的、可伸缩的FastStart数据仓库解决方案,以使用户能快速而便捷地设计开发具有可伸缩性的数据仓库或数据集市。
采用ROLAP的星型模式与InformixIDS、IDS/AD紧密集成提供预先汇总、抽样、后台查询等性能优化手段。
Informix产品能够集成MicrosoftIIS或NetscapeEnterprise/FastTrack服务器,从而支持web访问。
Informix没有提供自己的报表和数据挖掘工具,它可以集成第三方产品(例如结合Brio的前端数据分析和报表功能,结合SAS的数据挖掘功能)。
informix并且向客户提供一套完整、使用的咨询服务包。
NCR
在长期的实践过程当中,形成了一套独特的数据仓库方法论和实施框架,这套理论被称为可扩展数据仓库(ScalableDataWarehouse,简称为SDW)。
NCR可扩展数据仓库的基本框架主要分成三个部分:
数据装载、数据管理和信息访问
Microsoft
公司的SQLServer2000已经在性能和可扩展性方面确立了世界领先的地位,是一套完全的数据库和数据分析解决方案,使用户可以快速创建下一代的可扩展电子商务和数据仓库解决方案。
将OLAP功能集成到MicrosoftSQLServer中,提供可扩充的基于COM的OLAP接口。
MicrosoftOffice2000套件中的Access和Excel可以作为数据展现工具,另外SQLServer还支持第三方数据展现工具。
SAS
在20世纪70年代以“统计分析”和“线性数学模型”而享誉业界,它提供的工具以统计分析见长。
加入了数据仓库市场的竞争后,它提供的工具(例如:
智能化的客户机/服务器,多厂商构架等)可以帮助企业实现一个灵活和低风险的处理。
可以支持各种硬件平台、支持不同数据库之间数据的存取,它还可对不同格式的数据进行查询、访问和分析,SAS具有与目前许多流行数据库软件和老的数据文件的接口,并可在SAS环境中建立对应外部异构数据的统一的公用数据界面。
CA
CA能够提供以“元数据”为核心的,结构化的,包容构造数据仓库各项技术的全面解决方案。
它具有独特的“元数据”管理与应用特性,具有用三维可视化技术解析处理的功能。
CA解决方案提供ODBC接口,并将数据存储在第三方关系数据库(如Oracle、Sybase、SQLServer、Informix和IBMDB2等)中,其性能虽要打一些折扣,但提高了开放性。
2.4各产品应用提示
BusinessObjects
严格意义上说,此产品只能算是一个前端工具。
它是数据仓库解决方案中最常用的数据展现工具。
它通过为主流的商业用户提供访问数据库和数据仓库中的信息的决策支持方案而立足业界。
产品已经从初级的工作组晋级到企业级。
Oracle
数据转移工具需手工编写SQL脚本,在处理复杂的数据转换需求时困难很多。
且前端工具易用性较差,需较多地依赖第三方产品。
IBM
并没有提供完整的数据仓库解决方案,但是它可以使用第三方的数据仓库工具。
例如,查询工具使用BusinessObjects的BusinessObjects,统计分析工具使用SAS公司的SAS系统。
Sybase
Sybase的IndustryWarehouseStudio包括相应行业所需的商业智能应用软件和数据分析模型,可以针对不同行业进行业绩分析、促销活动分析、用户群分析、销售分析和收益分析等,具有数据仓库设计、元数据管理等功能、支持广泛的应用软件和报表,并提供WarehouseStudio的设计工具、WarehouseControlCenter等工具,使企业能够进一步扩展数据模型和应用系统,以适应各种商业活动的实际需要。
Informix
采用Informix数据仓库解决方案可以使数据仓库系统具有高性能、高可扩展性,高开放性,可以自己进行定制等特性,同时,利用informix的专业数据仓库咨询服务,将充分保证您的数据仓库系统建设快速、及时,保证您的数据仓库系统真正发挥作用。
Microsoft
数据仓库是Microsoft公司刚刚进入的一个全新领域,与该公司的传统产品差别较大。
同时,Microsoft也缺少在数据仓库实施方面的咨询经验。
SAS
总的来说,SAS系统的优点是功能强、性能高、特长突出,缺点是系统比较复杂,软件投资较高,而且每年都需交纳License费。
CA
CA于1999年收购PlatinumTechnology公司后,得到了完整的数据仓库解决方案,它具有丰富的行业知识和经验,能够向用户提供完善的数据仓库构造咨询服务、全面的数据仓库产品系列。
CA提供的数据仓库解决方案能够满足不同企业的需要,能够集成完全不同的技术解决方案。
适合于航空、电信、零售业、股票交易、证券等各行业的数据综合性分析处理,为其提供全面的数据仓库解决方案。
三、DB2与Oracle的数据仓库技术对比
3.1前言:
通过对前一部分的介绍,对各厂商的数据仓库的产品有了大概的认识,为了进一步深入了解如何选项,现在对DB2与Oracle的数据仓库技术关键能力对比。
下面是两个公司的这款产品的简介[4]:
IBM公司新推出的DB2UDB7.1主要实现以下功能:
1.电子商务,包括e-commerce、ERP、客户关系管理、供应链管理、网络自助和商业智能,帮助企业实现电子商务;
2.商业智能,利用已有的数据资源来支持企业决策,包括数据访问、数据分析、成本控制,获取新的商业机会和提高客户忠诚度;
3.数据管理,包括准确高效地运行查询和应用,安全地存储、访问数据,数据恢复,在复杂的硬件环境下实现应用;
4.增强DB2家族,满足当今异构计算环境需求,实现开放式解决方案。
Oracle公司作为世界上最大的数据库厂家之一,凭借其在技术、资源和经验上的优势,一直致力于为企业提供最能满足企业竞争需要的数据仓库解决方案。
Oracle的数据仓库解决方案包含了业界领先的数据库平台、开发工具和应用系统。
Oracle数据仓库突破了现有数据仓库产品的局限,能够帮助企业以任何方式访问存放在任何地点的信息,在企业中的任何层次上,满足信息检索和商业决策的需求。
3.2技术对比:
根据数据仓库的任务、特点和应该具备的关键能力,对DB2和Oracle两大数据库的数据仓库技术在位图索引能力、数据分区、仓库管理器进行比较。
1.位图索引
位图表示能保存超过记录号列表的大量空间,特别是lowcardinalitydata.位图索引通过快速的布尔逻辑运算boolean操作将自己合并构成不同的索引项Indexentry.
Oracle
支持静态位图索引和静态位图联结索引,因为位图索引将与在where字句中的多个查询条件想对应的多个索引项合并在一起。
提高了查询反应速度。
并且位图联结索引将两个或两个以上的多个表联结而生成,能够通过预先执行约束条件来真正避免多个表联结或者大大的降低必须联结的数据字段(列)数。
使用位图联结索引进行查询能够快速通过位模式操作。
并且使用能容纳多维数据表的位图联结索引能够排除一些当使用位图索引在单个边上进行星型转换时必须的位模式操作。
DB2
支持动态的位图索引,因为是运行是动态建立的,是从已经存在的规则索引以及由经过排序或打乱顺序的所有记录号建立的位图获得记录号从而建立位图索引,所以不能提供Oracle位图索引一样的优秀的查询功能。
当动态位图索引能够通过“星型转换”策略执行星型查询时,这些动态位图索引还是建立在b-tree索引上的并且因为要访问大量的b-tree索引而要产生相当大的I/O成本。
无法得到使用Oracle真正的位图索引获得的建立高效的索引而节约的时间和空间。
2.数据分区
Oracle
四种数据分区方式:
RangPartitioning
域分区,使用了数据表的列值的域(时间范围)来将记录绘制进数据分区中。
使用域进行数据分区特别适合对历史数据库的管理。
在数据仓库中支持“滚动窗口”域分区也是一种理想的数据分割方式。
HashPartitioning
哈希分区,就是在数据分区列上使用哈希函数将记录绘制在数据分区中。
ListPartitioning
列表分区,允许用户从外部对如何将记录绘制在数据分区中进行控制。
用于描绘每一个数据分区的数据分区列的详细的离散值列表被用来完成这一项工作。
CompositePartitioning
Rang-Hash和Rang-List两种复合分区方式。
三种分区索引:
LocalIndex
本地索引,建立在使用与基本分区表完全相同的分区策略进行分割的数据表基础上的索引。
这种本地索引的每一个分区与基本分区表的分区一一对应。
GlobalPartitionedIndex
全局分区索引,建立在从数据表上使用不同的分区键进行分割的分区表或非分区表基础上的索引。
GlobalNon-partitionedIndex
全局非分区索引,实际上本质与非分区表的索引时一样的。
索引结构没有被分区。
允许使用所有可能存在的分区索引、非分区索引与分区表、非分区索引。
DB2
仅能支持哈希Hash分区方式,因为哈希分区不能使典型查询获得分区修正的优势,通过支持更多的对数据表和索引的分区选项使Oracle能在更多的查询中修正数据分区。
由于仅能支持哈希,DB2无法位“滚动窗口”提供支持,而使用“滚动窗口”进程,使得数据仓库可以连续周期性的进行数据更新——加载新数据清除旧数据——以便经常保持更新数据的在线。
DB2的哈希分区方法需要在所有分区中的全部数据重新分区,因此这就增加了加载新数据清除旧数据所需要的时间。
同时,由于在数据重新分区的进程期间数据表被锁定使得数据可用性大大降低。
而且,DB2需要在数据表和索引之间有相同的数据分区,这就是全局分区索引和非分区索引不能建立。
这在联结事务处理环境中是一个主要问题,因为在联机事务处理环境中全局索引被用来对任何单个记录提供高效率的访问。
使用DB2,应用程序的设计者在数据分割配置中定义他们的索引策略就会没有灵活性。
3.数据仓库中心
DB2
将数据仓库中心的“Visualwarehouse”集成到DB2控制中心中,提供了一个单一用户界面的仓库管理器warehousemanager用来创建、生成、存储和维护数据仓库和OLAP方图。
提高了DB2数据仓库中心的可伸缩性、可管理性和可访问性。
DB2仓库管理器构建在DB2之上,并利用DB2的能力设计、构建和维护高度可伸缩的数据仓库,它使人们能加快决策过程:
从大堆的可操作数据中发现能带来竞争优势的富有战略眼光的商业决策。
DB2仓库管理器具有的能力包括:
增强数据仓库的可伸缩性;快速部署数据集市;为DBA提供的全面管理能力和资源控制;使最终用户易于访问数据和元数据;为不受限制的客户机开发和提交报告的企业报告制作。
Oracle
没类似的仓库管理器,使得在数据仓库在创建、生成、存储和维护等方面的效率下降,从而影响数据仓库管理和控制。
DB2在数据仓库的易管理性方面略为领先,但Oracle提供的新技术使它在数据仓库的性能和可用性方面稍微有优势。
四.结论:
随着很多企业不断采用新的技术,扩充新的业务,力争突出经营特色,吸引更多的客户,并且企业在发展过程中,已逐步实现了绝大多数核心业务的计算机处理,积累了大量的客户数据和经营数据这样的事实基础上,为利用这些数据来发掘有价值的信息,需要建立一个面向主题的、集成的、稳定的、不同时期的数据集合,即数据仓库,实现对企业所有经营信息和客户信息的有效存储,并针对不同部门的管理决策需求进行多层次的数据加工处理,以多种方式呈现真正有价值的信息,以满足企业管理决策和客户分析的需要越来越急切。
不同的厂商提供他们各自的产品,这些产品有很大的差异性,
但可惜的是目前市场上成型的数据仓库产品基本上都是国外开发的,在目前虽然国内有很多大学和研究机构从事数据仓库技术的研究,可是国内基本上没有成熟的数据仓库解决方案。
虽然如此,但是我认为可以根据中国自己的市场的特殊性,各种厂家的特色,来建立有特色服务的数据仓库解决方案,小而巧,不从广的入手,从特色入手,对那些成熟产品的技术研究上进行,如:
数据仓库的架构等方面,在他们的基础上我们提出并建立更加完善的产品。
这也就是我们除了选型,可以做的更好的事。
五.参考文献:
[1]JacquelineBloemen,IBMDB2UDBV7.2andOracle9iAtechnicalcomparison,PASSConsultingGroup,2001
[2]IBMDB2UniversalDatabasePortingGuide,IBMTorontoLab,November2000.
[3]GeneKligerman,DB2UDBEEEasonOLTPDatabase,DB2andBusinessIntelligenceTechnicalConference,2000
[4]贺翔,梁洪峻,数据仓库及其在商业的应用,天津职业院校联合学报,2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知名 厂商 数据库 产品 对比
![提示](https://static.bdocx.com/images/bang_tan.gif)