SAP BI基础知识.docx
- 文档编号:766863
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:20
- 大小:1.06MB
SAP BI基础知识.docx
《SAP BI基础知识.docx》由会员分享,可在线阅读,更多相关《SAP BI基础知识.docx(20页珍藏版)》请在冰豆网上搜索。
SAPBI基础知识
SAPBI知识收集
一、SAPNetWeaverBI
BI是SAPNetWeaver的核心组件,它提供了DW、BI平台、BI套件去最大的获取有用的信息。
BI提供了复杂的报表和分析工具。
(图1)BI的关键组件
(图2)SAP相关的产品
1、EP:
EnterprisePortal,代表企业的前端,就是通过WEB浏览器而不是SAP的专有用户界面提供对SAP的和非SAP资源的门户访问。
2、ECC:
SAPERPCentralComponent,以及其前身R/3和R/3Enterprise均为联机事务处理系统(OLTP),它们可以满足许多客户日常事务处理的需要。
3、SCM:
供应链管理,对业务过程的执行与协调进行流线化操作,从而增强了计划导向的业务过程。
4、CRM:
客户关系管理,被用在客户相关的端对端的过程中。
可以全方位的审视你的客户和你的企业间不同触点。
(图2)BI架构
架构可以分为三层:
1、sourcingdata
2、storingitinthewarehouse
3、reportingonitwithanalytics
二、数据流
BI详细数据流图
1、DataSource:
是BI系统的一个数据对象,用来从源系统抽取和准备数据。
三、数据获得层(数据源)
(图4)数据获得
四、DW层的相关组件
(图5)BI数据仓库:
物理存储
DW层主要是为企业报表提供需要的数据,对这些数据进行抽取、清洗、集成、管理。
包括的有DW、ODS、DM、OpenHubService;DW为相当长的时间内存储了详细的数据。
DW层主要涉及到以下组件:
1、数据抽取(DataETL)
(1)SourceSystem:
源系统包括SAPR/3、NonSAP、XML、Database。
(2)InfoSource:
信息源描述了企业在特定情况下,所有可用主数据或事物数据的总量。
数据有一个从数据源到信息源的转入过程。
一个信息源由许多信息对象(InfoObject)组成;在BI中,InfoObject是基本的信息载体,用来结构化信息,这些都是数据对象必须的。
(3)如何转入数据?
通过定义传输规则,定义数据源是怎样转入信息源中。
a、从文件系统中转出数据:
用户可以从文件系统中加载事物数据和主数据,例如:
Excel、CVS及ASCII文件。
这些文件可以来自用户工作站,也可以来自某一应用程序服务器,可以直接在BI中定义并更新元数据,也就是数据源。
SAP提供用CVS和ASCII格式自动加载平面文件数据。
在文件系统加载前应检查文件的正确性。
b、通过BAPI方式转入数据:
StagingBAPI(分段运输商业应用程序接口),是为了能够在应用层上从非SAP数据中抽取数据,SAPBI提供了一个接口。
其作用:
一个就是把第三方ETL与SAPBI相连;二是能够提供对SAPBI对象的访问,因此使得客户化的数据抽取程序成为可能。
c、从关系数据库中传输数据:
在缺省的情况下,系统会开通与数据库管理系统得连接,当从SAP内核中初始化一个BI应用程序服务器时,SAP系统在数据库管理系统基础上运行。
也可以与更多的数据库相连,就可以访问外部数据库,还可以用SAP支持的数据库管理系统提供的表和视图来转入数据。
在与数据库取得连接的情况下:
可以从SAP支持的数据系统中加载数据;将数据库与BI相连形成源系统,直接访问外部关系型数据库管理系统;通过生成数据源,使得BI可以感知到这些元数据。
d、传输XML格式的数据:
通过XML格式的数据与BI的数据在分段传输(DataStaging)相集成,BI在分析外部数据方面的灵活性得到了支持。
通过用户联网的HTTP协议,可以把XML格式的数据传输到BI中,还可以把它与统一的数据基础相集成。
这一解决方案的基础是使用SAPWeb应用程序服务器提供的SOAP服务。
通过这一服务,可以向ABAP环境下的RFC兼容功能模块中传输XML格式的数据。
为了以XML传输数据,在BI中会生成一个以该文件为基础的特殊数据,该数据源还设有和Delta队列服务连接所需的接口,对每一个XML数据源还生成RFC兼容模块,主要是对Delta队列中的数据进行更新。
e、通过DBConnect:
允许相关的数据库直接被连接;它可以与外部数据库管理系统创建一个连接。
通过输入元数据和原始数据,这种必须的结构在BI中将被生成,数据就被直接的、有效的加载,这种技术运行在J2EE引擎,也支持J2EE连接架构。
f、通过UDConnect:
能够连接几乎所有的相关的、多维的数据源。
可以转换、转移像平面文件这种数据。
RelationalSource可以用DBConnect,也可以用UDConnect传数据,Multi-dimensionalSource是用UDConnect,SAPSource是用BIServiceAPI,File是用FileInterface,XML是用WebService。
(4)PSA(持续分段传输区域):
用来存放从源系统中获的数据,是一个临时存储区域,为ETL提供一个工作区域;与原系统数据接近,存储时间比DW短,是短期的存储(如果原系统的数据量比较大的话);可以起到数据备份和源系统数据共享的作用。
系统会给每一个数据源及源系统分配一个PSA。
数据在PSA中存储时不会发生变化,BI中的数据记录首先被转化成转入结构的格式;随后,对每一个数据包执行一个TRFC程序,转入结构中的数据被写入PSA表(二维表)中并存储在那里,每张PSA表的结构与其相应的转入结构一致。
2、聚集(aggregation)
Aggregate:
优点:
提高查询效率;缺点:
占据内存空间和处理资源,不能看见近期加载的数据。
集成的类型有:
(1)Minimum
(2)Maximum
(3)SUM(是最多的选择)
3、BI加速器(BIAccelerators)
加速器解决的是一个执行效率的问题,它用在NetWeaver7.0以及更高的版本。
它指引在BI信息立方体中的信息去创建一个高度压缩的结构能将任何一个用户要求的数据载入到内存。
在SAPNetWeaver加速器查询进程完全是在内存中利用高性能聚集技术,然后发送数据到BI分析引擎为用户输出数据。
加速器用的几个地方:
(1)数据进入DW时:
原数据向BI系统抽取
(2)数据出去的时候:
报表查询
加速器涉及到技术:
(1)软件技术:
TREX:
搜索和分类引擎,最早设计是为了非结构的数据(像Google)
BIAccelerator:
是用TREX技术(索引、检索、压缩)建立的,去处理结构数据。
(2)硬件要求:
CPU:
Intel64bit、Supplied:
IBM\UP、OS:
LinuxSLES9
4、数据仓库工作台(DWWorkbench)
(图6)DWW
(1)Modeling:
建立、修改数据库对象和数据转换对象,创建InfoObject、InfoCube、DSO
(2)Administration:
数据加载的时间周期、监视和数据的管理;monitor:
监视、控制数据的加载过程,创建处理链的执行和监视。
(3)TransportConnection:
BI传输工具的设置
(4)Documents:
为文件修改的界面;为BI对象添加、建立、搜索不同不版本、语言、格式的连接。
(5)BIContent:
为用户提供活动的内容
(6)Translation:
提供语言翻译
(7)Metadatarepository:
可以快速查询元对象、交换不同系统间的元数据、用THML页输出元数据列表、显示对象图形。
5、InfoCube(信息立方体)
InfoCube主要的目标是支持BI查询;它被用于存放长期的总结的、合计的数据。
InfoCube的几种类型:
(1)RemoteCube:
远程Cube,来自其他DW的Cube
(2)MultiCube:
可以综合几个Cube,供使用
(3)BasicCube:
信息立方体最主要的功能就是为BI的查询提供服务。
(1)InfoCube的几种形式:
a、物理数据存储器:
包括基本的InfoCube和多个InfoCube
b、虚拟数据存储器:
包括远程立方体(RemoteCubes)、SAP远程立方体、有服务功能的虚拟信息立方体。
只有基本的InfoCube在物理上才包括数据库中的数据,虚拟的InfoCube只是显示数据集的逻辑化视图。
InfoCube是从一个InfoProvider中获得。
InfoCube将一组InfoObject集合在一起,一个InfoCube包括一组与星型结构相关的表,位于中心的大型实事表包含InfoCube中的主数据,外围的是几个存储InfoCube特征值的多维表;InfoCube的主要数据与维度表的特征值有了关联,这个特征值决定了粒度(精细的程度),主要数据是在InfoCube进行管理的,逻辑上属于同类的特征值(例如:
特点和区域是属于区域维度的)归到同一个维度表中。
一个InfoCube可有16个维度表,一个维度表可以由128个特征构成。
维表不能大于事实表的20%
(2)基本的信息立方体结构:
在SAP中,信息立方体是采用的星型模型,由中间一个大的实事表(Facttable)和周围的维度表(Dimensiontable)构成,实事表和维度表都是关系数据库表格。
每个维度表包含多个特性(Characteristics);特性里面又包含有属性(Attributes)、文本(Texts)和层次(hierarchies)结构。
这样做的好处:
第一、当实事表和维度表都相当大时,在查询的时候就会影响性能,我们就可以把维度表分成很小的表,由SID相关联。
这样就可以提高其性能。
第二、可以方便数据的移动、修改。
第三、可以实现主数据的共享,不同的InfoCube都可以用这个主数据
(星型的扩展模型)
Dimension的Key(DIMID)是由机器自动产生,它是唯一定义维度表的属性值。
这个DIMID在实事表里是个外键。
在实事表里的所有记录都能唯一确定。
维表和主数据表是由SID表连接的。
维表不包含主数据信息,主数据是被存储在独立的表中。
ClassicStarSchemaANDBWSchema的区别:
(图)BasicStarVS。
BIExtendedStar
上图讲解了经典模型与SAPBW星型模型的区别:
1、在经典模型中,信息立方体由事实表和维度表组成,而SAP星型模型中,信息立方体由事实表、维度表(SID表,存放SID值)、主数表(层次、属性、文本)组成。
2、在SAPBW中,事实表称为关键值(指标),维度属性称为特性,描述属性称为文本,维度表中不包含主数据。
3、
6、DSO(数据存储对象)
在BI中,DSO是一种主要的物理存储对象,它们是被用来存储详细(事物层)的记录。
DSO和InfoCube构成了仓库的物理存储。
而DSO又是由ODS和DW所构成。
(1)数据存储对象的结构:
a、待激活队列(ActivationQueue):
存储代激活数据,激活后删除这些数据。
在DTP过程中,记录首先被写入待激活表。
b、激活表(ActiveData):
存储激活后的数据,通过非模态定义了一个语义的主键(业务关联的)。
报表通过BEx用到这张表
c、变更记录(ChangeLog):
用于存储新旧记录的变更记录,可以用作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAP BI基础知识 BI 基础知识