SAPBI学习手册.docx
- 文档编号:26742958
- 上传时间:2023-06-22
- 格式:DOCX
- 页数:7
- 大小:380.29KB
SAPBI学习手册.docx
《SAPBI学习手册.docx》由会员分享,可在线阅读,更多相关《SAPBI学习手册.docx(7页珍藏版)》请在冰豆网上搜索。
SAPBI学习手册
SAP-BI-学习手册
SAP-BI-学习手册
3)拆分数据:
可以依据业务需求对字段可进行分解。
例如,对电话号码可进行区域码和市话号码的分解。
4)验证数据正确性:
系统在数据加载时可以自动利用查询相关的主数据表或字典表,对新数据进行数据验证口
5)数据替换:
对于因业务因素,可实现无效数据、缺失数据的替换。
能缺失数据通过子查询,并返回用其他手段获取的缺失字段,保证字段完整性。
6)建立ETL过程的主外键约束:
对无依赖性的非法数据,可替换或导出到错误数据文件中,保证主键惟一记录的加载。
为了能更好地实现ETL,建议用户在实施ETL过程中应注意以下几点:
如果项目时间
允许,可建立专门的数据中转层对运营数据进行转换处理,保证集成与加载的高效性:
要保证按统一的数据标准对不同的源系统的数据做转换。
ETL面临的最大挑战是当接收数据时,
其各源数据的异构性和低质量。
而ETL在处理过程中会定义一个关键数据标准,并在此基
础上,制定相应的数据接口标准。
SAP中的ETL
SAPBI集成了对各种源系统进行数据抽取、数据转换及加载到数据仓库中的各种功能。
SAP提供简单的图形化界面操作,可以通过简单的拖动实现数据源的建立、数据的抽取,可以定义数据转换规则的规则,可以定义数据加载的方式、时间等。
系统在后台自动生成基于ABAP语言的程序。
同时,SAPBI在转换规则定义时也提供了面向专家应用的功能,用户可以直接使用编程来定义数据处理的规则。
在企业数据仓库的建模流程中"数据获取"流程正是数据仓库建设中的数据抽取部分,也就是E的部分"数据转换"流程是数据仓库建设中的数据转换部分,也就是T的部分,这两个部分都属于数据仓库建模的工作,一般都是只需要一次性完成的工作。
在企业数据仓库的运行流程中"数据流控制"流程正是数据仓库的数据加载流程,也就是L的部分。
下面我们来根据上面这张图详细分析一下SAP中的ETL过程。
1.源系统
图形的最底部是SAPBI之外的系统,SAPBI会从这些系统中抽取数据,并对不同来源的数据进行整合。
这些为SAPBI提供数据的系统,称为源系统。
它们是SAPBI数据的来源。
在SAPBI系统中,我们会建立与这些源系统的连接,并通过信息包将数据传送到BI系统中。
如果源系统是SAP系统,SAP提供了SAPNetWeaver插件。
SAPNetWeaver插件是一个基于ABAP编程语言的应用组件,它提供了不同SAP系统的集成功能,使在不同的SAP系统之间进行主数据和交易数据的交换成为可能。
要将这一插件安装到SAP源系统中,它封装了众多针对于SAP系统的数据源、数据抽取器及其他与SAPBI相关的一系列功能。
由于SAP插件提供的数据源及数据抽取器包含了相应的取数逻辑。
因此,用户不必关心SAP源系统的数据结构,只要在应用层面选择相应的数据源即可完整地获取SAP源系统的数据。
2.数据源与PSA
图形的中上部分是SAPBI。
数据源、转换、信息提供者和开放集成器都是SAPBI内部的对象。
来自源系统的数据在进行SAPBI时,是存储在数据源中的,更准确地说,是存储在数据源对应的PSA表中。
数据源定义了从源系统上传上来的数据的结构。
同时,系统为每一个数据源自动生成结构相同的PSA表。
PSA是持续数据加载区(PersistentStagingArea)的缩写。
PSA表是二维表,由系统自动生成与管理,用于临时存储从源系统传过来的数据,用户可以查看和编辑这些数据。
数据源只是定义了数据的结构,一般而言,数据源的结构大多与源系统的数据结构有简单的一一对应关系。
数据抽取的动作则是由信息包(InfoPackage)定义和触发的。
3.转换与数据传输进程
数据源IPSA表中的数据经过转换到达信息提供者。
转换定义了数据源字段与信息提供者字段之间的对应关系及转换规则,本身并不存储数据。
数据经过转换后存入信息提供者。
同样的,转换本身只是对数据转化规则的定义,数据的批量转换的动作是由数据传输进程(DTP)定义的,数据传输进程与信息包类似,定义和触发数据传输。
所不同的是,信息包触发的是从源系统到数据源的数据传输,数据传输进程触发的是从数据源到信息提供者的数据传输。
转换和数据传输进程不仅可以实现数据源到提供者的数据传输与转换,还可以实现不同信息提供者之间的数据传输,以及信息提供者到开放集成器的数据传输。
SAPBI系统中的数据通过开放集成器转换成指定的文件或数据库表,为其他任何类型的系统提供数据。
4.信息源
数据转换是ETL的核心。
SAP还提供为复杂的数据转换提供另一个选项一一信息源,一般情况下,转换直接连接数据源(或作为源的信息提供者〉和目标信息提供者,没有必要使用信息源。
如果存在多个不同的数据源,首先要对不同的数据源进行数据转化,然后以统一的数据格式去更新多种信息提供者。
比如,要对不同的数据源进行货币或单位的换算。
此时,可以定义一个信息源作为中间结构,针对不同数据源的数据处理与转化在从数据源到信息源的转换中定义;针对不同的信息提供者的数据转化在从信息源到信息提供者的转换中进行维护,可以减少分别维护转换的工作量,同时使单个转换变得简单,易于维护。
当然,这种情况下也可以定义一个信息提供者作为中间层。
不同的是,信息提供者本身存储数据,占用空间,而且需要两次数据传输;而信息源不存储数据,数据只经过一次数据传输进程就实现从数据源到信息提供者的传输。
SAPBI的数据抽取完成的是将数据从各种源系统中传送到SAPBI系统中的过程。
SAPBI提供了全面的解决方案,包括了与各种源系统的连接技术、数据接口的定义和管理,还包括对数据传送过程的规划和监控等。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAPBI 学习 手册