SAS商业智能和数据整合应用概览Word格式.docx
- 文档编号:18344941
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:27
- 大小:26.83KB
SAS商业智能和数据整合应用概览Word格式.docx
《SAS商业智能和数据整合应用概览Word格式.docx》由会员分享,可在线阅读,更多相关《SAS商业智能和数据整合应用概览Word格式.docx(27页珍藏版)》请在冰豆网上搜索。
OfficeAdd-in可以做哪些事情15
StoredProcesses存储过程15
(5)SASStoredProcessSAS存储过程16
关于存储过程的介绍16
教材示例17
(6)SASEnterpriseGuideSAS企业导航18
SEG的功能:
18
利用Project功能创建一个Project18
利用SEG创建SAS存储过程18
利用SEG处理OLAP立方体18
(7)SAS信息映射工作室19
应用背景:
19
SAS信息映射路线图19
教材示例:
20
(8)建立Web报表20
Web报表的功能20
SAS报表模型20
(9)SAS信息传递门户21
SAS信息传递门户介绍21
SAS信息传递门户的信息组织形式21
SAS智能工作室概览
商业智能利用知识管理、数据挖掘、数据仓库、业务分析等技术来认定、跟踪和开发关键业务流程和数据,同时也识别和监控公司、竞争者的市场表现
一系列的客户端应用程序
SAS服务器
元数据集中管理
Ø
客户层
WEB层
服务器层
数据层
主要客户端应用程序:
SASManagementConsoleSAS管理工作室
SASDataIntegrationSAS数据集成
SASInformationMapSAS信息映射
SASEnterpriseGuideSAS企业导航
SASOfficeAddINSASOffice插件
SAS客户端应用程序:
JAVA应用程序
Windows应用程序
浏览器应用程序
WINDOWS,UNIX,
LINUX,OS
服务器层
关系式数据库表格
SAS数据
OLAP立方体
SPD文件
ERP数据结构
其他数据源
SAS/Connector系统互联程序
SAS平台管理软件包
SAS基础支持程序
OLAP(在线分析处理)服务器
Workspace(内存分配)服务器
存储过程服务器
包/分组处理服务器
基于WINDOWS应用
客户层
基于WINDOWS和UNIX应用
JAVAServletContainer
WebReport网络报告工作室
Info.Del.PortalSAS门户
SASStoredProcessWebApplication
存储过程网络应用
网络应用服务程序
SAS应用程序组件
ManagementConsole管理控制平台
DataIntegration数据集成工作室
InformationMap信息映射工作室
OfficeAddInOffice插件
EnterpriseGuide企业导航
元数据服务器
元数据存储器
Web层
主要程序包括:
SAS网络报表服务程序
SAS存储过程网络应用程序
J2SESDK
WebDAVServer
支持WEB应用的JAVA组件
SDK
SAS应用服务程序
主要服务:
SAS系统互联服务
SAS基础服务
存储过程服务
OLAP(在线分析处理)服务
工作空间(内存分配)服务
分组服务
SAS共享服务
典型的SAS服务器
元数据服务器
工作空间服务器
存储过程服务器
OLAP服务器
数据层
主要数据来源
OLAP数据
ERP数据
其他数据
总结:
元数据服务器:
提供SAS程序运行,及管理环境
工作空间服务器:
为客户端执行程序分配内存
存储过程服务器:
提供客户端执行自行开发的程序
SAS互联服务器:
SAS和SAS并行处理程序
SAS应用程序概览
应用程序的分类
SASManagementConsoleSAS管理控制工作室
SASDataIntegrationStudioSAS数据整合工作室
SASOLAPCubeStudioSAS在线分析处理立方体
SASInformationMAPSAS信息映射工作室
Windows类应用程序
SASAdd-InOfficeSASOffice插件
SASEnterpriseGuideSAS企业导航
Web类应用程序
SASWebReportWeb报表工作室
SASInformationDel.PortalSAS门户
基本模块使用流程图
建立存储过程
SAS企业导航
定义数据图书馆
管理控制工作室
元数据
浏览分析数据
SASOffice插件
注册源数据
建立信息映射
SAS信息映射工作室
定义目标表
数据整合工作室
建立ETL工作
建立报表
Web报表工作室
建立OLAP立方体
在线分析处理立方体
利用信息门户
PortalSAS门户
SASManagementConsoleSAS管理控制工作室
SASDataIntegrationStudioSAS数据整合工作室
SASOLAPCubeStudioSAS在线分析处理立方体
SASInformationMAPSAS信息映射工作室
SASAdd-InOfficeSASOffice插件
SASWebReportWeb报表工作室
SASInformationDel.PortalSAS门户
1、OrionStar公司商业智能的使用者介绍
IT部门:
IT管理员:
用户管理、报表管理、软件管理
数据建模人员:
业务浏览管理、数据模型物理结构、SQL程序员
报表管理员:
建立报表、计划报表、监控报表队列
程序开发员:
Web应用程序构建、整合应用
业务部门:
业务分析师:
无编程基础、擅长于Excel,主要进行Ad-hoc查询、OLAP、发布报表、同时也了解商业矩阵
重要用户:
具备基本编程基础、擅长于Excel、Ad-hoc查询、客户报告、建模、分析、理解重要业务领域
2、信息的使用者
决策层:
电子邮件、统计报告
中层管理者:
数据下钻、数据运算和操作、数据注释说明
执行层管理者:
销售、市场营销、客户服务、财务、技术支持
角色
职能
对应相应SAS模块
Ahmed
IT管理员
设置用户安全访问
数据管理
监控系统的稳定性和系统性能
对企业查询和报表提供环境支持
SASManagementConsole
SAS管理控制工作室
Marcel
数据建模人员
开发数据仓库
建设并维护数据市场
建设并维护数据的业务视角
建设立方体定义层级关系
在线分析处理立方体工作室
信息映射工作室
Gloria
重要用户
研究主要商业领域
建立Ad-hoc查询
基于基本数据的分析
SAS企业导航模块
Jacques
业务分析师
浏览销售数据
认定并制定销售策略来提高销售
位高层管理者提供演示内容
Office插件
Robert
报表管理者
基于元数据生成企业级和部门报表
使用统一的格式和方法生成报表
创建互动报表、支持数据过滤、分类、排序
Web报表工作室
Henri
中层管理者
直接迅速的访问数据资源
个性化的个人用户界面
能够描述感兴趣的内容
基于网络访问的报表
Samantha
高级开发人员
开发易懂的各种应用程序
实现其他软件应用和SAS的整合
基于特殊需求创建应用程序支持Ad-hoc查询
SASApp.Dev.
SAS应用程序开发工作室
各个相关模块基本简介
(1)SASManagementConsoleSAS管理控制台
定义和管理服务器
定义和管理数据图书馆
定义和管理用户和用户组
管理对企业资源的访问控制
管理元数据
同工作时间表交互
以上各个模块均需要安装SAS的插件才能实现其相关功能
服务器管理
SAS智能工作室在元数据中定义SAS服务器的各种属性,包括:
程序在何处执行,如何建立连接等
每一个单独服务器的定义内容都是SAS应用服务器整体定义内容的一部分。
也就是说,作为SAS整体服务器定义一部分的单一服务器,可以使用对于SAS整体服务器来说所有的可用资源如:
图书馆、目录等其他资源
工作空间服务器1
工作空间
服务器
工作空间服务器2
SAS应用服务器组定义
工作空间服务器3
OLAP服务器
存储过程
存储过程服务器1
存储过程服务器2
存储过程服务器3
SMC插件是由JAVA开发的程序,插件通过特殊的原数据定义提供相应的管理功能
分类:
环境管理:
用于配置SAS的资源如服务器、元数据、图书馆、用户等
应用管理:
用于配置特殊的应用程序
主要插件:
数据图书馆管理插件
用户管理插件
商业智能管理插件
服务器管理插件
建立数据图书馆见P4-25图示
使用的插件为:
在SMC中我们可以通过创建元数据来定义图书馆
图书馆用于认定数据的物理存储地址并把数据从物理存储映射到SAS智能工作室上
本书示例中我们应用——新图书馆创建向导来创建一个新的图书馆
通过此向导我们可以把SAS定义的信息数据同物理存储数据连接起来,同时通过SAS的数据图书馆我们可以对物理数据进行读写等操作
成功的运行向导我们可以得到一个元数据登记信息,此元数据用来描述一个图书馆,即完成了数据由物理层向SAS层的映射
示例中:
新建数据图书馆名称为:
OrionStarGoldLibrary
物理层数据为:
Orgold
向导结束后物理层数据Orgold映射为SAS数据图书馆OrionStarGoldLibrary
涉及的文件夹:
图书馆Library和其子文件夹源数据SourceData父目录:
SMC/环境管理/数据图书馆管理
完成数据图书馆的定义,我们还需要定义数据图书馆所包含的表,因为在第一步我们仅仅定义了数据图书馆的属性而没有定义其包含的表。
我们利用源数据设计器来定义数据图书馆所包含的表(4-35)。
当这个过程完成后我们对物理层的表组和表都完成了元数据的定义
元数据设计器向导完成后,我们就完成了整个物理层数据Orgold和其包含的表向SAS的对应转换
SAS视图中的数据(来源于源数据,存储在Library即图书馆中)
源数据(来自SAS可访问的数据源)
)
原数据设计器
本教材的示例,大部分操作基于OrionStarGoldLibrary
(2)SASDataIntegrationStudioSAS数据整合工作室
SAS数据工作室是一个JAVA应用,它主要管理ETL过程
ETL:
Extract提取Transformation传输Loading上载
SAS数据整合工作室支持企业应用可视化的工具来完成数据的快速提取、分析,同时在SAS条件下这个过程是透明的,即用户不必考虑底层数据的来源。
ETL工具:
过程设计器–为图形用户界面,把复杂的数据库操作过程和编程语言转化为简单的可视化点击-双击模式来实现数据的处理。
ETL数据来源:
PeopleSoft、SAPR/3、Siebel、Oracle
如何定义目标表:
利用目标设计器
目标表是客户所需要的表,是经过表格运算后的最终表格,其所有的字段名(Field)均来自源数据表或于源数据表相关。
因此,在设计目标表格时,其域名直接引用源数据的字段名,同时也可以新建字段名,但此字段的值可以由源表计算得出。
1、建立数据图书馆,并建立子目录,源数据图户馆和目标数据图书馆,存储元数据
2、建立源数据表文件夹和目标数据表文件夹来存储映射数据
3、将源表Orders和Order_items利用源设计器映射到原数据表文件夹
4、用目标设计器,创建Orderfact,并存储到目标数据表文件夹。
关于OrderFact的字段名来源已作过说明
5、利用过程设计器将源表,目标表,运算规则联系起来,生成JOB
6、运行ETL过程,浏览结果
说明:
A:
对于目标表格可以进行再设计和分析
对于教材的例子:
将目标表添加4个新字段为年、季度、月、日
其新加字段有一个前提要求,即新字段的值应该可以从源表的数据中通过计算提取出来
B:
教材提供了2个例子,一个是JOIN,另外一个是数理统计
(3)SASOLAPCubeStudioSAS在线分析处理立方体
在线分析处理立方体定义:
在线分析处理立方体是一种软件技术,它支持用户动态的分析储存在多维数据库表里的信息,并支持实时交互处理。
立方体的定义:
立方体是一系列的被组织化、格式化、层级化的多维、多层数据。
立方体的概念是OLAP存储过程的核心
OLAP中的数据经常为汇总数据
信息的分层次存储
1)数据被组织为-维-的形式
2)-维-可以进一步组织为层级式的结构
3)层级式结构决定了-维-的层次
逻辑关系:
-维-、层级、层
-维-:
一组相近的层级结构
层级:
以父子结构形式排列的多层数据
层:
层级和维的组成部分,层描述了从最高级到最低级的-维-
教材示例:
P6-19
a)利用立方体设计向导CubeDesigner,新建立方体Orionstar
b)选取源数据表Orderfact,导入立方体Orionstar
c)定义立方体的维度Dimension,为-时间维Time
d)定义维度的层:
Order-year,Order-Qtr,Order-Month,即年、季度、月3个层(Level)组成的层级结构(Hierarchy).年、季度、月为层级的父子关系。
e)定义层级结构:
即定义年、季度、月的层级结构。
最高级Year应出现在层级树的顶端
f)增加立方体的第二个维度!
产品维(2个维度的描述是针对同一表Orionstar)
g)设立维度的层Order-type和Product-ID
h)定义层的层级结构Order-type(父),Product-ID(子)
i)对立方体中的数据进行分析运算
a)每一个选入立方体的字段都可能成为分析的对象
b)对于每一个字段可能的分析方法系统已提供,如最大、最小、平均、求和等
j)指定或者设计数据的输出格式Format
k)完成Cube立方体的设计
必要的说明
可以浏览或操作Cube立方体的程序或工作室包括:
SASEG
SASInfo.Del.Portal
WebOLAPViewerforJavaOR.NET
SASWebReportStudio
所以有必要对Cube浏览和操作权限的授权
用SASAdd-inForOffice打开OLAPCubeP6-45
(4)SASAdd-InOfficeSASOffice插件
使用OfficeAdd-in的原因
许多商务人员,不论它们有没有编程基础,都可以借助SAS强大的分析工具来处理日常业务需求
商务人员已经习惯了OFFICE产品,OfficeAdd-In可以使商务人员利用SAS的强大分析功能,而不必学习新的软件
SASAdd-In把数据访问、数据分析、和SAS的计算功能整合到了Excel上
OfficeAdd-in可以做哪些事情
访问浏览SAS数据源
访问浏览SAS服务器可以访问的数据源
利用分析工具分析Excel和SAS数据
执行SAS应用程序
StoredProcesses存储过程
存储过程是SAS的应用程序,它储存在中央服务器,可以被多个不同的客户端调用和执行
存储过程是由高级用户开发的,它只能有高级用户维护,作为客户端,不能修改存储过程,但是可以调用(映射)存储过程
优点:
代码维护和代码应用在物理上分开进行
高级用户
用户
SASOffice插件提供了功能强大的分析工具-详见Office组件的SAS(S)-分析数据选项
a)打开Excel-SAS-打开数据源-进入工作表
b)指定服务器为SASMAIN
c)选择OrionStarGoldLibrary(在第三章创建的数据图书馆)
d)选择CustomerDimension表
e)选择要在Excel中显示的字段(本书示例为全部选定)
f)对数据的浏览操作如:
至第一行数据、至最后一行数据、显示第5000至第10000行数据
g)利用SASAdd-In提供的工具进行操作。
教材示例为过滤(从数据库角度来看即为Select*fromwhereconditions)即利用Filter功能实现数据的筛选。
本书示例:
原始表CustomerDimension,条件国家=美国,客户组=OrionStar,排序=客户LastName
至此实现了数据的初步过滤,从内容上看原始表Customer-Dim转换为符合客户要求的初始表格
h)进行分析路径:
Excel-SAS-分析数据
i)选择单项频率分析,设置分析变量:
客户性别、客户年龄组
j)运行结果
本练习回答的问题:
“请说明OrionStar公司在美国的客户分布情况;
其中包括不同性别和年龄段的客户分布,统计口径为‘频数’”
(5)SASStoredProcessSAS存储过程
关于存储过程的介绍
是SAS的程序
储存在服务器端:
统一授权、统一管理、服务器一端更新所有人都更新
资源共享、集中维护、优化处理过程
可以执行存储过程的SAS的组件:
OfficeAdd-In,SASEG,SAS信息映射工作室,SAS门户,SASWeb报表工作工作室
1、打开SMC
2、打开文件夹OrionStarSportsOutdoors
3、选择程序OrionCustomerCounts
对于存储过程OrionCustomerCounts,由高级用户开发和维护,前端人员一般只有调用(映射)的权限。
存储过程后缀名.SAS
如何建立存储过程:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 商业 智能 数据 整合 应用 概览