第一章Sas概述.docx
- 文档编号:9113574
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:17
- 大小:236.96KB
第一章Sas概述.docx
《第一章Sas概述.docx》由会员分享,可在线阅读,更多相关《第一章Sas概述.docx(17页珍藏版)》请在冰豆网上搜索。
第一章Sas概述
第一章SAS概述
§1.1SAS的发展概况
SAS(StatisticalAnalysisSystem)(统计分析系统)是一个集数据管理与数据处理功能于一体的大型软件系统。
1966年,美国北卡罗来纳州立大学开始研制SAS。
1976年在美国成立了SAS研究所(SASInstituteInc.,Cary,NC,USA)。
SAS研究所对商品化了的SAS进行经营、维护、培训和进一步开发等工作。
早期的SAS只能在大型计算机上运行。
1985年推出了可以在IBMPC及其兼容机上运行的SAS。
至今,SAS/PC已经发布了多个版本,本书将主要介绍基于WINDOWS支持汉字的SAS9中文版。
目前,SAS已经发展成为一个功能齐全、应用范围广泛和使用灵活方便的数据管理及数据分析的标准软件系统。
其应用范围涉及理、工、农、林、医、管理、商业和行政事务等各个领域。
国际上有一个专门的SAS协会SUGI(SASUserGroupInternational),每年有学术会议讨论研究有关SAS的问题。
一些国家和地区的大学把SAS为一门课程开设。
我国的一些科研机构和大学也引进并使用了SAS。
§1.2SAS的结构、功能和特点
1.2.1SAS的结构
SAS是一个用于数据管理和数据处理分析的组合软件系统。
SAS的命名是源于其开发初期的功能只是统计分析、处理数据。
经过几十年的研究与开发,现在的SAS已经发展成为一个适合商业、工业、教育和政府各界使用的企业级信息处理的综合独立的软件系统。
SAS还提供了运筹学方法、矩阵运算、计量经济学、时间序列分析方法、质量控制管理、与多种流行数据库的接口、数据仓库工具、地理信息和空间数据处理、以及数据挖掘等功能模块。
SAS是目前世界上公认的数据分析的标准软件之一。
SAS包括多个大的功能模块,用户可以根据需要,选取部分或全部SAS功能模块来组成一个运行系统。
SAS9主要有如下几个常用的功能模块:
(1)SAS/BASE(基本模块)是SAS的核心部分,其它功能模块必须是在该模块的支持下运行。
SAS/BASE提供的功能有:
数据存储与检索、程序和数据的编辑与修改、报告生成、简单统计计算和文件存储管理等。
(2)SAS/STAT(统计分析模块)模块提供对数据进行统计分析的功能,包括方差、相关、回归、判别、聚类、主成分和因子分析等多元统计分析方法,SAS/STAT基本上覆盖了所有的实用数理统计分析的方法。
(3)SAS/ASSIST(交互式菜单模块)模块提供了一个菜单式的操作界面,可以输入、转换、编辑数据、管理、分析并生成报表。
通过对菜单的操作来实现SAS数据处理和报表等功能。
通过SAS/ASSIST的使用,初学者可以初步掌握SAS;有经验的SAS用户可以利用SAS/ASSIST提供的程序自动生成功能以提高编写程序的工作效率。
(4)SAS/ACCESS(外部数据库接口模块)模块提供了建立访问外部数据库的一个统一的公共数据界面,以实现与外部数据库进行数据的双向传输。
目前的SAS版本支持与VF、SQL/DS、DB2、ORACLE、SYBASE、INFORMIX等十多种常用的数据库系统的数据通讯。
(5)SAS/GRAPH(绘图模块)模块提供了较强的绘图功能。
利用SAS/GRAPH能够以直观的图形方式呈现数据处理的结果,例如直方图、饼图、星图、散点图、曲线图、三维立体图、等高线图、地理信息图、及系统聚类图等多种彩色图形。
(6)SAS/ETS(经济计量学和时间序列分析模块)支持计量经济与时间序列分析研究。
SAS/ETS包括了计量经济学中的统计模型分析、时间序列分析及频数分析等方法。
它是经济分析、预测、系统模型、金融等应用研究方面的工具。
(7)SAS/IML(交互式矩阵程序设计语言模块)是一种以矩阵为数据单位的计算编程语言。
SAS/IML支持用户自行研究设计新的算法,或者用于解决SAS中没有提供现成算法的特殊的、专门的问题。
SAS/IML具有完善的编程环境,并且可以在语句级交互使用。
(8)SAS/OR(运筹学模块)是基于运筹学原理的一个程序包。
SAS/OR的主要功能有:
计划和管理大型项目、资源的调度分配、建立生产和网络流程模型等。
辅助用户实现对各种资源最佳配置的决策支持。
(9)SAS/QC(质量控制模块)是一个用于质量控制管理的子系统,本模块基于统计学方法,用计算机图形显示技术来实现生产制造过程中的质量控制管理。
SAS/QC提供了不同类型的控制图制作与分析,以辅助用户进行生产管理过程的决策。
(10)SAS/WA(数据仓库模块)模块是一个数据仓库的集成工具。
SAS/WA提供了建立数据仓库的管理层,实现定义数据仓库和主题,数据转换和汇总,汇总数据的更新,Metadata的建立、管理和查询等。
(11)SAS/GIS(地理信息模块)是集地理信息系统和空间数据分析显示于一体的子系统。
该软件模块提供层次化的地理信息。
用户可以以交互方式进行数据分析和显示及地图的大小缩放。
SAS还有多个功能模块:
用于建立特殊的交互图形用户接口的面向对象的应用开发工具SAS/AF;SAS/EIS是一个开发、运行和维护企业信息系统的菜单驱动系统;数据探测和分析工具SAS/INSIGHT;数据挖掘工具EnterpriseMiner;SAS/CONNECT软件是SAS到SAS的客户/服务器工具等等。
本书将主要介绍SAS/BASE、SAS/STAT、SAS/OR以及SAS入门。
对SAS的其它功能模块感兴趣的读者,有了本书的基础之后,可以直接阅读软件说明书或通过“帮助”来学习使用这些功能。
1.2.2SAS的特点
SAS是一个实用性强、功能完善、使用方便、容易学习的计算机软件系统。
它不仅具有一般数据管理系统的功能,还提供了一个完善的可编程语言环境,特别是以标准过程给出了常用的数据处理和复杂计算的算法。
例如,对于计算繁难的多元统计算法,用户只需要指出过程名及其必要的参数提交系统,就可以得到一张清晰的包括相应算法的全部计算结果和参数的输出表格或图形。
SAS的这一特点极大地方便了非计算机专业人员的计算机应用。
SAS中典型的标准过程包括一般描述性统计分析和多元统计分析、经济预测与时间序列分析、多种运筹学算法、质量控制管理及绘制各种二维、三维图形等。
另外,SAS具有极强的报表产生和绘图功能。
用户可以得到清晰易读的表格和图形输出。
SAS还提供了与多种主流的数据库和电子表格软件的数据交换接口,极大地拓宽了SAS的应用范围。
§1.3SAS的启动与退出
1.3.1启动SAS
SAS的授权有效使用期限是由计算机系统时间控制的。
在启动SAS之前,用户首先要确认所使用的计算机系统时间是否正确。
在Windows下启动SAS9与启动其它应用软件系统一样,常用如下两种操作方式:
(1)双击桌面上的图标
(2)顺序操作:
“开始”→“程序(P)”→“SAS”→“TheSASSystemforWindows9.0(简体中文)”。
启动操作之后,稍候片刻,屏幕上将出现如图1.1所示的窗口,这就进入了SAS的主界面。
这是SAS的基本工作状态。
在这种状态下,用户可以与SAS会话。
图1.1SASforWindows9.0主界面
1.3.2退出SAS返回Windows
退出SAS返回Windows有下列方式:
(1)在SAS主界面左上角的“输入命令”框输入“ENDSAS”或“BYE”,然后按回车键。
(2)单击SAS主界面右上角的关闭图标:
,系统提问"确实要结束该SAS会话吗?
",然后用户予以确认,即可退出SAS返回Windows.
(3)操作“文件(F)”→“退出(X)”。
§1.4SAS主界面
SASforWindows9.0启动后的主界面如图1.1所示,组成主界面的各个部分的名称如图1.1中所标记。
本节将对其做详细介绍。
1.4.1SAS的几个主要窗口
SAS提供了多个功能窗口,经常使用的有以下几个:
(1)日志窗口
系统启动时,在日志窗口显示SAS的版权、授权等信息。
用户向系统提交任务后,日志窗口将给出SAS运行的状态。
如果用户程序有错,系统在日志窗口以不同的颜色显示错误的大概位置及错误类型等信息。
用户不能在日志窗口输入任何信息,但是可以利用“文件(F)”里的“新建(N)”或者“编辑(E)”里的“清除(R)”来清除窗口内容。
对日志窗口的内容可以进行选定、存储和查找操作。
(2)编辑器窗口
编辑器窗口是一个字处理器,在编辑器窗口内可以进行像大多数字处理软件的各种输入、增删、调用外部文件等操作;如果当前处理的是一个程序文件,可以直接在该窗口下向系统提交任务。
需要指出的是每打开一个文件就占用一个编辑器窗口。
也就是说SAS允许同时打开多个编辑器窗口,用打开的文件名来区分不同的编辑器窗口。
(3)输出窗口
SAS处理用户提交的任务后,在输出窗口显示所有文本形式的处理结果。
在该窗口下,用户不能输入任何信息。
对输出窗口的内容,可以进行存储,打印和选定等操作。
(4)GRAPH窗口
该窗口显示所有由SAS的GRAPH功能绘制的图形.在GRAPH窗口下可以对显示图象进行复制、编辑等操作。
(5)SAS浏览窗口
SAS的主界面左侧的区域叫作SAS浏览窗口。
浏览窗口的显示区域将由“结果”和“SAS资源管理器”占用(相互切换)。
下面介绍“结果窗口”和“SAS资源管理器”。
(ⅰ)结果窗口
SAS在运行时,将不同程序的各种输出(输出窗口、GRAPH窗口等的内容)统一管理。
将所有的输出结果的题目以树状目录结构一目了然的显示在结果窗口里,以便查阅。
(ⅱ)SAS资源管理器
在资源管理器中通常显示有关SAS环境的内容,例如SAS9的资源管理器里显示“收藏夹”、“我的电脑”等常见的Windows的内容。
只有“逻辑库”是SAS引入的名词。
1.4.2菜单栏
SAS9菜单栏有“文件(F)”、“编辑(E)”、“查看(V)”、“工具(T)”、“运行(R)”、“解决方案(S)”、“窗口(W)”和“帮助(H)”等八项。
另外,由于菜单栏内的下一级操作依赖于当前窗口而变化,所以,以下的内容假定当前窗口是程序编辑器窗口。
(1)文件(F)
新建程序(N):
打开编辑器窗口,建立新的程序文件。
其他窗口下的“新建”为清除其所有窗口内容。
打开程序(O):
打开已经存在的程序文件到程序编辑器窗口。
关闭(C):
关闭当前窗口。
追加(E):
将已经存在的程序或数据文件追加到程序编辑器窗口中。
打开对象(J):
打开对象。
保存(S):
保存当前窗口的内容。
另存为(A):
将当前窗口的内容以另一文件名存储。
另存为对象(B):
将当前窗口的内容以另一对象存储。
导入数据(I):
导入外部数据并且转换为SAS数据。
导出数据(R):
输出SAS数据并且转换成为指定格式的数据。
页面设置(U):
输出页面设置。
打印设置(T):
打印当前窗口的内容设置。
打印预览(V):
打印当前窗口的内容预览。
打印(P):
打印当前窗口的内容。
发送邮件(D):
将当前窗口的内容作为附件发送邮件。
退出(X):
退出SAS。
(2)编辑(E)
撤消(U):
撤消操作。
恢复(D):
恢复撤消的操作。
剪切(T):
剪切掉选中的内容。
复制(C):
复制选中的内容。
粘贴(P):
将复制的内容粘贴到指定位置。
清除(A):
清除选定的内容。
全部清除(R):
清除当前窗口的全部内容。
全部选定(S):
选定当前窗口的全部内容。
全部折叠(O):
将当前窗口内容折叠显示。
全部展开(X):
将当前窗口折叠显示的内容全部展开显示。
查找(F):
在当前窗口里查找指定的内容。
替换(E):
在当前窗口里以给定的内容替换指定的内容。
(3)查看(V)
增强型编辑器(I):
打开或者切换到增强型编辑器窗口。
程序编辑器(P):
打开或者切换到程序编辑器窗口。
日志(L):
打开或者切换到日志窗口。
输出(O):
打开或者切换到输出窗口。
图形(A):
打开或者切换到图形输出窗口。
结果(E):
打开或者切换到结果窗口。
SAS资源管理器(X):
打开或者切换到SAS资源管理器窗口。
只显示内容(C):
只显示指定窗口的内容。
收藏夹(Y):
打开或者切换到收藏夹。
(4)工具(T)
查询(Q):
查询数据集。
表编辑器(T):
打开数据集编辑器。
图形编辑器(G):
打开图形编辑器。
报表编辑器(R):
打开报表编辑器。
图像编辑器(I):
打开图像编辑器。
文本编辑器(X):
打开文本编辑器。
键盘宏(M):
定义键盘宏。
添加缩写(A):
定义缩写标识及内容。
定制(Z):
对SAS界面进行特殊设置。
选项(O):
选项设置。
包括:
系统参数;增强型编辑器基本环境及系统功能键。
(5)运行(R)
提交(S):
运行程序编辑器窗口的程序。
重新调用上一次提交(R):
在程序编辑器窗口显示上一次运行过的源程序。
提交第一行(T):
运行程序编辑器窗口的第一行程序。
提交N行(N):
运行程序编辑器窗口指定的N行程序。
登录(I):
连接远程主机。
远程提交(B):
远程提交作业。
远程获取(O):
远程获取信息。
远程显示(D):
远程显示输出。
注销(F):
注销远程登录。
(6)解决方案(S)
分析(S):
3D可视分析(V):
调用SAS/SPECTRAVIEW模块。
分析家(S):
调用Analyst模块。
企业数据挖掘(E):
调用EnterpriseMiner模块。
地理信息系统(Y):
调用SAS/GIS模块。
向导式数据分析(G):
调用SAS/LAB模块。
交互式数据分析(I):
调用SAS/INSIGHT模块。
投资分析(N):
调用投资分析模块。
市场研究(M):
调用市场研究模块。
项目管理(P):
调用项目管理模块。
质量改善(Q):
调用SAS/QC模块。
排队模拟(U):
调用排队仿真模块。
时间序列预测系统(F):
调用时间序列预测系统模块。
时间序列查看器(T):
调用时间序列查看选择模块。
开发和编程(D)
EIS/OLAP应用程序生成器(E):
调用SAS/EIS等模块。
框架生成器(A):
进入SAS资源管理器,建立、维护数据集等。
类浏览器(C):
查看类之间的关联及类中的方法和实例。
源控件管理器(S):
调用SAS/AF的功能。
数据仓库管理员(W):
调用数据仓库的功能
OLAP服务器管理(O):
进行服务器管理,包括环境选项、访问控制等。
报表(R):
调用EIS/OLAP、GRAPH等进行报表的设计与制作。
附件(A):
提供测试图形的图案、编辑注册表、游戏等。
ASSIST(T):
启动ASSIST子系统。
桌面(K):
打开SAS桌面。
EIS/OLAP应用程序生成器(E):
调用EIS/OLAP的应用程序生成功能。
(7)窗口(W)
新建窗口(N):
建立新的编辑窗口。
最小化所有窗口(M):
将所有窗口最小化。
层叠(C):
将所有窗口前后层叠置放。
垂直平铺(T):
将所有窗口垂直平铺置放。
水平平铺(H):
将所有窗口水平平铺置放。
调整大小(R):
调整指定窗口的大小。
调整停放视窗的大小(S):
调整当前窗口的大小。
程序编辑器:
打开或切换到程序编辑器窗口。
日志:
打开或切换到日志窗口。
GRAPH:
打开或切换到GRAPH窗口。
结果:
打开或切换到结果窗口。
编辑器:
打开或切换到指定的编辑器窗口。
输出:
打开或切换到输出窗口。
SAS资源管理器:
打开或切换到资源管理器窗口。
(8)帮助(H)
在“帮助”里提供了所有SAS的用户文挡、学习SAS的资料和参考文献、SAS网站及版本信息。
1.4.3SAS工具栏
SAS的工具栏如图1.2所示。
各个元素的名称见图1.2中的标记。
SAS的工具栏的大多数元素与标准流行的视窗工具栏的图标在图案和功能上基本相同,只有工具栏的左侧的命令输入框内是输入DOS版的SAS命令。
其它工具栏的元素就不再逐一介绍了。
图1.2SAS工具栏
1.4.4SAS逻辑库
SAS逻辑库(SASDataLibrary)也叫做SAS数据库。
SAS逻辑库是用于管理数据集等SAS数据文件的。
通常,数据文件是存放在DOS的一个目录下的,SAS逻辑库是一个逻辑上的概念,一个SAS逻辑库可能是指一个或几个DOS下的路径,给定SAS逻辑库名就相当于给定了DOS路径。
SAS逻辑库的定义一般采用如下两种方式:
(1)用LIBNAME语句
格式:
LIBNAME逻辑库名“DOS路径”;
其中:
LIBNAME是关键字;逻辑库名是用户给定的以字母或下划线开头的字符数字串;DOS路径是一个存在的DOS目录路径。
例如语句LIBNAMEabc“C:
\dir3”;定义了一个名为abc的逻辑库,该逻辑库与目录C:
\dir3相对应
(2)用“新建逻辑库”窗口
操作:
鼠标右击SAS浏览器中的图标“逻辑库”,出现如图1.3的“新建逻辑库”窗口。
输入一个目录路径
图1.3新建逻辑库窗口
在窗口内的“名称(N)”框内输入用户给定的逻辑库名;“路径(P)”框内输入一个存放SAS数据文件的目录路径;其它框都是可选项。
“确定”后就建立了给定名称的逻辑库。
建立逻辑库,实际上是将逻辑库名与DOS下的一个目录路径建立了一种联系。
SAS逻辑库的管理可以通过“SAS资源管理器”的操作完成。
另外,SAS逻辑库分为临时库和永久库,临时库只有一个,系统给定的名称为WORK,临时库WORK在SAS启动时系统自动生成;退出SAS时,临时库WORK将自动消失。
通过LIBNAME或者“新建逻辑库”窗口定义的是永久逻辑库,在永久逻辑库存放的数据文件将被永久保存。
SAS每一次启动,都将击活临时逻辑库WORK和一个永久逻辑库SASUSER,读者可以用“SAS资源管理器”的操作查看SASUSER的状态。
§1.5实例
为了逐步了解SAS操作的过程,下面给出一个用SAS处理的方差分析问题。
例1.1研究6种氮肥施用法对小麦的效应,每种施肥法种5盆小麦,完全随机设计,测得含氮量(g)如表1.1。
表1.1含氮量数据表(g)
处理
1
2
3
4
5
6
2.9
2.3
2.2
2.5
2.7
4.0
3.8
3.8
3.6
3.6
2.6
3.2
3.4
3.4
3.0
0.5
0.8
0.7
0.8
0.5
4.6
4.6
4.4
4.4
4.4
4.0
3.3
3.7
3.5
3.7
SAS程序如下:
DATAeg15;
DOrep=1TO5;
DOtreat=1TO6;
INPUTx@@;
OUTPUT;
END;
END;
CARDS;
2.94.02.60.54.64.0
2.33.83.20.84.63.3
2.23.83.40.74.43.7
2.53.63.40.84.43.5
2.73.63.00.54.43.7
;
PROCANOVA;
CLASStreatrep;
MODELx=treat;
MEANStreat/t;
RUN;
程序输出的结果见表1.2:
表1.2例1.1输出结果
TheANOVAProcedure
ClassLevelInformation
ClassLevelsValues
treat6123456
rep512345
Numberofobservations30
DependentVariable:
x
Sumof
SourceDFSquaresMeanSquareFValuePr>FModel544.463000008.89260000164.17<.0001
Error241.300000000.05416667
CorrectedTotal2945.76300000
R-SquareCoeffVarRootMSExMean
0.9715937.6811000.2327373.030000
SourceDFAnovaSSMeanSquareFValuePr>F
treat544.463000008.89260000164.17<.0001
tTests(LSD)forx
NOTE:
ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.
Alpha0.05
ErrorDegreesofFreedom24
ErrorMeanSquare0.054167
CriticalValueoft2.06390
LeastSignificantDifference0.3038
Meanswiththesameletterarenotsignificantlydifferent.
tGroupingMeanNtreat
A4.480055
B3.760052
B
B3.640056
C3.120053
D2.520051
E0.660054
本例的上机过程如下:
启动SAS后,在编辑器窗口内逐行将SAS程序录入。
确认无误后,点击工具栏上的程序运行图标
,SAS即开始执行该程序,稍候片刻,系统的主界面变化成为如图1.4所示。
在输出窗口出现如上的输出结果表。
由于窗口行数的限制,用户可以用PageUp和PageDn翻阅。
另外,直接双击SAS浏览窗口内的“结果”下的显示内容,可以看到所有的输出结果。
需要指出的是当点击运行图标
后,输出窗口无显示并且在日志窗口出现出错提示(红色字符)时,用户应当返回编辑器窗口,改正错误,再重新点击运行图标
提交系统执行。
图1.4提交程序后的主界面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 Sas概述 Sas 概述