SAS课件1.docx
- 文档编号:23207932
- 上传时间:2023-05-15
- 格式:DOCX
- 页数:36
- 大小:1,009.10KB
SAS课件1.docx
《SAS课件1.docx》由会员分享,可在线阅读,更多相关《SAS课件1.docx(36页珍藏版)》请在冰豆网上搜索。
SAS课件1
第一章SAS软件入门
1.1SAS软件介绍
SAS英文全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,1972年研制出第1版,1976年成立了SAS软件研究所,正式推出了SAS软件,目前最新版本是9.1版。
SAS是用于数据分析与决策支持的大型集成信息系统,统计分析功能是它的重要组成部分和核心功能,同时SAS也是国际上的标准软件系统。
SAS系统是可以在多个操作系统下运行的跨平台的应用软件系统,这些系统分别是OpenVMSAlpha,Windows,UNIX,z/OS系统。
本书虽然只介绍SAS在Windows系统下的使用方法,但在其他的操作系统下,涉及SAS编程以及相关操作部分的大部分内容都是相同的,差别不大。
Windows下的SAS系统使用比较普及,适合大部分的SAS学习者,同时这部分SAS系统的使用也和Windows系统的特点有着很大的联系。
1.1.1SAS功能模块
SAS系统是一个组合软件系统,它由多个功能模块组合而成,包括以下基本模块:
BASESAS,SAS/ACCESS,SAS/AF,SAS/ASSIST,SAS/CONNECTandSAS/SHARE,SAS/EIS,SAS/EM,SAS/ETS,SAS/FSP,SAS/GIS,SAS/GRAPH,SAS/IML,SAS/INSIGHT,SAS/MDDB,SAS/CDBC,SAS/OR,SAS/QC,SAS/SPECTRAVIEW和SAS/STAT。
下面简要介绍其中一些模块的功能。
(1)BASESAS,基本模块。
是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。
BASESAS为SAS系统的数据库提供丰富的数据管理功能,还支持用标准SQL语言对数据进行操作。
BASESAS可进行基本的描述性统计及变量间相关系数的计算,进行正态分布检验等。
BASESAS能够制作从简单列表到比较复杂的统计报表和用户自定义的式样的复杂报表。
同时它还支持长数据名,并具有强化了的Web功能。
(2)SAS/STAT,统计分析模块。
覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件。
提供十多个过程,可进行各种不同模型或不同特点数据的回归分析。
如正交回归、响应面回归,Logistic回归、非线性回归等,且具有多种模型选择方法。
可处理的数据有实型数据、有序数据和属性数据,并能产生各种有用的统计量和诊断信息。
在方差分析方面,SAS/STAT为多种试验设计模型提供了方差分析工具.更一般的,它还有处理广义线性模型的专用过程。
在多变量统计分析方面,SAS/STAT为主成分分析、典型相关分析、判别分析和因子分析提供了许多专用过程。
SAS/STAT还包含多种聚类准则的聚类分析方法。
(3)SAS/ETS,经济计量学和时间序列分析模块。
提供丰富的计量经济学和时间序列分析方法,是研究复杂系统和进行预测的有力工具。
它提供方便的模型设定手段、多样的参数估计方法。
(4)SAS/OR,运筹学模块。
提供全面的运筹学方法,是一种强有力的决策支持工具。
它能够实现对人力、时间以及其他各种资源的最佳利用。
它包含通用的线性规划、混合整数规划和非线性规划的求解,也为专门的规划问题提供更为直接的解决办法,如网络流问题,运输问题和分配问题等。
(5)SAS/QC,质量控制模块。
为全面质量管理提供了一系列工具。
它也提供一套全屏幕菜单系统,引导用户进行标准的统计过程控制以及试验设计。
(6)SAS/IML,交互式矩阵程序设计语言模块提供功能强大的面向矩阵运算的编程语言。
帮助用户研究新算法或解决SAS中没有现成方法的专门问题。
SAS/IML中的基本数据元素是矩阵。
它包含大量的数学运算符、函数和例行程序,用户用很少的语句便可描述很复杂的计算过程。
(7)SAS/GRAPH,绘图模块。
是强有力的图形软件包。
SAS/GRAPH可将数据及其包含着的深层信息以多种图形生动地展现出来,如直方图、饼形图、星形图、散点相关图、曲线图、三维曲面图、等高线图及地理图等。
SAS/GRAPH提供一个全屏幕编辑器,提供多种设备驱动程序,支持非常广泛的图形输出以及标准的图形交换文件。
(8)SAS/FSP,快速数据处理的交互式菜单系统模块。
提供对SAS数据集的屏幕浏览和编辑功能。
它能快速地打开SAS数据集,并提供数据录入、编辑和查询等功能。
同时也是一个开发一具。
(9)SAS/AF,交互式应用开发模块。
为应用开发工具。
SAS系统是功能丰富的软件包,用户使用SAS/AF可将包含众多功能的SAS软件作为方法库,利用SAS/AF的屏幕设计能力以及SCL语言的处理能力来快速开发各种功能强大的应用系统。
SAS/AF也采用了先进的OOP面向对象编程)技术,使用户可以方便快速地开发各类具有图形用户界面(GUI)的应用系统。
(10)SAS/ASSIST,菜单驱动界面模块。
面向任务的菜单驱动界面,为SAS系统提供了面向任务的菜单驱动界面,借助它可以通过菜单系统来使用SAS系统其他产品。
它自动生成的SAS程序既可辅助有经验的用户快速编写SAS程序,又可帮助用户学习SAS语言。
(11)SAS/ACCESS,访问外部数据模块。
提供了和目前许多流行数据库软件的接口。
利用SAS/ACCESS可建立外部异构数据库的一个统一的公共数据界面。
SAS/ACCESS提供的与外部数据库的接口是透明的和动态的.用户不必将数据真正读入SAS数据库,而只需在SAS中建立对外部的描述(即View)文件,便可将此文件当作真正存储着数据的SAS数据集使用。
对一些反复经常使用的外部数据,可以利用SAS/ACCESS将数据真正提取进入SAS数据库,SAS/ACCESS提供的接口是双向的,既可将数据读入SAS,也可在SAS中更新外部数据或将SAS数据加载到外部数据库中。
目前,SAS/ACCESS支持的数据库主要有IMS-DL-I,SQL/DS,DB2,ADABAS,Rdb,Oracle,Sybase,Ingres,Informix,DBF/DIF,Excel和ODBC等。
(12)SAS/EIS,企业信息系统模块。
是决策支持表现工具,也是一个快速应用开发工具。
SAS/EIS完全采用新兴的面向对象的编程模式。
EIS是以生动直观的方式〔图或表)将关键性或总结性信息展现给使用者的非常易用的系统。
(13)SAS/INSIGHT,可视化探索工具模块。
是可视化的数据探索工具。
它将统计方法与交互式图形显示融合在一起,为用户提供一种全新的使用统计分析方法的环境。
(14)SAS/CALC,电子表格模块。
是功能强大的电子表格软件,它具有财务分析、数值建模、数据整合及管理的能力。
初学者和有经验的人员都能通过一个标准表格式界面管理和分析电子表格中的数据。
程序员和应用开发人员可以使用强有力的编程窗口,利用电子编程语言,建立完整的应用。
(15)SAS/CONNECT,分布式数据处理模块。
在目前标准的网络环境之下,通过SAS/CONNECT可以使各平台的SAS系统建立内在联系,实现分布处理,从而有效地利用各平台的数据及其资源。
SAS/CONNECT既提供远程计算服务,也提供远端数据服务。
SAS/CONNECT支持多种分布处理模式,包括流行的Client/Server方式。
(16)SAS/WA,企业级数据仓库管理模块为数据仓库管理工具。
它在其他SAS软件的基础上提供了一个建立数据仓库的管理层,包括定义数据仓库和主题,数据转换和汇总,汇总数据的更新,Metadata的建立、管理和查询,DataMarts和InfoMarts的实现。
(17)SAS/EM,企业级数据挖掘模块。
为企业级数据挖掘集成环境软件。
数据挖掘产品SAS/EM采用图形化界面,菜单驱动、拖拉式操作.是一个对用户非常友好且功能强大的数据挖掘集成环境。
利用SAS/EM中具有明确代表意义的图形化模块将这些数据挖掘的工具单元组成一个处理流程图,并依此来组织一个完整的数据挖掘过程。
这一过程在任何时候均可根据具体情况的需要进行修改、更新并将满足需要的模式存储起来,以便此后重新调出来使用。
1.1.2SAS模块功能分类
SAS模块按功能大致分为四类:
(1)数据库及其管理类;
(2)分析工具类;
(3)面向对象的开发平台类;
(4)方便用户的外层技术类。
SAS功能与主要模块如表1.1所示。
表1.1SAS功能与主要模块举例
功能
主要模块
数据库及其管理
BASESAS,ESP,ACCESS,SQL…
分析工具
STAT,ETS,QC,OR,INSIGHT,CALC…
开发展现工具
BASESAS,IML,AF,EIS,GRAPH,…
分布处理与数据仓库
CONNECT,WA…
1.1.3SAS系统特点
SAS是由大型机系统发展而来,在设计上主要是针对专业用户进行设计(这与SPSS相反),其核心操作方式就是程序驱动,用户在编辑器(EDITOR)窗口中输入程序,分析结果以文本的形式在输出(OUTPUT)窗口中输出。
程序的功能强大,通过编程,用户可以实现几乎所有的功能,包括数据管理和数据分析。
但是用户必须先学习SAS语言,还要懂得分析过程中各种参数、函数的意义。
尽管SAS语言是编程能力强且简单易学的非过程语言,还是给初学者造成了一定的障碍,使得入门比较困难。
但是SAS有着强大的显示管理系统,图形界面易学易用,通过在不同的窗口之间的切换以及恰当的使用SAS界面上的菜单,用户同样能实现SAS系统的各种功能,而命令和功能键的使用还能实现快速操作,起到事半功倍的作用。
1.1.4SAS技术水平层次分类
SAS技术水平可以分为以下三个层次。
第一层次:
会使用SAS菜单以及一些菜单界面的SAS模块,如INSIGHT、ANALYST等,了解初步的SASBASE语句,能用SAS系统作简单的数据加工处理和分析,具有一定的数理统计知识,掌握SAS/STAT模块中的一些常用的过程。
第二层次:
精通SASBASE,能用SAS语言编写复杂的SAS程序,能用SASBASE进行大型的、复杂的数据加工整理和展现,掌握SAS与外部数据文件的接口,会进行复杂的统计建模和分析等,初步掌握一种基于SAS的开发工具。
第三层次:
在一、二层面基础上,进一步掌握SAS/AF,SAS/IML等、能开发基于SAS的数据管理和分析模块。
1.1.5本章目的
本章目的就是让初学者能够快速地熟悉SAS系统的应用,完成一些简单的数据处理和分析,即快速得到SAS技术第一层面水平。
但这绝不是本书的目的,仅具备第一层面的SAS水平是很难体会SAS的优势,不如学其他任意一种简单的统计分析软件。
本书目的是让读者的SAS技术达到第二层面水平,即能充分利用SAS的强大功能进行金融数据加工处理、数据整合、数据展现及简单的金融建模和计算。
本章主要介绍SAS系统的菜单操作,配合命令和功能键的使用。
有些地方也会附带介绍SAS系统中的一些基本概念,使初学者能够边练习边了解SAS系统。
注意:
本章基于SAS菜单操作,基本上都可以通过SAS语言编程来实现。
所以,读者一定要学好本书关于SAS语言方面的内容,那些才是SAS软件的精华,只有利用SAS语言编写程序才能更有效地发挥SAS软件的强大功能。
1.2SAS安装与启动
1.2.1SAS安装
本小节介绍SAS9.1简体中文版的安装过程。
第1步:
准备好安装所需文件。
文件列表如下:
另外,需要安装虚拟光驱daemontools。
第2步:
首先运行setup的ISO文件,按弹出窗口提示,载入SAS9.1文件夹中setinit.sss文件。
第3步:
按屏幕提示载入不同的ISO文件,在选择语言时一般选简体中文即可。
第4步:
安装完成。
1.2.2SAS启动
正确安装SAS系统后,可以按照下列几种方式启动SAS,
·“开始”菜单|“所有程序”|"SAS"|"SAS9.1";
·桌面快捷方式;
“开始…菜单|“运行”,键入C:
\ProgramFiles/SAS/SAS9.1\SAS.exe(SAS.exe的路径)。
按照上述的任何一种操作,都可以顺利启动SAS系统。
1.2.3SAS运行方式
SAS系统有多种运行方式:
窗口模式(WindowingEnvironment),行交互模式(InteractiveLine),非交互模式(Noninteractive)和批处理模式(Batch)。
以后如果没有其他说明,讲解的SAS运行方式都是窗口模式。
在SAS窗口模式下,可以使用编辑器编写和运行程序语句,在日志窗口查看程序运行信息,在输出窗口与结果窗口查看程序输出结果。
输出窗口与结果窗口中,可以查看、存储、删除程序的输出结果。
在窗口模式的资源管理器窗口中,可以很方便地查看和管理储存在逻辑库中的SAS文件,设置连接外部文件的快捷方式等。
总之SAS窗口模式是最常使用的SAS运行方式,后面会逐步介绍如何使用SAS的窗口操作,如何编写SAS程序,以及如何理解和掌握SAS术语等。
1.3SAS工作界面
正常启动SAS中文版后,会进入图1.1所示的操作界面。
操作界面主要分为菜单栏、工具栏、功能窗口(包括资源管理器窗口、日志窗口、编辑器窗口、输出窗口和结果窗口)等部分。
不同的窗口为SAS用户提供了不同功能的运行环境。
1.3.1菜单栏
SAS系统中的菜单有两种类型,一种是菜单栏的下拉菜单,另一种是窗口的弹出菜单,如图1.2所示。
每一个窗口都有各自相应的下拉菜单和弹出菜单。
要显示下拉菜单只需要单击菜单栏中的按钮即可。
要显示弹出菜单,则在相应的窗口右击。
初学者不妨分别激活以上介绍的5个功能窗口,查看它们的下拉菜单和弹出菜单有什么区别。
多级菜单的右端有一个小三角图标显示。
当没有任务时,可以在菜单以外的任何地方单击鼠标来取消菜单。
如果单击菜单没有出现预期的选项,则应确认是否激活了适当的窗口。
图1.1SAS操作界面
图1.2SAS的下拉菜单和弹出菜单
1.3.2工具栏
工具栏在菜单栏的右下方,包含一系列快捷按钮,这些按钮都是一些常用的SAS命令,如运行程序、保存等。
工具栏的设定就是为了让用户能够快速、方便地操作SAS软件,如发出运行语句的指令、中断运行等。
要想知道每个快捷按钮的作用,一种办法是将鼠标放到按钮上停留一会儿,就会出现该按钮功能的简单说明,另一种办法是单击菜单栏中“工具”|"定制”|“定制”选项卡,这时候出现一个工具定制窗口,如图1.3所示。
单击每个按钮就可以查看该按钮的详细说明。
包括提示文本和帮助文本。
同样也可以在通过这个窗口添加、删除工具栏中的按钮。
与菜单一样,工具栏的图标在不同窗口状态下也不一样。
图1.4分别是资源管理器窗口和编辑器窗口的工具栏。
当前不可以使用的图标是灰色的。
初学者不妨多使用工具栏上的帮助图标。
在不同的窗口状态下单击帮助图标,可以启动帮助系统,提供关于当前窗口的帮助信息。
图1.3“定制工具”窗口
图1.4工具栏
1.3.3命令行
SAS用户可以通过在命令行中输入SAS命令来快速完成一些SAS任务。
比如输入keys就可以激活功能键的设定窗口,如图1.5所示。
图1.5命令行举例
要想全面了解SAS9.1的命令语句,可以查看帮助文档中的所有命令汇总表。
SAS帮助文档的使用在本章后面会提到。
1.3.4功能窗口
SAS系统主要功能窗口与相关操作见表1.2。
1.“资源管理器”窗口
表1.2SAS系统主要功能窗口与相关操作
窗口
菜单路径
命令
以“只显示内容”视图显示的“SAS
资源管理器”窗口(没有树状视图)
“查看”|“只显示内容”
SAVEENV
“结果”窗口
“查看”|“结果”
ODSRESULTS
程序编辑器
“查看”|“程序编辑器”
PGM
增强型编辑器
“查看”|“增强型编辑器”
WEDIT
“日志”窗口
“查看”|“日志窗口”
LOG
“输出”窗口
“查看”|“输出”
OUTPUT
"SAS资源管理器”窗口
“查看”|“SAS资源管理器”
EXPLORER
“SAS资源管理器”窗日是访问数据的中心位置,数据包括目录、表(数据集)、逻辑库和主机文件数据,可以通过“资源管理器”窗口对SAS文件进行浏览。
图1.6为“树状结构”少的“资源管理器”窗口,SAS默认的是“只显示内容”的"SAS资源管理器”窗口。
“SAS资源管理器”窗口下,可以执行基本的SAS任务:
·创建新的逻辑库和文件快捷方式;
·创建新的逻辑库成员和目录条目;
·打开和编辑SAS文件。
以上功能在SAS窗口操作一节中有详细介绍。
图1.6SAS资源管理器窗口
“SAS资源管理器”窗口有两个不同的视图,这取决于树视图的开关状态。
在大多数操作环境中,SAS默认打开“只显示内容”视图形式的“SAS资源管理器”窗口(树视图已关闭),图1.6是打开树视图的状态。
可以按如下方式在两种状态之间进行转换。
首先单击SAS资源管理器,然后在菜单栏单击“查看”下拉菜单,选中或者取消“显示树状结构”即可。
“只显示内容”的“SAS资源管理器”是只有一个窗格的窗A。
在"SAS资源管理器”窗口视图中,所有项都会出现。
完整的“SAS资源管理器”是有两个窗格的窗口。
如图1.7所示。
使用左窗格中的文件夹视图(也称为树视图)可切换文件夹及子文件夹。
右窗格显示左窗格中所选项献内容。
根据操作环境,可以使用以下方法打开“SAS资源管理器”窗口(打开树视图和列表视图)。
菜单:
“查看”|“SAS资源管理器”。
命令:
EXPLORER。
工具栏:
SAS资源管理器。
图1.7SAS资源管理器窗口
2.结果窗口
可以通过结果窗口对程序的输出结果进行浏览和管理。
结果窗口有3种呈现方式,SAS系统默认为树视图。
树视图以每个过程语句为单位,对数据结果进行分类,并按照运行的先后顺序将结果排列成树状结构,可以通过单击+号来展开每个过程语句产生的一系列的结果文件,单击打开这些结果文件即可查看相应的程序输出结果。
SAS可以用一种或多种格式(或类型)产生输出。
默认类型是“列表”输出(如图1.8所示的“查询结果”)。
其他输出类型包括HTML,"输出数据集”和PostScript。
“结果”窗口将显示指向过程输出的指针。
要设置输出类型,可使用菜单栏中的“工具”|“选项”命令,在弹出的“参数选择”对话框的“结果”选项卡中进行设置,如图1.9所示。
图1.8“结果”窗口
图1.9“参数选择”窗口
单击创建HTML时,输出结果同时展现在HTML文件中。
3.增强型编辑器窗口
在SAS中一般使用增强编辑器窗口编写和提交程序。
SAS9.1版本的默认编辑窗口即为增强型。
它比普通编辑窗口增加了如下功能。
(1)使用特定颜色对SAS程序、SCL程序以及HTML和XML文件的元素进行显示,同时进行相关语法检查。
(2)创建和格式化自定义的关键词。
(3)每个过程步、数据步或者宏的程序段都可以实现展开和收缩的功能,以便对SAS程序的宏观结构有更好的了解。
(4)通过定义缩写来快速输入一段文字。
(5)通过显示行号使得程序代码更具可读性。
(6)设定增强型编辑器的快捷功能键。
(7)同时打开一个文件的多个视图。
(8)将光标停留在语言元素上,按F1就可以直接进入到SAS帮助文档中该语言元素的说明部分。
当然有时候该语言元素有多个主题,可以根据需要进行选择。
4.日志窗口
“日志”窗口用来查看程序运行信息。
(1)提交的程序语句;
(2)系统消息和错误;
(3)程序运行速度和时间。
“日志”窗口中的元素根据以下类型呈现不同的颜色,如图1.14所示。
(1)程序行(黑色):
以语句标号开始;
(2)提示(蓝色):
以NOTE开始;
(3)警告(绿色):
以WARNING开始;
(4)错误(红色):
以ERROR开始。
图1.10“日志”窗口
5.输出窗口
输出窗口用来查看SAS程序的输出结果,前面讲到的结果窗口和输出窗口紧密关联。
在结果窗口查看多个输出结果时.最后的输出就是输出窗口的结果。
一般情况下,若有结果输出到输出窗口中,则该窗口会自动激活。
若同时有多个输出结果则在结果窗口以树状图形式排列,单击结果表符号即可查看相应的输出。
通过下列程序来查看sashelp逻辑库中的文件class的内容。
procprintdata=sashelp.class;
run;
按F8键提交程序,SAS界面如图1.11所示。
图1.11SAS“输出窗口”
1.4SAS窗口操作
1.4.1窗口切换
在SAS工作界面中,可以使用多种方式来实现不同功能窗口的切换,最直接的方式是单击该功能窗口区域,或是单击该功能窗口的窗口条标签。
同样,也可以通过菜单栏中的“窗口”或“查看”菜单选择进入所需要的窗口。
还可以通过在命令行输入命令或单击功能键的方式来打开一些窗口,相关命令语句前面己经介绍。
4.2视图停放
SAS默认启动了停放视图,并在工作界面的左边停放一些常用的窗口,如”结果”和“资源管理器”窗口。
停放窗口
1)选择窗口以使其成为当前窗口。
2)选择“窗口”|“停放”命令。
注意,如果窗口不能停放,则停放菜单项变灰。
取消停放窗口
1)在停放区域的底部,单击要取消停放的窗口的选项。
2)选择“窗口”|“停放”命令。
完全关闭停放
1)选择“工具”|“选项”|“参数选择”命令.
2)在“参数选择”对话框中,单击“视图”选项卡.
3)选中“停放”视图复选框并单击“确定”按钮。
所有窗口都被取消停放了。
注意,如果停放视图在“参数选择”对话框中关闭,则必须将该视图重新打开才能停放各个窗口。
停放开启之后,任何可以停放的窗口都会自动停放。
调整停放窗口的大小
直接将光标放在停放窗口与其他窗口栏的交界处,待光标变成拖拽提示符的时候调整大小。
如果要使用键盘调整停放视图的大小,请按Alt+W+S组合键或选择“窗口”|“调整停放视图大小”。
1.4.3文件浏览及操作
1.文件浏览
前面提到了使用SAS“资源管理器”窗口浏览SAS文件。
这里介绍一些对于浏览数据有用的操作,以“只显示内容”模式为例。
在查看逻辑库中的文件时,SAS默认的模式是大图标,如果逻辑库中文件比较多,使用大图标就很不方便,这时可以单击菜单栏“查看”
如图1.12所示。
在弹出菜单中选择“列表”或者“详细资料”来显示逻辑库中的文件内容。
2.增加目录、数据表
单击目标逻辑库(除sashelp和maps外)。
选择“新建”,就可以按照提示增加目录或SAS数据表。
3.新建逻辑库
在逻辑库级别,在空白处右击,单击“新建”,出现如图1.13所示对话框。
在“名称”栏中输入新的逻辑库名称。
在“引擎”下拉列表中根据数据来源选择不同的引擎,如果只是想建立本机地址上的一个普通的SAS数据库。
可以选择“默认”。
然后选中“启动时启用”,在逻辑库信息中,单击路径后面的“浏览”按钮,选择与这个逻辑库相对应的物理地址。
选项窗口可以不填,单击“确定”按钮,即产生一个新的逻辑库。
图1.12“视图”菜单栏
图1.13“新建逻辑库”对话框
4.复制粘贴数据表
要复制粘贴逻辑库中的数据表和其他文件,只需在资源管理器窗口中进入源逻辑库选择数据表,按Ctrl+C键,然后进入到目标逻辑库中,按Ctrl+V键就可以把这些表复制过来。
5.创建文件快捷方式
(1)选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 课件