SPSS上机指导书.docx
- 文档编号:29860448
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:58
- 大小:4.91MB
SPSS上机指导书.docx
《SPSS上机指导书.docx》由会员分享,可在线阅读,更多相关《SPSS上机指导书.docx(58页珍藏版)》请在冰豆网上搜索。
SPSS上机指导书
《SPSS软件》上机指导书
编著高宏伟
北京交通大学经济管理学院
前言
SPSS(StatisticsPackageforSocialScience)--社会科学统计软件包是世界是著名的统计分析软件之一。
20世纪60年代末,由美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS。
20世纪80年代以前,SPSS统计软件主要应用于企事业单位。
1984年SPSS总部首先推出了世界第一个统计分析软件微机版本到今,已推出9个语种版本,应用于自然科学、技术科学、社会科学的各个领域,如经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。
世界上许多有影响的报刊杂志对SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。
SPSSforWindows是一个组合式软件包,它集数据整理、分析功能于一身。
SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。
SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。
SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
SPSSforWindows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,它和SAS、BMDP并称为国际上最有影响的三大统计软件。
和国际上几种统计分析软件比较,它的优越性更加突出。
在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。
SPSSforWindows操作简单,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。
上机1:
描述统计
一、上机目的
1.学会应用两种以上的方法完成描述统计学所学的统计量的计算程序;如列出数据的频数分布表;计算算术平均数、中位数、众数;计算全距、四分位差、标准差、方差等。
2.能够完成统计图的绘制(主要包括直方图、曲线图、饼形图、茎叶图);
3.能够撰写出规范的描述统计分析报告。
二、上机要求
1.前20分钟,主讲老师通过例题演示描述统计方法的应用;
2.中间70分钟,学生仿照演示题,独立做一个练习题目;期间老师课堂巡视,随时解决学生提出的问题;
3.后20分钟,每位同学将自己的计算结果,以Word形式,撰写成统计分析报告,老师给出是否合格的评价。
4.在完成练习题的时候,鼓励学生之间相互交流探讨;
5.鼓励学生尝试发现软件的新功能。
三、上机演示内容与步骤
下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。
计算各项描述统计量值的程序使用步骤如下:
步骤1:
用SPSS打开已知的数据文件
选择菜单“File—>Open—>Data”,在对话框中找到需要分析的数据文件“SPSS/Employeedata”,然后选择“打开”。
打开的数据文件显示如下:
步骤2:
计算所要求的描述统计量值及频数分布
频数就是一个变量在各个变量值上取值的个案数。
如要了解公司员工的薪水情况,需要知道所有员工薪水状况,以及在每个薪酬水平上有多少个员工,这就需要用到频数分析。
变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。
1.打开文件之后,选择菜单“Analyze—>DescriptiveStatistics—>Frequencies”。
见下图。
出现如下窗口之后,按后面的说明进行选项。
2.确定所要分析的变量
本例中假设要分析的变量是雇员的当前工资(CurrentSalary)。
此时,要在“Frequencies对话框”中选中左侧列表框中的“CurrentSalary[Salary]”,之后点击列表框中间的箭头按钮,将变量CurrentSalary加入到右侧Variable(s)列表框中。
然后,选择位于小窗口下端的“Displayfrequencytables复选框”,以确定要输出频数分布表。
3.选择所要计算的统计量
在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图所示,选择统计输出选项。
4.选项说明
(1)PercentileValues栏
Quartiles:
显示25%,50%,75%的四分位数值
在Cutpointsfor___equalgroups小框内,输入整数k时,表示将所选变量的数值从小到大划分为k等分,并将输出各等分点处的变量数值
在Percentile(s)右边的小框内,键入0~100间的一个数之后,单击Add按钮添加到下面的方框内,此操作过程可以重复。
例如输入15,55,85时,输出结果将会显示15%,55%,85%百分位处的变量值。
单击Change和Remove按钮可以修改或删除框内的数值
(2)Dispersion(离中趋势)栏
各统计量符号表示如下:
Stddeviation标准差;Minimum最小值;Variance方差;Maximum最大值;Range极差
(3)CentralTendency(集中趋势)栏
各统计量符号表示如下:
Mean均值(算术平均数);Mode众数;Median中位数;Sum总和
(4)Distribution(分布特征)栏
各统计量符号表示如下:
Skewness偏度;Kurtosis峰度
步骤3:
结果输出与分析
点击Frequencies对话框中的“OK”按钮,即得到下面的结果。
(1)Statistics(统计量)汇总表
从Statistics表中可以清楚的看到当前薪水(CurrentSalary)的各项描述统计量的数值,这些数值是按我们上一步选定的计算统计量的要求而计算的。
我们可以看出,要求计算的均值、众数、标准差、方差等都在其中,分别为$34419.6、$30750、$784.311、$2.9E+08。
(2)Frequencies(频数)分布表
从Frequencies表中可以清楚的看到在不同薪酬档次上员工的人数、所占比例。
例如,薪水为$15750的员工有1人,占所有员工的0.2%。
本处,没有对结果进行详细说明,希望同学们要学会解释所计算的结果。
到此为止,有关描述统计量与频数分布的spss计算步骤演示完毕。
下面我们给出另一种计算程序,希望同学们也熟练掌握。
描述统计-数据探索(Explore)方法
调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。
它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步。
探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。
一般以图形方式输出,直观帮助研究者确定奇异值、影响点、还可以进行假设检验,以及确定研究者要使用的某种统计方式是否合适。
步骤1:
在打开的数据文件上,选择如下命令:
选择菜单“Analyze—>DescriptiveStatistics—>Explore”,打开Explore对话框。
步骤2:
确定所要计算的变量及描述统计量
假定我们仍然研究的是前面给出的例题,想给出同样的计算结果。
操作步骤如下:
(1)选择要研究的变量。
从左侧源变量清单中选择“当前工资(CurrentSalary)”移至DependentList(因变量)框中,若此时单击OK,即可获得所有系统默认的选项下作出的描述统计量的结果。
(2)对数据分组。
若想对数据先分组,然后再计算该变量的相关描述统计量时,则应从左侧源变量清单中选择一个或几个分组变量移至FactorList(因素)框,本例中,选择的分组变量是“雇员类别(EmploymentCategory)”,若此时单击OK,即可获得因变量按各分组变量进行的各项系统默认的分组探索结果。
(3)选择想要计算的描述统计量。
在出现如下小对话窗口(Explore:
Statistics)后,需要进行选项,以说明对选择好的变量要计算的是哪些描述统计量值。
其各项选择说明如下。
Descriptives:
选择该选项则一次性地输出所有的描述统计量值,如算术平均值、中位数、众数、5%调整平均数、标准差、极差、方差等。
因此不必逐一选择各个描述统计量
其他项目简单说明如下:
ConfidenceIntervalforMean将显示总体均值的95%置信区间,95%为系统默认的置信概率。
取值范围为1—99。
M-estimators:
输出稳健极大似然估计量
Outliers:
输出5个最大和最小的观测值
Percentiles:
输出5%,10%,25%,50%,75%,90%,95%的百分位数
(4)对所要计算的变量的频数分布及其统计量值作图
打开“Plots对话框”,出现如下图形。
对有关的部分选项说明如下:
①Boxplots(箱图)选项栏
Factorlevelstogether:
将每个因变量对于不同分组的箱图并列显示,利于比较各组在因变量同一水平上的差异
Dependentstogether:
所有因变量生成一个箱图,这样可以比较分组变量同一水平上各个因变量值的分布情况
None:
表示不显示箱图
②Descriptives栏
Stem-and-leaf:
显示茎叶图
Histogram:
显示直方图
③选中Normalityplotswithtests框中输出显示正态分布图形,同时输出Kolmogorov-Smirnov统计量中的Lilifors显著性水平
④Spreadvs.LevelwithLeveneTest框输出散布-层次图,其中包括回归直线斜率以及方差齐次性的Levene检验。
如果没有指定分组变量,那么此选项无效,其中:
None:
表示不生成散布-层次图
Powerestimation:
转换幂值估计,表示对每一组数据产生一个中位数范围的自然对数与四分位范围的自然对数的散点图
Transformed:
对原始数据进行转换,由用户在Power下拉框中指定幂变换使用的幂值,Power下拉框共有:
三次方(Cube)、平方(Square)、平方根(1/Squareroot)、取对数(Logarithm)等
Untransformed:
不对原始数据进行转换
步骤3:
结果的输出与说明
(1)CaseProcessingSummary表
在CaseProcessingSummary表中可以看出Clerical个案363,Custodial个案27,Manager个案84,均无缺失值。
(2)Descriptives表
Descriptives表是CurrentSalary变量的分组描述统计结果。
表的第一部分是Clerical薪水的统计,其中包括均数$27838.5,均数的标准误为$397.217,均数的95%置信区间为$27057.4——$29619.7,5%修正均数为$27290.5,中位数为$26550.0,方差为5.7E+07,标准差为$7567.99,最小值为$15750,最大值$80000,全距为$64250,四分位全距为$8400.00,偏度系数为1.905,偏度系数的标准误为0.128,峰度系数为7.977,峰度系数的标准误为0.255。
表的下面部分分别是Custodial和Manager的统计信息。
(3)不同职位员工薪水直方图显示
(4)茎叶图描述
茎叶图自左向右可以分为3大部分:
频数(Frequency)、茎(Stem)和叶(Leaf)。
茎表示数值的整数部分,叶表示数值的小数部分。
每行的茎和每个叶组成的数字相加再乘以茎宽(StemWidth),即茎叶所表示的实际数值的近似值。
上面是Clerical的茎叶图。
该图最后一行表示两个个案。
以第一行数据为例,频数为2,茎为1,叶为0.5,茎宽为10000,表示有两个个案的薪水为1.5×10000=15000。
Custodial和Manager的茎叶图在此省略。
(5)箱图
图中红色区域的方箱为箱图的主体,上中下3条线分别表示变量值的第75、50、25百分位数,因此变量的50%观察值落在这一区域中。
方箱中的中心粗线为中位数。
箱图中的触须线是中间的纵向直线,上端截至线为变量的最大值,下端截至线为变量的最小值。
四、上机1报告概要
1.指明所计算各个结果的统计含义;
2.依据所的统计结果,撰写描述统计的分析报告;
3.上机2:
统计图的绘制
SPSS绘图功能很强,能绘制许多统计图形,这些图形既可以在统计分析过程中产生,也可以直接由Graphs图形菜单中所包含的一系列选项来实现。
一、上机目的
1.学会利用统计图把统计资料所反映的数量变化趋势、分布状态和相互关系等情况形象直观地表现出来;
2.学会对所制作的统计图进行阅读、比较和分析,从中发现数据所反映的社会经济现象与规律;
3.要求掌握制作条形图、饼图、直方图、曲线图的方法;
二、上机演示内容与步骤
下面采用的数据文件同前例题,它是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们利用该数据文件学习统计图的绘制。
步骤1:
用SPSS打开已有的数据文件
选择菜单“File—>Open—>Data”,在对话框中找到需要分析的数据文件“SPSS/Employeedata”,并“打开”。
步骤2:
绘制条形图(BarCharts)
作图要求:
以该数据为例,先按员工教育水平分类(教育水平是按接受教育的年限为主的),然后在分好的类别中,再按员工职业类别分类(经理、保管员、服务员),最后计算各种类别人员的平均工资水平并绘制条形图。
作图步骤如下:
(1)打开文件并选择绘制条形图选项。
选择菜单“Graphs—>Bar”,打开BarCharts(条形图)选择对话框,见下图。
出现下图所示之后,选择合适的命令选项,各项命令选项说明如下:
(2)命令选项的选择
①条形图形状的选择-条形图图标说明
●Simple:
将各类别数值用平行且等宽的条形简单地并列在一起的图形。
●Clustered:
有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类,并用两个以上的条形图并列来分别表示。
●Stacked(分段条形图):
有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类。
作图时,以条形的全长代表分成的第一大类别,条形内部各段的长短代表第二类别的组成部分,各段之间是用不同的线条或颜色表示。
②计算数据统计量的方式选择-DatainChartAre
ØSummariesforgroupsofcases:
先对所有数据分类,然后对每类创建条形图
ØSummariesofseparatevariables:
对每个变量创建条形图
ØValuesofindividualcases:
对每个数据创建条形图
(3)条形图变量及参数选择
在BarCharts对话框中选定条形图类型后,单击Define按钮,打开条形图变量及参数选择对话框
(1)CategoryAxis:
表示坐标轴上的分组变量(第一次分类的变量)。
(2)DefineClustersby:
第二次分类的变量
(3)BarsRepresent:
确定条形图所显示的数值。
有如下选项可供选择:
ØNofcases:
显示总的观测值数
Ø%ofcases:
分组个数所占的比例
ØCumulativenofcases:
累计频数(按个数统计)
ØCumulative%ofcases:
累计频率(按比例统计)
ØOthersummaryfunction:
其他描述统计量
(4)条形图输出
步骤3:
绘制饼形图(PieChars)
作图说明,仍然利用上面的数据文件,Graph表显示出了按照职位和教育程度分类,员工薪水的均值情况。
例如,在受教育15年这个水平上,Clerical薪水均值为30000,Custodial薪水均值为25000,Manager薪水均值为48000。
(三)饼形图(PieCharts)
饼形图又成圆图,是以整个圆的面积代表被研究对象的总体,按各组成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系的统计图。
想通过饼形图(PieChars)来了解该公司各员工类别在公司总人数中所占的比例,员工类别构成比例。
作图步骤如下:
(1)打开已有数据文件并选择绘制饼形图命令选项
选择菜单“Graphs—>Pie”,打开PieCharts选择对话框。
见下图,
(2)命令选项的选择
2.选项说明
DatainChartAre(图中数据的描述)
ØSummariesforgroupsofcases:
根据分组变量先对所有个案进行分组,然后对分组个案创建条形图
ØSummariesofseparatevariables:
对每个变量创建条形图
ØValuesofindividualcases:
对每个个案创建条形图
(3)饼形图变量及参数选择
①SlicesRepresent:
确定扇形片的代表含义。
有如下选项:
ØNofcases:
总观测值
Ø%ofcases:
分组个数所占的比例
ØCumulativenofcases:
累计频数
ØCumulative%ofcases:
累计频率
ØOthersummaryfunction:
其他统计量
②DefineSlicesby:
确定扇形片代表的分类变量
(4)输出饼形图
由饼形图可以看出,Clerical占了所有员工的75%多,Manager大概占了18%,其余为Custodial。
步骤4:
绘制交互式条形图(InteractiveBar)
作图说明,想了解该公司接受不同教育年限的人数分布情况、了解不同性别平均收入水平情况,并通过交互式条形图加以显示。
(1)打开文件并调用交互式条形图绘制选项
选择菜单“Graphs—>Interactive—>Bar”,打开CreateBarChart(创建条形图)对话框。
在本例中,
将Count变量拉入纵坐标轴,将EducationalLevel变量拖入横坐标轴。
(2)创建交互式条形图
●AssighVariables:
用于设置变量和图类型
●BarChartOptions:
条形图选项
●ErrorBars:
误差条图
●Titles:
标题选项
●Options:
选项
(3)交互式条形图输出
从图中可以看出,在各个教育水平上的人数。
在图中可以看出女性平均收入为$28032,男性平均收入为$41442。
(五)曲线图(LineCharts)
曲线图又称线图,是用线段的升降来说明现象变动情况的一种统计图,主要用于表示现象在时间上的变化趋势、现象的分配情况和现象间的依存关系等。
1.曲线图绘制
选择菜单“Graphs—>Line”,打开LineCharts(条形图)选择对话框。
2,选项说明
三、上机2报告概要
请作出下列图形,数据资料见下:
答案
标题:
婴儿母乳与配方奶日摄入量
日时间:
2:
105:
309:
2012:
0015:
3019:
1021:
0523:
50
母乳/配方摄入量:
60/5080/3070/4070/3050/6070/3080/3060/50
资料来源:
婴儿健康指南,2003年。
上机3:
点估计与区间估计
一、上机目的
1.熟悉点估计概念与操作方法;
2.熟悉区间估计的概念与操作方法;
3.学会进行总体均值、总体比率的区间估计。
二、上机演示内容与步骤
下面将学习“总体方差未知,置信度为95%下的区间估计”与“两个总体均值之差的区间估计(总体方差未知且不等)”等4种情形的操作。
情形1:
总体方差未知,置信度为95%下的总体均值的区间估计
例题:
为研究在黄金时段中,即每晚8:
30-9:
00内,电视广告所占时间的多少。
美国广告协会抽样调查了20个最佳电视时段中广告所占的时间(单位:
分钟)。
请给出每晚8:
30开始的半小时内广告所占时间区间估计,给定的置信度为95%。
操作程序:
步骤1:
打开SPSS,按如下图示格式输入原始数据,建立数据文件:
“电视广告所占时间.spss”。
这里,time表示电视广告所占时间的变量。
步骤2:
选择区间估计选项,方法如下:
(1)采用“数据探索”过程
选择菜单“Analyze—>DescriptiveStatistics—>Explore”,打开Explore对话框。
(2)变量选择
从源变量清单中将“time”变量移入DependentList框中。
(3)确定输出选项
单击上图右下方的“Statistics”按钮打开“Explore:
Statistics”对话框。
在ConfidenceIntervalforMean:
的选项中,键入95%,表示计算选择的置信区间。
完成后单击“Continue”按钮回到Explore窗口。
(4)结果输出
单击上图中“OK”按钮,输出结果如下表所示。
步骤3:
计算结果简单说明
如上表显示。
从上表“95%ConfienceIntervalforMean”中可以得出,每晚8:
30开始的半小时内广告所占时间区间估计(置信度为95%)为:
(6.2705,6.7795),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。
点估计是:
6.5250。
情形2:
两个总体均值之差的区间估计(总体方差未知且不等)的情形
例题:
TheWallStreetJournal(1994,7)声称在制造业中,参加工会的妇女比未参加工会的妇女的报酬要多2.5美元。
想通过统计方法,对这个观点是否正确给出检验。
假设抽取了15位女性工会会员与20位非工会会员女性报酬数据。
要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计,预设的置信度为95%。
步骤1:
打开SPSS,按如下图示格式输入原始数据,建立数据文件:
“工会会员工资差别.spss”。
这里,“会员”表示是否为工会会员的变量,y表示是工会会员,n表示非工会会员,“报酬”表示女性员工报酬变量,单位:
千美元。
步骤2:
计算两总体均值之差的区间估计,采用“独立样本T检验”方法。
选择菜单“Analyze—>CompareMeans—>Independent-SampleTTest”,打开Ind
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 上机 指导书