SPSS考试大纲.docx
- 文档编号:6836885
- 上传时间:2023-01-11
- 格式:DOCX
- 页数:12
- 大小:97.13KB
SPSS考试大纲.docx
《SPSS考试大纲.docx》由会员分享,可在线阅读,更多相关《SPSS考试大纲.docx(12页珍藏版)》请在冰豆网上搜索。
SPSS考试大纲
第一章数据文件建立与管理
1、SPSS基本资料:
SPSS(StatisticalPackagefortheSocialScience)社会科学统计软件包,是世界三大著名统计分析软件之一
20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部
1984年SPSS总部首先推出了世界第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,从而确立了个人用户市场第一的地位
⏹SPSSDataEditor
⏹——数据编辑器窗口编辑和显示数据,此窗口中的文件名称为*.sav
⏹SPSSSyntaxEditor
⏹——程序语句编辑器窗口编写各种程序,此窗口中的文件名称为*.sps
⏹SPSSViewer
⏹——结果观看窗口显示运算结果,此窗口中的文件名称为*.spo
⏹Analyze菜单——统计分析
Reports报告功能;DescriptivesStatistics描述性统计分析;CompareMeans比较均值分析;GeneralLinearModel一般线性模型分析;Correlate相关分析;Regression回归分析;Loglinear线性模型分析;Classify聚类分析;DataReduction简化数据处理(因素分析);Scale比例分析(可靠性分析);NonparametricTests非参数检验;Survival生存分析;MultipleResponse多重响应分析;ComplexSamples复杂抽样分析;
2、SPSS数据文件的建立:
3、SPSS数据文件的管理
⏹观测量的排序:
Data→SortCases→选择sortby变量→sortorder确定→OK
⏹变量值的排秩:
Transform→RankCases→选择→ok(不常用)
⏹数据行列转置:
Data→Transpose→选择→ok
⏹合并文件:
Data→MergeFiles→AddCases或AddVariables→readfile→选择→ok
⏹拆分文件:
Data→SplitFile→选择→ok
⏹选择观测量:
Data→SelectCases→选择Ifconditionissatisfied激活If→单击If按钮进入If对话框→输入条件→ok
⏹加权观测量:
Data→WeightCases→ok
⏹数据变换和计算:
Transform→compute→选择变量计算→ok
第二章描述统计
⏹集中量数:
代表研究对象的一般水平,是一组数据典型特征的代表值,也是真值的最好代表值。
(1)算术平均数,均数,Mean,M
(2)中位数,中数,Median,Md
(3)众数,Mode,Mo
(4)加权平均数,WeightedMean,Mw。
单位权重不相等时使用,各变量在构成总体中的相对比重就是权数。
(5)几何平均数(Mg)、调和平均数(Mh)
⏹差异量数:
绝对差异与相对差异
绝对差异量:
单位与原始数据相同
(1)全距,极差,Range=Xmax-Xmin
(2)四分位差,Quartiledeviation=(Q3-Q1)÷2
(3)离差,一数据与该组数据的平均数之差
(4)方差,Variance,变异数,离差的平方和的平均数,S2
(5)标准差,Standarddeviation,是方差的平方根,S,SD
相对差异量:
测量单位不同(身高和体重)、或样本水平相差比较大(1年级和5年级)
(6)差异系数,CoefficientofVariation,CV。
CV=SD÷M×100%
作用:
差异量数除了反映数据的离散程度,还可反映集中量数所具有的代表性。
差异量数越大,集中量数代表性越差;差异量数越小,集中量数代表性越好;差异量数为0,集中量数即该数值本身。
差异量数与集中量数结合起来,才可以准确反映数据的全貌。
※所以在研究报告中必须呈现这两种统计量数:
M,SD
⏹相关量数:
变量之间的共变关系
(1)相关系数,判断两列变量的相关方向和程度的统计指标,r,[-1,1]
(2)相关种类:
简单相关与复相关
直线相关与曲线相关
正相关、负相关、零相关
积差相关,Pearsoncorrelation
等级相关,Spearmancorrelation
多列等级相关,Kendallcorrelation
⏹分布:
Distribution,指数据的分布形态
(1)偏度,skewness,Sk。
是反映数据分布不对称性的一个数字特征,当数据呈正态分布时,Sk=0
(2)峰度,kurtosis,Kur。
是以正态分布为标准,描述数据分布密度的形状为陡峭还是平坦的一个数字特征,当数据呈正态分布时,Kur=0
描述统计与推论统计的关系
反映客观现象的数据
总体内在的数量规律性
推论统计
(利用样本信息和概率论对总体的数量特征进行估计和检验等)
概率论
(正态分布的原理、小概率原则)
描述统计
(统计数据的整理、展示和分析等)
总体数据
样本数据
⏹描述统计,DescriptiveStatistics,主要介绍以下三种功能选项:
频数分析,Frequencies
数据描述,Descriptives
数据探察,Explore
⏹多项选择题的描述分析,MultipleResponse多重响应分析统计功能
频数分析Frequencies
⏹→Variable(s):
选入变量(一个或多个)
⏹→Displayfrequencytables:
选择则显示频数表,否则只显示图形
⏹→Statistics:
选择统计量
⏹→Charts:
确定图形输出类型
⏹→Format:
设置频数分析表输出格式
数据描述Descriptives
⏹→Variable(s):
选入变量(一个或多个)
⏹→Savestandardizedvaluesasvariables:
将当前变量的数据标准化,保存为另一个变量放在最后一列,新名为Z原变量名
⏹→Options:
统计量选项
数据探察Explore
⏹→Dependentlist:
因变量列表
⏹→Factorlist:
自变量列表,要求是分组变量
⏹→Display:
显示统计表或图形
⏹→Statistics:
选择统计量
⏹→Plots:
选择图形
⏹→Options:
缺失值处理选项
多项选择题录入在SPSS中的实现
(1)Analyze→MultipleResponse→DefineSets,打开定义多项选择题集的对话框。
(2)VariablesinSet:
选入需要加入同一个多选题变量的变量列表。
(3)VariableAreCodedAs:
选择变量的编码方式。
Dichotomics即为多重二分法编码方式,countedvalue是指用哪个数值表示选中。
Categories指为多重分类法编码方式,此时需要设定取值范围Range…through…,在该范围内的记录值将纳入分析。
(4)Name:
定义变量集名字。
(5)Label:
定义变量集名字的标签。
多项选择题的描述
⏹CountCases:
选择了某选项的人数,即原始频数。
⏹Percentofcases:
指选择了某选项的人占总人数的比例。
它可以反映该选项在人群中的受欢迎(重视)程度,其总和大于100%。
⏹CountResponses:
选择某选项的次数。
它有时与CountCases相等,有时不等。
⏹PercentofResponses:
在做出的所有选择中,选择某选项的次数占总次数的比例。
它可以用于不同选项受欢迎程度的比较,其总和应等于100%。
⏹Analyze→MultipleResponse→Frequencies:
Table(s)for选入题集变量;MissingValues定义缺失值的处理方式,分别对应两种编码方法。
⏹Analyze→MultipleResponse→Crosstables:
Row(s)框选入题集变量,Column(s)框选入分组变量;DefineRanges定义Column(s)中分组变量值的变化范围;Options定义各种统计附加选项。
第三章平均数差异检验
⏹均数比较的基本前提是总体正态分布,样本同型(方差齐性),显著性检验使用双侧检验。
⏹若总体呈非正态分布(偏态),则需要使用非参数检验方法,如卡方检验,显著性检验使用单测检验。
如何用SPSS做均数比较
⏹Analyze→CompareMeans
⏹Means:
均数分析该过程对指定的变量进行单因素的综合描述统计量的计算。
它可以对指定的变量进行分组分析。
分组是按分类变量对其他变量进行的分类。
并且可同时进行多层分组分析,具有一定的One-WayANOVA功能。
⏹One-SampleTTest:
单样本t检验该过程对样本与总体均值进行比较,检验样本均值是否来自己知均值的总体。
在SPSS中,可以同时实现对多个变量上的单样本t检验。
⏹Independent-SamplesTTest:
独立样本t检验该过程进行独立样本t检验,即检验两个不相关的样本是否来自具有相同均值的总体。
最常见的使用情况是,性别差异检验,实验组与控制组差异检验,在SPSS中,可以同时实现对多个变量上的独立样本t检验。
⏹Paired-SamplesTTest:
配对样本t检验该过程对配对样本进行t检验,即检验两个相关样本是否来自均值相等的总体。
相关或配对样本常常是对同一个观测对象在试验前(前测)和试验后(后测)观测的结果;有时也可以对同一个样本在两个变量之上的(重复测量)平均数做差异检验。
在SPSS中,可以同时实现对多对变量上的配对样本t检验。
⏹One-WayANOVA:
单因素方差分析若是要检验三组(三个水平)以上的均值,则首先转化为方差分析,若方差分析差异检验显著,则需要进行,两两之间的均数比较(PostHoc),计算均数差(LSD)是否显著。
该过程进行单因素方差分析,可以检验几个(两个以上)彼此独立的组(每个水平上的组)是否来自均值相同的总体。
在SPSS中,可以同时实现对多个因变量上的单因素方差分析。
第四章方差分析
方差分析的特点是可以同时检验两个或多个组之间的差异,并且可以解释几个因素水平之间的交互作用。
方差分析有力地促进了复杂实验设计的发展,它使研究者有可能通过实验设计,深入探讨问题的实质。
它实质上把“平均数之间是否存在差异”的检验转化为“变异是否存在”的检验。
方差分析的主要功能是分析因变量的总变异中不同来源的变异,如实验处理带来的变异、被试个体差异带来的变异、实验误差带来的变异等等。
统计学原理
⏹在方差分析中,方差更常用的专用术语叫均方(meansquare,MS)。
⏹在实验设计和方差分析中,最重要和常用的两个概念是平方和(sumofsquares,SS)和均方(MS)。
⏹均方的计算公式是:
MS=变异/df=SS/df
⏹均方是每个自由度(degreeoffreedom,df)的平均变异。
⏹接受不同实验处理的被试的分数围绕平均数的变化在方差分析中是很重要的,它反映了实验处理带来的变异,叫组间变异(between-groupvariation)。
⏹组间均方的计算公式是:
MS组间=SS组间/df
⏹每个组内被试分数围绕组平均分数的变化反映了接受同一处理的一组被试的变异,这个变异是由随机误差造成的,将各处理组内的变异相加,即是整个实验的实验误差。
这种变异在方差分析中也很重要,叫组内变异(within-groupvariation)。
⏹组内平方和的计算公式是:
SS组内=SSA+SSB+……+SSi
⏹组内均方的计算公式是:
MS组内=SS组内/df
⏹这样可以区分出一组数据中的两个变异源:
一个反映了实验处理的效应,叫做组间变异;另一个反映了接受同样处理的被试之间的变异,叫做组内变异或误差变异,F检验是计算组间变异与组内变异的比率:
F=MS组间/MS组内
⏹只有当组间变异足够大,明显不同于组内变异时(即F值显著时),才说明实验处理效应是存在的。
如果组间变异与组内变异相比差不多,则说明处理效应是不存在的,只不过是一种随机误差。
⏹t检验是对来自两个总体的样本平均值是否存在显著差异的检验。
当需要对来自多个总体的样本平均数进行检验,t检验就显得无能为力,于是,引进单因素方差分析的方法进行,并发展到多因素方差分析。
方差分析的种类
⏹单因素一元方差分析,SPSS中需调用One-WayANOVA命令进行。
⏹两因素一元方差分析,SPSS中需调用Univariate命令进行。
⏹多因素一元方差分析,SPSS中需调用Univariate命令进行。
⏹单因素多元方差分析,SPSS中需调用Multivariate命令进行。
⏹两因素多元方差分析,SPSS中需调用Multivariate命令进行。
⏹多因素多元方差分析,SPSS中需调用Multivariate命令进行。
⏹重复测量方差分析,SPSS中需调用RepeatedMeasures命令进行。
两因素完全随机实验设计
2×2两因素完全随机实验设计被试分配:
A1B1A1B2A2B1A2B2
S1S6S11S16
S2S7S12S17
S3S8S13S18
S4S9S14S19
S5S10S15S20
数据输入的格式:
列为自变量A,B,因变量;行为被试
操作:
:
:
Analyze>>>>>GeneralLinermodel>>>>>>Univariate
2×2两因素随机区组实验设计被试分配:
A1B1A1B2A2B1A2B2
C1S1S7S13S19
S2S8S14S20
C2S3S9S15S21
S4S10S16S22
C3S5S11S17S23
S6S12S18S24
数据输入的格式:
列为自变量A,B,区组变量C,因变量;行为被试
操作:
:
:
Analyze>>>>>GeneralLinermodel>>>>>>UnivariateModel只分析“病期”主效应
MANOVA的检验统计量F
⏹Pillai’sTrace(轨迹):
在接受虚无假设时相对较为保险,且在样本规模很小、各分组规模不等、或分布方差不等时使用的效果也不错,是近似值。
恒为正值,值越大,说明效应项对模型的贡献越大。
⏹Wilks’Lambda():
不太受违反假设条件影响,统计检验功效强,是精确值。
取值范围在0-1之间,值越小,说明效应项对模型的贡献越大。
⏹Hotelling’sTrace(轨迹):
是检验矩阵特征根之和,是近似值,值越大贡献越大。
⏹RoyLargestRoot(最大根):
是检验矩阵特征根中的最大值。
值越大贡献越大。
在足以确信所有假设条件能够得到遵守且因变量能够由一维效应所代表时,具有较强的检验功效,但它的值不能直接转换成某种已知分布的统计量,报告时一般只提供计算值,且为近似值,若小于0.1,便认为不显著。
它总是小于或等于Hotelling’sTrace。
SPSSBasicstepsforMANOVA
⏹Analyze—GeneralLinearModel—Multivariate—dependentvariablesandfixedfactors
⏹—Model:
custom;buildterms:
maineffects-factors;interaction-factor*factor
⏹—Contrasts:
factors-factor1,2……,changecontrast:
simple,andfirst,change
⏹—Options:
Observedpower,SSCPmatrices,Homogeneitytest,Residualplots
⏹—ok.
被试内重复测量方差分析
4×2两因素被试内重复测量设计被试分配:
A1B1A1B2A2B1A2B2………A4B2
S1S1S1S1S1S1
S2S2S2S2S2S2
S3S3S3S3S3S3
S4S4S4S4S4S4
数据输入的格式:
按上述排列方式输入
操作:
:
:
Analyze>>>>>GeneralLinermodel>>>>>>RepeatedMeasures
Within-SubjectFactorName:
aNumberofLevels:
4Add
混合设计重复测量方差分析
被试分配:
A1B1A1B2A2B1A2B2………A4B2
S1S5S1S5S1S5
S2S6S2S6S2S6
S3S7S3S7S3S7
S4S8S4S8S4S8
数据输入的格式:
列:
A1,A2,A3,A4,Bgroup;行:
S1,S2,S3,S4,S5,S6,S7,S8
Between-subjectsFactors>>>group在定义group和a的相互作用
第五章相关分析
⏹事物总是相互联系的,归纳起来不外三种:
一因果关系,二共变关系,三相关关系。
⏹相关关系:
即两类现象在发展变化的方向与大小方面存在一定的关系,但是不能确定哪个是因那个是果。
⏹相关:
是指具有相关关系的两类现象之间的关系程度。
⏹相关类型:
正相关、零相关、负相关
相关系数的概念
⏹集中量数和差异量数主要用于描述单变量数据资料的分布特征。
⏹而相关系数则用于描述双变量数据(bivariatedata)相互之间的关系。
⏹相关系数:
是两列变量间相关程度的数字表现形式,或者说是用来表示相关关系强度的指标。
常用r表示,-1.00≤r≤+1.00
Pearson积矩相关
⏹是英国统计学家皮尔逊提出来的,也叫皮尔逊积差相关。
⏹通常人们把离均差平方之和除以N叫做矩(moment),把X的离均差和Y的离均差乘积的总和除以N(即∑xy/N)叫“积矩”(也叫协方差,Covariance,Cov)。
直线相关的应用
⏹在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。
⏹一般说来,当样本量较大(n>100),并对r进行假设检验,有统计学意义时(显著),r绝对值>0.7时,则表示两个变量高度相关;0.4<r绝对值≤0.7时,则表示两个变量之间中度相关;0.2<r绝对值≤0.4时,则两个变量低度相关。
其他相关系数
⏹Spearman等级相关:
总体可能不是正态分布,数据是等级性质。
比积矩相关精度差。
⏹Kendall等级相关:
除与Spearman等级相关相同的作用外,适合多列等级变量资料。
⏹点二列相关:
对一个变量是等距或等比的测量数据,另一个是性质的两分变量(性别、生死)求相关用。
⏹二列相关:
一个变量是等距或等比变量,另一个也是,但是被人为地分为两类。
确定项目区分度常用。
⏹多系列相关:
两列正态变量,一列为等比或等距连续变量,另一列被人为分为多种(优良中及格)。
在SPSS中如何做相关分析
⏹Analyze—Correlate—Bivariate:
Variables—CorrelationCoefficients:
Pearson,Spearman,Kendall—Testofsignificance:
Two-tailed—Flagsignificantcorrelation—Option—Ok。
第六章回归分析
•含义:
是借助数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,即通过一个或几个变量的变化去解释另一变量的变化。
•目的:
在于对相关随机变量进行估计、预测和控制,确定变量之间数量关系的可能形式,并用一个数学模型来表示。
在SPSS中如何做回归分析
•Analyze—regression—linear—Dependent(Y)—Independents(x1,x2,x3,…xi)—Method:
stepwise—statistics—RegressionCoefficients:
Estimates,Confidenceintervals(求回归参数的置信区间)—Residuals:
Durbin-Watson(检验序列相关)—Casewisediagnostics(查找异常点)—Rsquaredchange,Descriptives,Collinearitydiagnostic—Continue—Plots—Y:
Dependent,X:
*ZPRED(正态性检验)—StandardizedResidualsPlots:
Histogram,Normalprobabilityplot—Continue—save—PredictedValues:
Unstandardized,Standardized,S.E.ofpredictions—Residuals:
Unstandardized,Standardized(在数据清单中产生标准化残差)—Continue—Options:
UseprobabilityofF—includeconstantinequation—Continue—OK
一元回归分析的实例
•根据50名学生的平时与高考的英语阅读理解成绩,求出高考阅读成绩Y对平时阅读成绩X的回归方程,以便根据平时成绩预测高考成绩。
•用简单的一元线性回归分析方法。
Analyze—regression—linear
Plots—Y:
Dependent,X:
*ZPRED(正态性检验)
第七章项目分析与可靠性分析
真分数测量理论的基本假设
⏹测量实得分数与真分数之间存在线性关系:
X=T+E
(X:
实际分数;T:
真分数;E:
误差分数)
⏹测量误差的期望值为零:
E=0
⏹误差与真分数彼此独立:
rTE=0
⏹实际分数的方差=真分数的方差+随机误差的方差:
SX2=ST2+SE2
⏹其理论框架围绕“四度”来展开:
难度(ItemDifficulty)区分度(ItemDiscrimination)
信度(Reliability)效度(Validity)
测验的项目分析
⏹多重相关的平方:
该题目的得分与其余题目分数之间的复相关系数,也就是以该题为因变量,其他题目为自变量进行线性回归所得出的复相关系数(实际就是决定系数R2)。
⏹一般要求题总相关值在0.6以上的题目为好;如果达不到这个要求时,应再看多重相关的平方值,在0.3以上尚可以保留,而低于0.3应淘汰。
⏹鉴别指数(D):
即根据某种标准(测验总分)划分两个极端组(高分组和低分组)在该题上通过率的差:
D=PH-PL(PH:
高分组通过率;PL:
低分组通过率)
⏹先按测验总分把全部被试从高到低排列,然后采取从两端各划出25%~33%的被试作为极端
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 考试 大纲