第九章 平均数分析.docx
- 文档编号:12089868
- 上传时间:2023-04-17
- 格式:DOCX
- 页数:26
- 大小:811.67KB
第九章 平均数分析.docx
《第九章 平均数分析.docx》由会员分享,可在线阅读,更多相关《第九章 平均数分析.docx(26页珍藏版)》请在冰豆网上搜索。
第九章平均数分析
第九章平均数分析(Means)与T检验
平均数分析是最简单,但也是使用频率最高的一个统计分析方法。
我们对随机样本进行统计描述以后,还要由此来推论总体情况。
平均数分析就是用样本均值来推论总体均值的方法。
具体地说来,平均数分析包括下面四部分内容。
一是单个样本的T检验。
这是用样本的均值对总体均值的假设进行检验的方法。
二是独立样本的T检验。
这是用两个样本的均值差的大小来检验对应的两个总体的均值是否相等的方法。
三是配对样本的T检验。
这是通过对配对样本的两次测量结果的差异的大小来检验两个总体的差异是否显著的分析方法。
四是一般的均值分析方法。
是通过分析多个样本的均值差异的大小,来确定分类变量与分析变量是否独立的方法。
下面分别介绍。
9.1单个样本的T检验
9.1.1单个样本T检验的过程
9.1.2单个样本T检验的实例分析
9.2独立样本的T检验
9.2.1独立样本T检验的过程
9.2.2独立样本T检验的实例分析
9.3配对样本的T检验
9.3.1配对样本T检验的过程
9.3.2配对样本T检验的实例分析
9.4平均数分析(Means)
9.4.1平均数分析的过程
9.4.2平均数分析过程的实例分析
9.1单个样本的T检验
9.1.1单个样本T检验的过程
单个样本的T检验的目的是通过计算出的样本均值来估计总体均值是否为某个确定的值。
其基本思想是:
计算出样本均值以后,先根据经验或以往的调查结果,对总体的均值提出一个假设,即μ=μ0。
μ0就是待检的总体均值。
然后分析计算出的样本均值来自均值为μ0的总体的概率有多大。
如果概率很小,就认为总体的均值不是μ0。
在大样本的情况下(n≥30),根据样本均值来检验总体均值时,在总体方差未知的情况下采用T检验。
在小样本的情况下(n<30),要使用T检验的方法,要求总体服从正态分布。
单个样本T检验的步骤如下:
1.打开T检验对话框,执行下述操作:
Analyze→CompareMeans→OneSampleTTest打开对话框,如图9-1所示。
图9-1单个样本T检验对话框
2.选择分析变量
图9-1中的TestVariable(S)窗口是分析变量窗口。
可以从左边的源变量窗口中选择将要分析的一个或多个变量进入到该窗口中。
3.确定待检参数
TestValue窗口中输入的数据是待检的总体均值,也就是假设检中原假设的值。
4.确定置信度和缺失值的处理方法
单击Options按钮,打开选项对话框,如图9-2所示。
图9-2单个样本T检验选项对话框
(1)ConfidenceInterval窗口用于设置检验的置信度。
系统默认值为95%。
即在原假设成立的条件下,样本均值出现的概率如果小于5%,则不能接受原假设。
(2)MissingValues是设置缺失值的处理方法的选项栏。
1)Excludecasesanalysisbyanalysis是只剔除分析变量为缺失值的个案,这是系统默认状态。
2)Excludecaseslistwise是剔除任何含有缺失值的个案。
上述选项作完以后,单击Continue按钮返回单个样本T检验对话框。
5.单击OK提交运行。
系统在输出文件窗口中输出T检验的结果。
9.1.2单个样本T检验的实例
实例:
对“休闲调查”中的“住房面积”变量进行单个样本的T检验。
原假设为:
城市居民的户均住房面积为38平方米。
打开数据文件“休闲调查”后,执行下述操作:
1.Analyze→CompareMeans→OneSamepleTTest打开如图9-1所示的单个样本T检验对话框。
2.从左侧源变量窗口中选择“住房面积”,使之进入到TestVariable(S)窗口。
3.在TestValue窗口中输入38。
4.单击OK提交运行。
可以在输出文件窗口中看到单个样本T检验的分析结果如
表9-1和表9-2所示。
表9-1单个样本的统计描述One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
住房使用面积
283
39.417
13.7078
.8148
表9-1的内容是描述统计的结果。
即“住房面积”变量有283个有效数据,平均值为39.417,
样本数据分布的标准差为13.7078,样本均值分布的标准误差为0.8148。
表9-2单个样本的T检验结果
One-SampleTest
TestValue=38
t
df
Sig.(2-tailed)
Mean
Difference
95%ConfidenceIntervaloftheDifference
Lower
Upper
住房使用面积
.512
282
.609
.417
-1.187
2.021
表9-2的内容是T检验的结果。
即在假设总体的户均住房面积为38平方米的情况下,计算的T统计量的值为0.512,自由度为282,双尾检验的显著性水平为0.609,样本均值与原假设的差为1.417,样本均值与原假设的差的95%的置信区间为[-1.187,2.021]。
也就是说,在总体均值为38平方米的情况下,抽出的样本均值为39.417平方米的概率大于等于0.609。
以这样大的概率来接受原假设是毫无问题的。
9.2独立样本的T检验
9.2.1独立样本的T检验的过程
独立样本的T检验的目的是,通过比较两个样本均值差的大小来确定两个总体的均值是否相等。
如果两个样本相互独立且均为大样本,可以采用T检验的方法。
如果两个样本相互独立但都是小样本,或有一个样本是小样本,则要求总体服从正态分布。
检验的基本思想是,按照一定的分组原则将所有的个案分为两部分,可将这两部分视为两个独立的样本,对两个样本分别进行统计描述。
然后对两个样本进行方差齐性检验,或称为等方差检验。
确认两个总体具有等方差性以后,用t检验的方法对两个样本的均值差进行检验。
如果均值差过大,则说明这两个样本来源于均值不同的两个总体。
对两个样本均值差的检验基本过程为:
1.打开独立样本的T检验对话框
执行下述操作:
Analyze→CompareMeans→Independent-SamplesTTest打开对话框,如图9-3所示。
2.选择分析变量
图9-3中的TestVariable(S)窗口是分析变量窗口。
可以从左边的源变量窗口中选择将要分析的一个或多个变量进入到该窗口中。
3.确定分组变量
GroupingVariable是分组变量的窗口。
选择一个变量作为分组依据进入GroupingVariable窗口,同时激活DefineGroups按钮。
由于独立样本的T检验是对两个总体的均值差进行检验,所以作为分组依据的变量只能取两个值。
图9-3独立样本的T检验对话框
4.确定分组变量的取值
单击DefineGroups按钮打开对话框,如图9-4所示。
以确定分组变量的取值。
图9-4确定分组对话框
(1)如果分组变量是二分定类变量
选择Usespecifiedvalues选项。
在Group1和Group2窗口中分别输入变量的两个取值。
系统将以这两个取值为依据,将所有的个案分为两部分,并对分析变量分别进行统计。
(2)分组变量是一般的离散型的数值变量
分组变量是一般的离散型的数值变量。
而且希望对其中某两个类别的均值差异进行分析的话,也可选择Usespecifiedvalues选项。
在Group1和Group2窗口中分别输入分组变量的值。
系统将以这两个值为依据,对分析变量分别进行统计。
(3)分组变量为连续型变量,或虽为离散型变量,但变量的取值较多在这种情况下,只希望以分组变量为依据将个案分为两部分时,应选择Cutpoints(切分点)选项。
同时激活Cutpoint窗口。
并在窗口中输入分割值。
系统将所有观测值分为大与该数值和小于该数值的两组,并分别计算分析变量的均值然后进行比较。
(4)如果选择的分组变量是字符串变量,单击DefineGroups按钮后,打开的是如图9-5所示对话框。
图9-5确定分组对话框
可直接在两个窗口中输入变量值即可。
上述选择做完以后,单击Continues按钮返回主对话框。
5.确定置信度和缺失值的处理方法
单击Options按钮,将打开一个与单个样本T检验选项对话框完全相同的对话框。
由来设值置信度和缺失值的处理方法。
如果采用系统默认选项,该对话框可以不做任何设置。
单击Continues返回主对话框。
6.单击OK提交运行。
系统在输出文件窗口中输出独立样本的T检验的结果。
9.2.2独立样本的T检验的实例分析
1.实例1:
用“休闲调查”中的数据分析不同性别的被调查者家庭的住房面积是否有差异。
(1)实例分析的操作过程
打开数据文件“休闲调查”后,执行下述操作:
1)Analyze→CompareMeans→Independent-SamplesTTest打开如图9-3所示的对话框。
2)从左边的源变量窗口中选择“住房面积”进入到TestVariable(S)窗口。
3)选择“性别”进入到GroupingVariable窗口中。
4)单击DefineGroups按钮打开对话框,选择Usespecifiedvalues项,在Group1和Group2窗口中分别输入1和2。
单击Continues返回主对话框,
5)单击OK提交运行。
可以在输出文件窗口中看到独立样本T检验的分析结果如表9-3和表9-4所示。
表9-3独立样本的分组描述统计
GroupStatistics
性别
N
Mean
Std.Deviation
Std.ErrorMean
住房使用面积男
女
433
450
35.708
34.704
15.1958
15.1870
.7303
.7159
表9-4独立样本的T检验结果
(2)对输出结果的解释
1)表9-3是分男女进行的描述统计。
其内容的解释与单个样本描述统计的解释完全相同
2)表9-4是两组平均数差异的T检验结果。
下面对表中各项的内容解释如下:
①Equalvariancesassumed是等方差假定。
也就是检验的原假设为两总体分布的方差相等。
②Levene’sTestforEqualityofVariances是方差齐性检验。
采用T检验的方法对两个总体的均值差进行检验的前提条件是两个总体分布的方差必须相等。
但如果是大样本,则对方差齐性不作要求。
从该题的检验结果看,F值为0.45,显著性水平为0.519,可以接受两总体为等方差的假设。
③t-testforEqualityofMeans是均值相等的T检验。
从该题的检验结果看,t值为0.982,显著性水平为0.326,远远大于0.05,可以接受两个总体均值相等的假设。
两个总体的均值差为1.004,均值差的标准误差为1.0226,均值差的95%的置信区间为[-1.0028,3.0114]。
检验的结论为:
性别不同的被调查者住房面积没有显著差异。
2.实例2:
用“休闲调查”中的数据分析初中学历与高中学历的被调查者的住房面积是否有差异。
打开数据文件“休闲调查”后,执行下述操作:
(1)Analyze→CompareMeans→Independent-SamplesTTest打开对话框。
(2)从左侧的源变量窗口中选择“住房面积”进入到TestVariable(S)窗口。
选择“教育水平”进入到GroupingVariable窗口中。
(3)单击DefineGroups按钮打开对话框,选择Usespecifiedvalues项,在Group1和Group2窗口中分别输入3(文化程度变量中的初中)和4(文化程度变量中的高中)。
单击Continues按钮返回主对话框。
(4)单击OK提交运行。
可以在输出文件窗口中看到独立样本T检验的分析结果如表9-5和表9-6所示。
统计结果表明,受教育水平为初中和高中的被调查者的住房面积没有显著差异。
表9-5独立样本的分组描述统计
GroupStatistics
文化程度
N
Mean
Std.
Deviation
Std.Error
Mean
住房使用面积初中
高中
286
225
32.710
32.982
12.8431
15.2572
.7594
1.0171
表9-6独立样本的T检验结果
3、用“休闲调查”中的数据分析40岁以下与40岁以上被调查者的住房面积是否有差异。
打开数据文件“休闲调查”后,执行下述操作:
(1)Analyze→CompareMeans→Independent-SamplesTTest打开对话框。
(2)从左边的源变量窗口中选择“住房面积”进入到TestVariable(S)窗口。
选择“年龄”进入到GroupingVariable窗口中。
(3)单击DefineGroups按钮打开对话框,选择Cutpoints项,在Cutpoints窗口中输入40。
单击Continues按钮返回主对话框。
(4)单击OK按钮提交运行。
可以在输出文件窗口中看到独立样本T检验的分析结果如表9-7和表9-8所示。
统计结果表明,40岁以上和40岁以下的被调查者的住房面积没有显著差异。
表9-7独立样本的分组描述统计
GroupStatistics
年龄
N
Mean
Std.Deviation
Std.ErrorMean
住房使用面积>=40
<40
580
303
34.871
35.819
14.6436
16.1940
.6080
.9303
表9-8独立样本的T检验结果
9.3配对样本的T检验
9.3.1配对样本T检验过程
配对样本是指对同一样本的某个变量进行前后两次测试所获得的两组数据。
或是对两个完全相同的样本在不同条件下进行测试所获得的两组数据。
可以把这两组数据看作是分别来自两个总体的两个样本。
配对样本的检验是先求出每对观测值的差,再对差值求平均值。
通过检验配对变量均值之间的差异的大小,来确定两个总体的均值的差异是否显著。
检验过程如下:
1.打开配对样本的T检验对话框
执行下述操作:
Analyze→CompareMeans→Paired-SamplesTTest打开对话框,如图9-6所示。
图9-6配对样本的T检验对话框
图中的PairedVariables窗口是用于显示已经配对的变量。
2.选择分析变量
从左边的源变量框中选择两个变量。
使之进入PairedVariable窗口中。
两个变量只占一行,可选择多对配对变量。
3.确定置信度和缺失值的处理方法
单击Options按钮,将打开一个与单个样本T检验选项对话框完全相同的对话框。
由自己来设值置信度和缺失值的处理方法。
如果采用系统默认选项,该对话框可以不做任何设置。
单击Continues按钮返回主对话框。
4.单击OK提交运行。
系统在输出文件窗口中输出配对样本的T检验的结果。
9.3.2配对样本T检验的实例分析
实例:
数据文件“贫困调查”中的“满意度1”是贫困人口获得最低生活保障金以前的生活满意度测量结果,“满意度2”是获得最低生活保障金以后的生活满意度测量结果。
检验获得最低生活保障金前后生活满意度是否有变化。
打开数据文件“贫困调查”后,执行下述操作:
1.Analyze→CompareMeans→Paired-SamplesTTest打开对话框。
2.从左边的源变量窗口中选择“满意度1”和“满意度2”进入PairedVariable窗口中。
3.单击OK提交运行。
可以在输出文件窗口中看到配对样本T检验的分析结果如表9-9、表9-10和表9-11所示。
表9-8配对样本的分组描述统计
表9-9是配对样本的描述统计。
其内容的解释与单个样本描述统计的解释完全相同
表9-10配对样本的相关表
表9-10是配对样本的相关分析结果。
两个变量的相关系数为0.874,显著性水平为0.00。
由于显著性水平远远小于0.05,所以总体的相关是很显著的。
表9-11配对样本的T检验结果
表9-11是配对样本的T检验结果。
表中的Mean是两个变量差的均值。
Std.Deviation是差值的标准差。
Std.ErrorMean是差值的标准误。
95%ConfideceIntervaloftheDifference是差值的95%的置信区间。
T是T统计量的计算结果。
Df是自由度。
Sig.2-tailed是双端检验的显著性水平。
从表中输出的数据看,领取最低生活保障金前后,贫困人口生活满意度的变化是相当显著的。
也就是说,领取低保金以后,贫困人口生活满意度的提高是相当显著的。
9.4平均数分析(Means)过程
9.4.1平均数分析过程
Means过程是均值的比较与检验的过程。
当把所有的个案按照一个定类变量分组以后,就可以使用Means过程进行分组计算。
并通过比较各组的均值的差异的大小来确定总体中这两个变量是否相关。
Means分析与检验的过程如下:
1.打开平均数分析对话框
Analyze→CompareMeans→means打开对话框,如图9-7所示。
图9-7平均数分析对话框
2.选择分析变量
Dependentlist是分析变量窗口。
将要分析的变量进入该窗口。
3.确定分组变量
Independentlist是分组变量窗口。
将要作为分组依据的变量进入该窗口,同时激活Next按钮。
如果还要对分析变量进行另外的分组分析,可以再次选择分组变量进入Independentlist窗口。
4.选择输出的统计量
单击“Option”按钮,打开对话框,如图9-8所示。
选择需要计算的统计量。
图9-8平均数分析选项对话框
该对话框中包括了三项内容:
(1)Statistics窗口中列出了SPSS可求的统计量。
各项的意义分别为:
1)mean:
算术平均值,一般简称均值。
2)NumberofCases:
个案数。
3)StandardDeviation:
标准差。
4)Median:
中位数。
5)GroupedMedian:
分组的中位数。
6)Std.ErrorofMean:
均值的标准误。
7)Sum:
观测值的总和。
8)Minimum:
最大值。
9)Maximum:
最大值。
10)Range:
全距,也称极差。
11)First:
第一个观测值。
12)Last:
最后一个观测值。
13)Variance:
方差。
14)Kurtosis:
峰度。
15)Std.ErrorofKurtosis峰度的标准误。
16)Skewness:
偏度。
17)Std.ErrorofSkewness:
偏度的标准误。
(2)Cell窗口中列出的是选中的统计量,这些统计量的计算结果将在输出文件中输出。
其中mean、NumberofCases、StandardDeviation是系统默认的选项。
如果还需要输出其它选项,可以从Statistics窗口中选择,并使之进入到Cell窗口中。
(3)StatisticsforFirstlayer框中列出了第一层分组的另外两个统计量。
其中:
1)Anovatableandeta:
对分组变量进行单因素方差分析,并计算用于度量变量相关程度的eta值。
这个选项主要用于分组变量为定类变量的情况。
2)Testforlinearity:
检验线性相关。
这个选项主要用于分组变量为定序变量的情况。
上述选项作完以后,单击Continues按钮返回主对话框,
5.单击OK按钮提交运行。
系统在输出文件窗口中输出平均述分析的结果。
9.4.2Means过程的实例分析
实例:
用“休闲调查”中的数据分析不同受教育水平的被调查者的户均住房面积进行平均数分析。
打开数据文件“休闲调查”后,执行下述操作:
1.Analyze→CompareMeans→means打开Means对话框。
2.在左侧的源变量窗口中选择“住房面积”进入到Dependentlist窗口。
选择“文化程度”进入到Independentlist窗口。
3.单击“Option”按钮,打开Means分析选项对话框。
从Statistics窗口中选择Minimum和Maximum并使之进入到Cell窗口中。
在StatisticsforFirstlayer框中选择Anovatableandeta,即对分组变量进行单因素方差分析。
单击Continues按钮返回主对话框。
4.单击OK提交运行。
可以在输出文件窗口中看到均值分析的结果如表9-12、表9-13、表9-14和表9-15所示。
表9-12平均数分析的统计概要
表9-12的内容是样本中个案情况的概要。
说明在883个个案中有882个个案对“住房面积”和“教育水平”都作了回答。
表9-13平均数分析的结果
表9-13的内容是平均数分析的结果。
按照不同的文化程度输出了住房面积的平均值、个案数、标准差、最小值和最大值。
表9-14方差分析结果
表9-14的内容是方差分析结果。
对其中的各项内容解释如下。
SumofSquares是总平方和,df是自由度,MeanSquare是平均平方和,F是F检验的值,Sig.是显著性水平。
BetweenGroups是组间值,WithinGroups是组内值。
从输出结果来看组间平方和为12925.733,平均组间平方和为2154.289。
组内平方和为190609.958,平均组内平方和为217.839。
平均平方和是总平方和除以自由度的结果。
F检验的值是由平均组间平方和除以平均组内平方和得出的。
由于显著性水平Sig.为0.000,远远小于0.05,所以认为各组之间平均值的差异是非常显著的。
表9-15相关测量结果
表9-15的内容是“住房面积”和“文化程度”两个变量之间相关测量结果。
EtaSquared是以减少误差比例的思想计算的相关比率。
它主要用于测量定类变量和定距变量之间的非线性相关。
从输出结果看,被调查者的住房面积与他们的文化程度之间的相关比例并不是很大。
第十章一元方差分析
方差分析是使用的最多的统计分析方法之一。
它主要用于研究定类变量与定距变量之间的关系。
定距变量是被分析的变量,定类变量是影响因素的变量。
定类变量取值的几个类别被称为影响因素的几个水平。
研究的目的是想知道当影响因素取不同水平时,被分析变量是否有显著差异。
方法是通过比较各个类别的组内差异和类别之间的组间差异大小来确定变量之间是否有关。
如果组内差异大而组间差异小,则说明两个变量之间不相关。
反之,如果组间差异大而组内差异小,则说明两个变量之间相关。
使用方差分析的方法时,要求因变量在影响因素的各个水平上的分布必须服从正态分布。
关于方差分析在Means过程中已经有所涉及。
方差分析的思想虽然不难理解,但方差分析的过程比较麻烦。
尤其是多元方差分析涉及的选项比较多,本节只介绍简单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 平均数分析 第九 平均数 分析
![提示](https://static.bdocx.com/images/bang_tan.gif)