spss教程第二章均值比较检验与方差分析.docx
- 文档编号:26251377
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:27
- 大小:211.24KB
spss教程第二章均值比较检验与方差分析.docx
《spss教程第二章均值比较检验与方差分析.docx》由会员分享,可在线阅读,更多相关《spss教程第二章均值比较检验与方差分析.docx(27页珍藏版)》请在冰豆网上搜索。
spss教程第二章均值比较检验与方差分析
第二章均值比较检验与方差分析
在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布。
所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题。
◆本章主要内容:
1、单个总体均值的t检验(One-SampleTTest);
2、两个独立总体样本均值的t检验(Independent-SampleTTest);
3、两个有联系总体均值均值的t检验(Paired-SampleTTest);
4、单因素方差分析(One-WayANOVA);
5、双因素方差分析(GeneralLinearModelUnivariate)。
◆假设条件:
研究的数据服从正态分布或近似地服从正态分布。
在Analyze菜单中,均值比较检验可以从菜单CompareMeans,和GeneralLinearModel得出。
如图2.1所示。
图2.1均值的比较菜单选择项
§2.1单个总体的t检验(One-SampleTTest)分析
单个总体的t检验分析也称为单一样本的t检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。
如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。
例1:
根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布。
首先建立假设:
H0:
国有企业工资为10000元;
H1:
国有企业职工工资不等于10000元
打开数据库SY-2,检验过程的操作按照下列步骤:
1、单击AnalyzeCompareMeansOne-SampleTTest,打开One-SampleTTest主对话框,如图2.2所示。
图2.2一个样本的t检验的主对话框
2、从左边框中选中需要检验的变量(国有单位)进入检验框中。
3、在TestValue框中键入原假设的均值数10000。
4、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式。
选择后默认值后返回主对话框。
图2.3一个样本t检验的Options对话框
5、单击OK,得输出结果。
如表2.1所示。
表2.1(a).数据的基本统计描述
One-SampleStatistics
N
样本容量
Mean
均值
Std.Deviation
标准差
Std.ErrorMean
标准误
国有单位
31
13559.9032
4809.97099
863.89629
表2.1(b).一个样本均值t检验的检验结果
One-SampleTest
TestValue=10000
t值
df
自由度
Sig.(2-tailed)
P值
MeanDifference
均值差
95%ConfidenceIntervaloftheDifference置信区间
Lower
Upper
国有单位
4.121
30
.000
3559.90323
1795.5916
5324.2148
从上面检验结果表2.1(a)可以得出国有单位职工工资的平均值、标准差和均值的标准误等反映数据特征的数据。
从表2.1(b)中可知检验的结果。
即相应的检验统计量t值为4.229,自由度为30,假设检验的P值(sig)小于0.05,故原假设不成立,检验结论是拒绝原假设H0,接受假设H1。
即认为国有企业职工的平均工资与10000元的假设差异显著。
§2.2两个总体的t检验
§2.2.1两个独立样本的t检验(Independent-samplesTTest)
Independent-sampleTTest是检验两个没有联系的总体样本均值间是否存在显著的差异,两个没有联系的总体样本也称独立样本。
如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是否存在显著的差异。
例2.某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值就越高,每人所得的总分见表2.2,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异。
解:
由于药品对男性或女性的影响是无联系的,因此这两个样本是相互独立的。
可以应用两独立样本的假设检验。
首先,建立假设H0:
该药品对男性和女性的治疗效果没有显著差异;
H1:
该药品对男性和女性的治疗效果有显著差异。
表2.2男,女治疗效果的综合得分表
男
女
1
150
140
2
160
120
3
67
78
4
80
135
5
110
89
6
80
100
7
132
105
8
115
9
60
10
100
然后,根据表1的数据建立数据文件SY-4,并使用SPSS进行假设检验,具体操作步骤:
1、单击AnalyzeCompareMeansIndependent-sampleTTest,打开Independent-sampleTTest主对话框如图2.4。
图2.4两个独立样本t检验的主对话框
2、选择要检验的变量“综合得分”进入检验框中。
3、选择分组变量“性别”进入分组框中,然后单击DefineGroup按纽,打开分组对话框如2.5图所示,确定分组值后返回主对话框,如果没有分组,可以选择Cutpoint单选项,并在激活的框内输入一个值作为分组界限值。
4、由Option选择按纽确定置信度值和缺失值的处理方式。
5、点击OK可得输出结果,见表2.3统计分析检验结果。
图2.5独立样本t检验DefineGroups对话框
6、分析输出结果并对结果作出分析见表2.3。
表2.3(a)GroupStatistics分组统计描述表
性别
N
Mean
Std.Deviation
Std.ErrorMean
综合得分
男
10
105.40
34.394
10.876
女
7
109.57
23.143
8.747
表2.3(b)独立样本的均值比较检验表
方差齐性检验
Levene'sTestforEqualityofVariances
均值相等的t检验
t-testforEqualityofMeans
F值
P值Sig.
统计量t
自由度
df
P值
Sig.(2-tailed)
均值差MeanDifference
标准差
Std.ErrorDifference
95%的置信区间
95%ConfidenceIntervaloftheDifference
Lower
Upper
综合得分
Equalvariancesassumed
1.445
.248
-.278
15
.784
-4.17
14.980
-36.101
27.758
Equalvariancesnotassumed
-.299
14.997
.769
-4.17
13.957
-33.922
25.579
检验表2.3(a)基本统计表,检验表2.3(b)第三列和第四列是检验两样本数据的方差是否相等,从检验结果得知两样本的方差没有显著差异。
从第五列开始是对两个样本的均值的是否相等进行检验。
从假设检验的P值看出,它大于显著性水平0.05,所以说男女之间的机械能力之间并无显著差异,因此接受原假设H0。
而第八列之后分别是均值差、均值差标准误、均值差的置信区间。
§2.2.2两个有联系总体间的均值比较(Paired-SampleTTest)
Paired-SampleTTest是检验两个有联系正态总体的均值是否存在显著的差异。
又称配对样本的t检验。
经常用于生物、医药、农业、工业等多个行业。
如检验某种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某种粮食进行品种改良,也需要比较改良前后粮食产量有无显著差异等。
例3:
某企业对生产线上的工人进行某种专业技术培训,要对培训效果进行检验,从参加培训的工人中抽取30人,将他们培训前后的数据每加工500个零件的不合格品数进行对比,得到数据表见表2.4。
试根据表中数据检验培训前后工人的平均操作技术水平是否有显著提高,也就是检验培训效果是否显著。
表2.4工人培训前后不合格品数据表
序号
培训前
培训后
序号
培训前
培训后
1
2
0
16
6
4
2
3
1
17
6
2
3
3
2
18
6
2
4
4
1
19
6
2
5
4
1
20
6
4
6
4
2
21
6
3
7
4
2
22
6
3
8
4
3
23
6
3
9
5
2
24
6
3
10
5
2
25
6
3
11
5
3
26
7
3
12
5
3
27
7
3
13
5
2
28
7
4
14
5
3
29
7
4
15
5
3
30
8
3
解:
这显然是配对样本均值的假设检验的问题。
所以要建立假设:
H0:
培训前后工人的技术水平没有显著差异;
H1:
培训前后工人的技术水平有显著差异;
根据表2.3建立数据文件SY-5,根据中心极限定理,在大样本的情况下,样本均值近似地服从正态分布。
所以可以利用正态参数的检验方法进行均值的检验。
其检验过程的具体操作步骤为:
1、单击AnalyzeCompareMeansPaired-SampleTTest,打开Paired-SampleTTest主对话框如图2.6。
2、选择要检验的两变量进入检验框中,注意,一定要选择两个变量进入检验框内,否则将无法得到检验结果。
3、由Option选择按纽确定置信度值95%和缺失值的处理方式。
4、点击OK得输出结果。
5、根据输出结果作出结论如表2.5所示。
图2.6配对样本的t检验主对话框
表2.5(a)PairedSamplesStatistics样本统计量分析
Mean
样本容量
N
标准差
Std.Deviation
均值标准误
Std.ErrorMean
Pair1
培训前
5.30
30
1.368
.250
培训后
2.53
30
.973
.178
表2.5(b)PairedSamplesTest配对样本均值差检验表
PairedDifferences
检验统计量t
自由度
df
P值(双尾)Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1
培训前-培训后
2.77
.935
.171
2.42
3.12
16.203
29
.000
由上表2.5(b)中的检验结果知,假设检验的P值小于0.05,因此可以得出培训前后的差异是显著的,故拒绝假设H0,接受假设H1,认为培训的效果是显著的。
§2.3单因素方差分析
单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题。
是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。
其目的也是对不同的总体的数据的均值之间的差异是否显著进行检验。
单因素方差分析的应用范围很广,涉及到工业、农业、商业、医学、社会学等多个方面。
◆单因素方差分析的应用条件:
在不同的水平(因素变量取不同值)下,各总体应当服从方差相等的正态分布。
例4,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试,其值如表2.6所示。
假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。
解:
首先建立假设H0:
三个地区的零件强度无显著差异;
H1:
三个地区的零件强度有显著差异。
然后根据表2.6中数据,建立数据文件SY-6并进行单因素方差(One-WayANOVA)分析。
具体操作过程如下:
表2.6样本零件强度值单位:
百公斤
1
2
3
1
116
110
89
2
98
103
85
3
100
118
99
4
115
106
73
5
83
107
97
6
105
116
102
1、单击AnalyzeCompareMeansOne-WayANOVA,打开One-WayANOVA对话框。
图2.7单因素方差主对话框
2、从左框中选择因变量”零件强度”进入Dependentlist框内,选择因素变量”地区”进入Factor框内。
点击OK就可以得到方差分析表2.7。
表2.7ANOVA方差分析表百公斤
方差来源
平方和
SumofSquares
自由度Df
均方
MeanSquare
F值
P值
Sig.
BetweenGroups组间
1125.444
2
562.722
5.591
.015
WithinGroups组内
1509.667
15
100.644
Total总和
2635.111
17
表2.7是方差分析表,由于F统计量值的P值明显小于显著性水平0.05,故拒绝假设H0,认为这三个地区的零件强度有显著差异。
如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽Option选项,contrast对照比较,PostHoc多重比较去实现。
3、单击Option按纽,打开Option对话框如图2.8所示:
在Option选项中选择输出项。
主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。
图2.8单因素方差分析Options对话框
本例中选择Homogeneityofvariancetest进行不同水平间方差齐性的检验以及Descriptive基本统计描述。
在MissingValue栏中选择系统默认项。
完成所有选择后返回主对话框,然后单击OK,就可以得到三个地区零件强度分析表2.8。
表2.8(a)Descriptives基本统计描述
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
A1
6
102.83
12.254
5.003
89.97
115.69
83
116
A2
6
110.00
5.899
2.408
103.81
116.19
103
118
A3
6
90.83
10.815
4.415
79.48
102.18
73
102
Total
18
101.22
12.450
2.935
95.03
107.41
73
118
表2.8(b)TestofHomogeneityofVariances方差齐性检验
百公斤
LeveneStatistic
df1
df2
Sig.
1.203
2
15
.328
从基本统计分析表2.8(a)可以得到均值、标准差等数据相应的统计特征值。
从表2.8(b)中的统计检验可以得出,因素变量的各水平间的方差是没有显著差异的。
4、Contrasts按纽可以用来进一步分析随着控制变量水平的变化,观测值变化的总体趋势以及进一步比较任意指定水平间的均值差异是否显著。
单击Contrasts按纽,打开One-WayANOVA:
Contrasts对话框.见图2.9.
图2.9单因素方差分析Contrasts对话框
如果要对组间平方和进行趋势成分检验,选中Polynomial多项式复选项,选中后激活Degree参数框,在Degree框中选择趋势检验多项式的阶数,有最高次数可达5次。
系统将给出指定阶数和低于指定阶次各阶次的自由度、F值和F检验的概率值。
在Contrast栏,指定需要对照比较两个水平的均值。
在Coefficients框中输入一个系数,单击Add按纽,系数就进入到Coefficients框中。
重复上述,依次输入各组均值的系数。
注意系数的和应当等于0。
如;图2.9中就是指第一个水平与第三个水平的均值差比较。
5、如果需要将水平间两两比较,可以单击PostHoc按纽,打开多重比较对话框。
如图2.10所示:
在该对话框中列出了二十种多重比较检验,涉及到许多的数理统计方法,在实际中只选用其中常用的方法即可。
对话框下部的Significancelevel表示显著性水平,默认值是0.05,也可以根据需要重新输入其它值。
●如果满足在水平间方差相等的条件,常用LSD(least-significantdifference最小显著性差异法),表示用t检验完成各组均值间的配对比较。
●当方差不等的情况下,可以选择TamhanesT2,用t检验进行各组均值间的配对比较。
图2.10单因素方差分析PHC对话框
选择多重比较方式后,点击OK,得到输出结果表2.9。
表2.9MultipleComparisons多重比较
DependentVariable:
百公斤
LSD
(I)地区
(J)地区
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
A1
A2
-7.17
5.792
.235
-19.51
5.18
A3
12.00
5.792
.056
-.35
24.35
A2
A1
7.17
5.792
.235
-5.18
19.51
A3
19.17(*)
5.792
.005
6.82
31.51
A3
A1
-12.00
5.792
.056
-24.35
.35
A2
-19.17(*)
5.792
.005
-31.51
-6.82
*Themeandifferenceissignificantatthe.05level.
从表2.8中可以看出,地区2与地区3之间的差异是非常显著的,它们均值差的检验的尾概率为0.005,明显小于显著性水平0.05。
§2.4双因素方差(Univariate)分析过程
单因变量的双因素方差分析是对观察的现象(因变量)受两个因素或变量的影响进行分析,检验不同水平组合之间对因变量的影响是否显著。
双因素方差分析的应用范围很广,如粮食产量受到气候、温度因素的影响;某生物产品的生产过程不仅受催化剂多少的影响、还受温度高低的影响等,甚至两因素变量之间的交互作用对因变量也有一定的影响。
要分清楚哪个因素的影响作用比较大,就可以应用双因素方差分析的方法来解决。
◆双因素方差分析应用条件:
因变量和协变量必须是数值型变量,且因变量来自或近似来自正态总体。
因素变量是分类变量,变量可以是数值型或字符型的。
各水平下的总体假设服从正态分布,而且假设各水平下的方差是相等的。
双因素方差分析过程可以分析出每一个因素的作用;各因素之间的交互作用;检验各总体间方差是否相等;还能够对因素的各水平间均值差异进行比较等。
例5:
表2.10是某商品S在不同地区和不同时期的销售量表。
已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。
表2.10某商品S销售量表单位:
千件
1
2
3
4
5
1
6.5
14.2
13.4
2.4
6.2
2
1.8
7.1
9.4
1.5
4.8
3
3.6
10.8
7.2
1.7
4.9
4
3.7
8.9
8.6
2.3
4.6
5
7.6
12.6
7.5
2.8
5.2
由于销售量受地区和时间两个因素的影响,这是一个双因素方差分析的问题,根据上表建立数据文件SY-7,具体分析的步骤如下:
1、单击AnalyzeGenerallinearModelUnivariate,打开Univariate主对话框。
如图2.11所示:
图2.11双因素方差分析对话框
2、选择要分析的变量”销售量”进入DependentVariable框中,选择因素变量”地区”和”时期”进入FixedFactor框中。
3、单击Model按纽选择分析模型,得到Model对话框。
如图2.12所示:
在Specify框中,指定模型类型。
FullFactorial选项为系统默认项,建立全模型,全模型中包括因素之间的交互作用。
如果选择分析两个因素的交互作用,则必须在每种水平组合下,取得两个以上的实验数据,才能实现两个因素的交互作用的分析结果。
如果不考虑因素间的交互作用时,应当选择自定义模型。
图2.12Univariate:
Model对话框
Custom选项为自定义模型,本例选择此项并激活下面的各项操作。
先从左边框中选择因素变量进入Model框中,然后选择效应类型。
一般不考虑交互作用时,选择主效应Main,考虑交互作用时,选择交互作用Interaction。
可以通过单击BuildTerm下面的小菜单完成,本例中选择主效应。
最后在SumofSquare中选择分解平方和的方法后返回在主对话框。
一般选取默认项TypeⅢ。
单击OK就可以得到相应的双因素方差分析表2.11.
表2.11销售量的双因素方差分析检验表
TestsofBetween-SubjectsEffects
DependentVariable:
商品S(千件)
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
289.717(a)
8
36
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 教程 第二 均值 比较 检验 方差分析