spss协方差分析的基本原理.docx
- 文档编号:23693587
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:22
- 大小:342.48KB
spss协方差分析的基本原理.docx
《spss协方差分析的基本原理.docx》由会员分享,可在线阅读,更多相关《spss协方差分析的基本原理.docx(22页珍藏版)》请在冰豆网上搜索。
spss协方差分析的基本原理
协方差分析的基本原理
1•协方差分析的提出
无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。
在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。
如果忽略这些因素的影响,则有可能得到不正确的结论。
例如,研究3种不同的教学方法的教学效果的好坏。
检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。
又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。
一般情况下,工作年限越长,工资就越高。
在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。
再如,如果要了解接受不同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysisof
Covarianee),通过统计模型的校正使得各组在"进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。
为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。
利用协方差分析就可以完成这样的功能。
协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。
协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。
前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量
(控制变量),又包含了定量变量(协变量)。
协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。
当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。
以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。
2•协方差分析的计算公式
以单因素协方差分析为例,总的变异平方和表示为:
Q总=Q控制变量Q协变量■Q随机变量
协方差分析仍然采用F检验,其零假设H。
为多个控制变量的不同水平下,各总体平均值没有显著差异。
22
F统计量计算公式为:
F控制变量=2控制变量,F协变量=2协变量S随机变量S随机变量
以上F统计量服从F分布。
SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。
如果F控制变量的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如
果F协变量的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。
3•协方差分析需要满足的假设条件
(1)自变量是分类变量,协变量是定距变量,因变量是连续变量;
(2)对连续变量或定居变量的协变量的测量不能有误差;
(3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;
(4)协变量的回归系数是相同的。
在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。
如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。
(5)自变量与协变量是直角关系,即互不相关,它们之间没有交互作用。
如果协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除。
4.协方差分析SPSS的示例
在进行新的外语教学方法实验时,往往需要在实验前和实验后对实验组和控制组的学生都进行成绩测试,以便确定新的教学方法对实验后成绩的影响。
显然,实验前成绩与实验后成绩之间会有内在联系,如果要更准确地确定新的教学方法的效果,有必要考虑实验前成绩对实验后成绩的影响,也就是说可以把前测成绩作为协变量进行协方差分析。
本例子中的实验研究共有15名受试者,将这些受试者随机分为3组,各组有5人,然后对这三组进行
不同的教学方法实验。
其中一组为控制组,实验时不对教学方法进行改变,仍然采用以前的传统教学方法。
另两组为实验组,分别用交际法和沉浸法两种教学方法进行教学方法实验。
实验开始前对这三组学生用相同的试卷进行了英语测试,得出了前测成绩。
实验结束后,用新的试卷同时对这三组学生进行了测试,得出了后测成绩。
然后将要分析的数据输入到SPSS中去。
见数据录入表格所示。
我们用1表示传统教学方法,2
表示交际法,3表示沉浸法。
我们先不考虑前测成绩,以“教学方法”为因素变量,“后测成绩”为因变量进行单因素方差分析。
从
方差分析结果来看,概率值为0.463(远远大于0.05的显著性水平),说明三种教学方法在后测成绩上似乎没
有显著差异,但如果以前测成绩作为协变量进行方差分析时,分析结果可能就会有差异。
以下将以前测成绩作为协变量进行方差分析,检验三种不同教学方法是否真的没有显著差异。
未作协方差分析之前的单因素方差分析表
ANOVA
后测成绩
Sumof
Squares
df
MeanSquare
F
Sig.
BetweenGroups
213.333
2
106.667
.821
.463
WithinGroups
1560.000
12
130.000
Total
1773.333
14
用SPSS进行协方差分析,可以分两大步骤进行,首先检验回归斜率相等的假设,然后进行协方差分析。
一、回归斜率相等的假设
1、分组散点图
对于本例,首先应了解三种教学方法的前测成绩与后测成绩的回归线是否平行,即前测考试成绩的影响在分别采用三种教学法的三个班级中是否相同,这可以用前测成绩与教学法是否存在交互作用来表示。
对于该问题,首先可以作分组散点图,观察三组直线趋势是否近似,然后看交互作用有无统计学意义,当交互作用无统计学意义时,则进行协方差分析,得出统计结论。
在菜单中选择Graphs^Scatter/Dot,打开atter/Dot对话框,选择SimpleScatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为(Panelby宀Rows),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出ChartEditor对话框,按照菜单Element宀FitLineatTotal,可
以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相
10.0020.0030.0040.0050.0060.0070.00
前测成績
如果按照菜单Graphs^Scatter/Dot,打开atter/Dot对话框,选择SimpleScatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为标记变量(Setmarkersby),作出散点图,注意
在作出散点图之后,左键双击输出的图形,调出ChartEditor对话框,按照菜单Element~FitLineatTotal,
可以得到如下图所示的散点图,作出散点图,注意在作出散点图之后,左键双击输出的图形,调出ChartEditor
对话框,按照菜单Element^FitLineatsubgroups,可以得到如下图所示的散点图,从图中可知三组中前
测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。
10.0020.00300040OD50.00600070.00
2、组内回归斜率相同检验
步骤1:
选择协方差分析菜单(与GLM单因素方差分析菜单相同)。
点击数据编辑界面的Analyze命令,选择GeneralLinearModel,并打开Univariate对话框。
步骤2:
选定因变量、因素变量和协变量。
在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入DependentVariable方框中。
然后选择“教学方法”作为因素变量,将其移入到FixedFactor(s)方
框中。
再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。
步骤3:
确定分析模型。
在对话框中单击Model命令按钮,进入UnivariateModel对话框中。
该对话框
提供了两种不同形式的模型,完全因素(fullfactorial)和自定义因素(custom)模型。
由于要进行回归斜率
相同的检验,所以本例使用自定义因素模型。
点击Custom选择按钮后,从左边的变量列表中选择“教学方
法”,点击右向箭头将其移入Model方框中。
用同样的方法将变量列表中的“前测成绩”移入Model方框中。
最后在变量列表中连续点击“教学方法”和“前测成绩”,同时选中它们,再点击右向箭头,Model方框中会
出现“教学方法*前测成绩”字样,意为进行交互效应分析,即检验回归线斜率相等的假设。
点击Continue
TestsofBetween-SubjectsEffects
DependentVariable:
后测成绩
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
1498.531(a)
5
299.706
9.816
.002
Intercept
632.390
1
632.390
20.711
.001
教学方法
84.312
2
42.156
1.381
.300
前测成绩
86.072
1
86.072
2.819
.127
教学方法*前测成绩
166.488
2
83.244
2.726
.119
Error
274.802
9
30.534
Total
47700.000
15
CorrectedTotal
1773.333
14
aRSquared=.845(AdjustedRSquared=.759)
上表是组内回归斜率相同检验结果,教学方法与前测成绩的交互效应检验的F值为2.726,概率值为0.119
(大于0.05),没有达到显著性水平,表明三组的回归斜率相同,即各组的回归线为平行线,符合了协方差
分析的回归斜率相同的条件。
这一结果表明,下面所进行的协方差分析的结果是有效的。
二、协方差分析步骤
步骤1:
选择协方差分析菜单(与GLM单因素方差分析菜单相同)。
点击数据编辑界面的Analyze命令,
选择GeneralLinearModel,并打开Univariate对话框。
步骤2:
选定因变量、因素变量和协变量。
在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入DependentVariable方框中。
然后选择“教学方法”作为因素变量,将其移入到FixedFactor(s)方
框中。
再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。
步骤3:
选择组建对比方式和输出结果。
由于有了协方差,无法使用主对话框中PostHoc命令按钮进行
组间多重比较。
但是可以按照下面的方法进行。
在主对话框中点击Option按钮,进入结果输出选择对话框中,从左边的因素变量列表中选择“教学方法”将其移入DisplayMeansfor方框中,意为输出不同教学方法后测
成绩调整后(考虑了协变量效应之后)的边缘平均值。
选择Comparemaineffects,意为对“教学方法”各组
的后测成绩平均值进行组间比较。
在Confideneeintervaladjustment下拉菜单中选择LSD,意为进行Tukey
LSD事后检验。
选择输出结果时,在Display部分选择Descriptivestatistics、Homogeneitytests,分别意味着输出每一组
的描述统计量和方差齐性检验(见下图)
步骤4:
指定模型形式。
在主对话框中点击Model按钮进入Univariate:
Model对话框。
本例采用完全因
素模型,即点击Fullfactorial按钮(见下图)。
完全因素模型包括全部因素变量和协变量的主效应、因素变量间的交互效应,但不包括与协变量的交互效应。
由于本例中只有一个因素变量和一个协变量,没有交互效应,
计算结果只会有主效应。
至此为止,所有对话框指定完毕,点击Continue按钮回到主对话框,再点击0K按
钮提交程序运行即可。
三、协方差分析输出结果及说明
因素变量表
Between-SubjectsFactors
ValueLabel
N
教学1.00
传统教学法
5
方法2.00
交示法
5
3.00
沉浸法
5
描述统计表
DescriptiveStatistics
DependentVariable:
后测成绩
教学方法
Mean
Std.Deviation
N
传统教学法
50.0000
12.24745
5
交示法
58.0000
14.83240
5
沉浸法
58.0000
4.47214
5
Total
55.3333
11.25463
15
方差齐性检验表
下表汇报了方差齐性检验结果,由表可知,F值为0.220,概率值为0.806(大于0.05),说明各组之间的方差基
本相同。
这一结果满足了参数检验的另一个条件,因此下面些方差分析结果是有效的。
Levene'sTestofEqualityofErrorVariances
DependentVariable:
后测成绩
F
df1
df2
Sig.
.220
2
12
.806
Teststhenullhypothesisthattheerrorvarianceof
thedependentvariableisequalacrossgroups.
a・Design:
Intercept+前测成绩+教学方法
协方差分析表
TestsofBetween-SubjectsEffects
DependentVariable:
后测成绩
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
1332.043a
3
444.014
11.068
.001
Intercept
1426.414
1
1426.414
35.556
.000
前测成责
1118.710
1
1118.710
27.886
.000
教学方法
346.429
2
173.214
4.318
.041
Error
441.290
11
40.117
Total
47700.000
15
CorrectedTotal
1773.333
14
a.RSquared=.751(AdjustedRSquared=.683)
上表包括了协变量“前测成绩”之后的方差分析结果,由表可知,协变量“前测成绩”的概率值为0.000,说明“前测成绩”能显著地预示“后测成绩”,也就是说,它对后测成绩产生了显著的影响。
因素变量“教
学法”也达到了显著水平(0.041),说明“教学方法”对后测成绩也产生了显著的影响,该结果告诉我们至
少有一个教学组与另一个教学组之间有显著差异,
但哪些组之间有差异,必须查看后面的组间多重比较结果。
这里我们不妨把协方差分析结果与没有包括协方差分析结果做一比较,看看它们之间是否有差异。
未作协方差分析之前的单因素方差分析表(表1)
ANOVA
Sumof
Squares
df
MeanSquare
F
Sig.
BetweenGroups
213.333
2
106.667
.821
.463
WithinGroups
1560.000
12
130.000
Total
1773.333
14
协方差分析表(表2)
TestsofBetween-SubjectsEffects
DependentVariable:
后测成绩
Source
TypeIIISumofSquares
df
MeanSquare
F
Sig.
CorrectedModel
1332.043a
3
444.014
11.068
.001
Intercept
1426.414
1
1426.414
35.556
.000
前测成责
1118.710
1
1118.710
27.886
.000
教学方法
346.429
2
173.214
4.318
.041
Error
441.290
11
40.117
Total
47700.000
15
CorrectedTotal
1773.333
14
aRSquared=.751(AdjustedRSquared=.683)
(1)表1中,“教学方法”的概率值为0.463,大于0.05的显著性水平,方差分析结果表明,“教学方法”
对“后测成绩”不产生显著影响;而表2中的协方差分析结果表明,“教学方法”达到了显著性水平(0.041),
即对“后测成绩”产生了显著影响。
(2)表1中由组间差异(BetweenGroups)解释的方差是213.333;表2中而考虑了协方变量之后,模型解释的方差(CorrectedModel)却增加到了1332.043。
(3)表1表明,需要解释的总方差为1773.333,而“教学方法”只解释了213.333个单位,还有1560个单
位的方差未得到解释;表2表明,需要解释的总方差仍然是1773.333,但“教学方法”解释的方差却增加到了
346.429,除掉协变量解释的方差(1118.71),未解释的方差只有441.29。
由上述3个方面可以看出,进行协方差分析能更准确地检验因素变量对因变量的作用。
调整后的后测成绩平均值(Estimates)
Estimates
DependentVariable:
后测成绩
教学方法
Mean
Std.Error
95%ConfidenceInterval
LowerBound
UpperBound
传统教学法
51.097a
2.840
44.846
57.348
交际法
62.387a
2.952
55.890
68.884
沉浸法
52.516a
3.017
45.876
59.156
a.Covariatesappearinginthemodelareevaluatedatthefollowng
values:
前测成绩=46.0000.
上表给出的不是三个不同教学组的原始后测成绩平均值,而是调整后的各组平均值,即模型的预示平均
值,本利中模型预示的三种教学法的平均成绩分别为51.097、63.387和52.516。
从这一结果也可以看出,第
种与第二种的差异较大,而与第三种教学法的平均值比较接近。
多重组间比较结果
PairwiseComparisons
DependentVariable:
后测成绩
(1)教学方法
(J)教学方法
Mean
Difference
(l-J)
Std.Error
Sig.a
95%ConfidenceIntervalfora
Difference
LowerBound
UpperBound
传统教学法
交际法
-11.290*
4.054
.018
-20.213
-2.367
沉浸法
-1.419
4.195
.741
-10.653
7.814
交际法
传统教学法
11.290*
4.054
.018
2.367
20.213
沉浸法
9.871*
4.421
.047
.141
19.600
沉浸法
传统教学法
1.419
4.195
.741
-7.814
10.653
交际法
-9.871*
4.421
.047
-19.600
-.141
Basedonestimatedmarginalmeans
*.Themeandifferenceissignificantatthe.05level.
a・Adjustmentformultiplecomparisons:
LeastSignificantDifference(equivalenttonoadjustments).
该结果对三个教学组分别进行了比较,由该表可知,传统教学法与交际教学法有显著差异,交际法与沉浸法之间也有显著差异。
从平均值一栏中,还可以看出,交际法的教学效果优于其他两种方法。
多重组间比较方差分析结果
UnivariateTests
DependentVariable:
后测成绩
Sumof
Squares
df
MeanSquare
F
Sig.
Contrast
346.429
2
173.214
4.318
.041
Error
441.290
11
40.117
TheFteststheeffectof教学方法.Thistestisbasedonthelinearly
independentpairwisecomparisonsamongtheestimatedmarginalmeans.
上表给出了方差来源、对比(教学方法)和误差的平方和、自由度、均方、F值和概率值。
多重组间比
较方差分析同样表明,不同的教学方法之间的后测成绩有显著差异。
结果汇报
协方差分析产生了大量表格,再研究汇报时不宜一一汇报,可主要汇报描述统计表、些方差分析表以及多重组间比较结果表。
练习1:
现在想研究3组同学(分别接受了3种不同的教学方法)在数学成绩上是否有显著差异。
已知这些同学的数学入学成绩,数据如下表所示。
表中共有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 协方差分析 基本原理