实验六方差分析.docx
- 文档编号:6891316
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:10
- 大小:40.38KB
实验六方差分析.docx
《实验六方差分析.docx》由会员分享,可在线阅读,更多相关《实验六方差分析.docx(10页珍藏版)》请在冰豆网上搜索。
实验六方差分析
实验六方差分析
⏹方差分析(analysisofvariance,缩写为ANOVA)是检验多个总体均值是否相等的一种统计方法。
⏹分为单因素方差分析和多因素方差分析。
⏹单因素方差分析:
分析Analyze==>均值比较CompareMeans==>单样本方差分析One-WayANOVA
⏹多因素方差分析:
分析Analyze==>广义线性模型GeneralLinearModel==>单响应变量Univariate;
预备知识:
方差分析的前提条件:
1、被检验的样本应服从正态分布
2、各个总体的标准(方)差相等,并且样本的选择是独立的。
即所谓的“方差齐性”
3、各观测值是独立的。
方差分析原理:
◆方差分析是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有影响。
◆衡量因素的同一水平(同一个总体)下样本数据的误差,我们称为组内误差(withingroups)。
◆衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差(betweengroups)。
◆组内误差只包含随机误差,而组间误差既包含随机误差,也包括系统误差。
◆如果组间(不同水平间)误差中只包含随机误差,而没有系统误差,这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1;
◆反之,如果在组间误差中除了包含随机误差外,还包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。
◆当这个比值大到某种程度时,我们就可以说因素的不同水平之间存在着显著差异。
在方差分析中通常用两个方差来衡量,一个是基于样本均值之间差异的因素水平间方差(组间误差),另一个是基于样本内部差异的因素水平内方差(组内误差)
◆如果这两个方差的比值近似为1,方差分析的结果可以得到总体均值相同。
◆如果这两个方差的比值偏离1,方差分析的结果可以得到总体均值不相同。
方差分析的假设检验:
方差分析的零假设:
方差分析的判断:
1、
拒绝零假设,即各样本均值有显著性差异;
2、
没有理由拒绝零假设,即各样本均值无显著性差异;
一、单因素方差分析(One-WayANOVA)
分析Analyze==>均值比较CompareMeans==>单样本方差分析One-WayANOVA
1、基本功能
⏹单因素方差分析是只针对一个因素进行;
⏹旨在分析该因素对样本的观察值是否产生影响;
⏹各因素水平的样本容量大小可以一致,也可以不一致。
2、原理
总误差=组间误差+组内误差
方差来源
平方和SS
自由度df
均方MS
F值
组间(因素影响)
组内(误差)
总和
SSA
SSE
SST
k-1
n-k
n-1
MSA
MSE
F
SPSS会自动计算F统计量和p值。
当方差分析检验的结果拒绝原假设时,只能得到各水平间的样本均值不完全相同的结论。
如果要想明确是哪一个因素水平的均值或哪几个同其他均值不相等,就需要进行多重比较。
3、单因素方差分析步骤
准备工作:
与EXCEL不同,需两个变量分别存放观测变量值和控制变量的水平值。
(即所有的样本数据通通放在一个变量中,通过控制变量来识别各个数据来自于哪一个样本)
⏹1、选择分析Analyze==>均值比较CompareMeans==>单样本方差分析One-WayANOVA;
⏹2、将观测变量选择到DependentList框;
⏹3、将控制变量(变量)选择到Factor框,控制变量有几个不同的取值表示控制变量有几个水平。
至此,SPSS便自动分解观测变量的变差,计算组间方差、组内方差、F统计量以及对应的概率p值,完成单因素方差分析的相关计算,并将计算显示到输出窗口中。
我们所要做的工作就是通过输出窗口查看p值,并作出判断。
4、重要结果解释
SumofSquares
df
MeanSquare
F
Sig
因素水平间方差
因素水平内方差
总差异
8.6161×1011
4.69689×1012
5.5585×1012
3
56
59
2.872×1011
8.3873×1010
3.42
.000
可以看到,上表的离差平方总和为5.5585×1012,如果仅考虑单个因素的影响,则总变差中,不同水平可解释的变差为8.6161×1011
,抽样误差引起的随机变差为4.69689×1012
,它们均方差分别为2.872×1011
和8.3873×1010,相除所得的F统计量的观测值为3.42,对应的概率p值近似为0,如果显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝零假设。
5、单因素方差分析的进一步分析
⏹方差齐性检验
✓是对控制变量不同水平下各观测变量总体方差是否相等进行分析;
✓是单因素方差分析的前提;
✓采用了方差同质性(HomogeneityofVariance)的检验方法;
✓零假设是各水平下观测变量总体方差无显著差异;
✓实现思路同SPSS两独立样本t检验中的方差检验。
⏹多重比较检验
✓进一步确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显不同于其他水平,哪个水平的作用是不显著的;
✓零假设是相应水平下观测变量的均值间不存在显著差异;
✓根据检验统计量的不同,分为:
LSD方法(LeastSignificantDifference最小显著性差异法)、Bonferroni方法、Tukey方法、Scheffe方法、S-N-K方法、
二、多因素方差分析
选择Analyze==>广义线性模型GeneralLinearModel==>单响应变量Univariate;
1、基本功能
⏹用来研究两个及两个以上控制变量是否对观测变量产生显著影响;
⏹不仅能够分析多个因素对观测变量的独立影响,更能分析多个控制因素的交互作用能否对观测变量的分布产生显著影响;
⏹最终找到有利于观测变量的最优组合。
2、原理以两个控制变量为例:
其中:
SST——观测变量总变差
SSA、SSB——控制变量A、B独立作用引起的变差
SSAB——A、B两两交互作用引起的变差
SSE——随机因素引起的变差
方差来源
平方和SS
自由度df
均方MS
F值
因素A
因素B
误差
总和
SSA
SSB
SSE
SST
k-1
r-1
(k-1)(r-1)
kr-1
MSA
MSB
MSE
FA
FB
3、多因素方差分析的零假设
除
即各个因素水平间的均值相等以外
还满足控制变量各效应和交互作用效应同时为0,即控制变量以及它们的交互作用没有对观测变量产生显著影响。
SPSS会自动计算F统计量和p值。
◆给出显著性水平α,依次与各个检验统计量的概率p值作比较。
◆如果FA的概率p值小于显著性水平α,则应拒绝零假设,认为控制变量A不同水平下观测变量各总体的均值存在显著差异,反之,则不应拒绝零假设。
◆对控制变量B和A,B交互作用的推断同理。
3、单因素方差分析步骤
准备工作:
首先将各个控制变量以及观测变量分别定义成多个SPSS变量,并组织好数据后再进行分析。
⏹1、选择Analyze==>GeneralLinearModel==>Univariate;
⏹2、将观测变量选择到DependentVariable框;
⏹3、把固定效应的控制变量指定到FixedFactor框,把随机效应的控制变量指定到RandomFactor框中。
至此,SPSS将自动建立多因素方差分析的饱和模型,并计算各检验统计量的观测值和对应的概率p值,并将结果显示到输出窗口中。
4、重要结果解释
方差来源
SumofSquares
df
MeanSquare
F
Sig
因素A
因素B
随机性误差
总差异
8.6161×1011
3.455×1012
1.24189×1012
5.5585×1012
3
14
42
59
2.872×1011
2.468×1011
2.957×1010
9.713
8.346
.000
.000
可以看到,上表的离差平方总和为5.5585×1012,如果仅考虑多个因素的影响,则总变差中,因素A可解释的变差为8.6161×1011
,因素B可解释的变差为3.455×1012
,抽样误差引起的随机变差为1.24189×1012
,它们均方差分别为2.872×1011、2.468×1011和2.957×1010
各自除以随机性误差得到F统计量的观测值分别为9.713、8.346,对应的概率p值分别近似为0,如果显著性水平α为0.05,由于概率p值大于显著性水平α,则应拒绝零假设。
5、多因素方差分析的进一步分析
⏹建立非饱和模型
✓如果控制变量的某阶交互作用没有给观测变量产生显著影响,就可以尝试建立非饱和模型;
✓与饱和模型的差别主要表现在将观测变量总变差中,将其中某些变差合并到SSE中;
✓其参数估计方法、采用的检验统计量与饱和模型类似。
SPSS多因素方差分析中默认建立的是饱和模型,如需建立非饱和模型,则应在主窗口中单击Model按钮,然后选择Custom项。
⏹均值检验
✓利用多因素方差分析功能还能够对各个控制变量不同水平下的均值是否存在显著差异进行比较;
✓实现方式有两种:
多重比较检验、对比检验;
✓多重比较检验的方法与单因素方差分析类似;
✓对比检验实际采用的是单样本t检验的方法,它将控制变量不同水平下的观测变量值看作是来自不同总体的样本,并依次检验这些总体的均值是否与某个指定的检验值存在显著差异。
如采用多重比较检验,则应在主窗口中单击PostHoc按钮;
如采用对比检验法,则应在主窗口中单击Contrasts按钮。
⏹控制变量交互作用的图形分析
✓控制变量的交互作用可以通过图形直观分析;
✓如果控制变量之间无交互作用,各水平对应的直线是近于平行的;
✓如果控制变量之间存在交互作用,各水平对应的直线会相互交叉。
如希望图形直观判断控制变量间是否存在交互作用,则在主窗口中单击Plots按钮。
补充:
协方差分析
1、基本功能
将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。
协方差分析是介于方差分析和回归分析中的一种分析方法。
2、原理
协方差分析仍沿袭方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,认为观测变量的变动受四个方面的影响,即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。
3、协方差分析的零假设
协变量对观测变量的线性影响是不显著的。
3、单因素方差分析步骤
准备工作:
首先将协变量定义成一个SPSS变量。
⏹1、选择Analyze==>GeneralLinearModel==>Univariate;
⏹2、将观测变量选择到DependentVariable框;
⏹3、把固定效应的控制变量指定到FixedFactor框,把随机效应的控制变量指定到RandomFactor框中。
⏹4、把作为协变量的变量指定到Covareate框中。
至此,SPSS将自动完成对各变差的分析,并计算各F检验统计量的观测值和对应的概率p值,并将结果显示到输出窗口中。
案例1:
某企业在制订某商品的广告策略时,对不同广告形式在不同地区的广告效果(销售额)进行了评估。
这里,以商品销售额为观测变量,广告形式和地区为控制变量,通过单因素方差分析方法分别对广告形式、地区对销售额的影响进行分析。
提示:
两个单因素方差分析的零假设分别为:
◆不同广告形式没有对销售额产生显著影响(即不同广告形式对销售额的效应同时为0;
◆不同地区的销售额没有显著差异(即不同地区对销售额的效应同时为0)。
案例2:
仍采用某企业对不同广告形式在不同地区的广告效果(销售额)进行评估的数据。
通过多因素方差分析方法对广告形式、地区、广告形式和地区的交互作用对销售额的影响进行分析,进而为制订广告和地区的最优宣传组合方案提供依据
提示:
以广告形式和地区为控制变量,销售额为观测变量,多因素方差分析的零假设为:
◆不同广告形式没有对销售额产生显著影响;
◆不同地区的销售额没有显著差异。
◆广告形式和地区对销售额没有产生显著的交互影响。
案例3:
为研究三种不同饲料对生猪体重增加(wyh)的影响,将生猪随机分成三组各喂养不同的饲料(sl),得到体重增加到数据。
由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重(wyq)的数据,作为自身身体条件的测量指标。
为准确评价饲料的优劣,采用单因素协方差分析的方法进行分析。
这里,猪体重的增加量为观测变量,饲料为控制变量,猪喂养前端体重为协变量。
提示:
为分析猪喂养前端体重是否能够作为协变量,可以先绘制它与体重增加量的散点图;
为便于比较,进行一次单因素方差分析,两者结果进行对比。
结果解释
Source
TypleⅢSumofSquares
df
MeanSquare
F
Sig
CorrectedModel
Intercept
WYQ
SL
Error
Total
CorrectedTotal
2328.344a(1317.583)
980.448(204057.042)
1010.760(1317.583)
707.219(1238.375)
227.615↘(1238.375)
206613.000(相同)
2555.958(相同)
3
1
1
2
20
24
23
776.115
980.448
1010.760
353.609
11.381
68.196
86.150
88.813
31.071
.000
.000
.000
.000
.286
a.RSquared=.911(AdjustedRSquared=.898
粗体部分数据代表单因素方差分析结果,说明随机因素可解释的变差减少,这是由于扣除了喂养前体重的影响造成的。
案例4:
以Only服装销售量.xls的各季度销售量相关统计表
分析一:
分析季度对销售量有无影响?
分析二:
分析季度和商场的不同对销售量有无影响?
提示:
分别以EXCEL和SPSS两种方式来分析。
案例5:
居民生活消费研究
GDP的稳定增长一直以来都是世界各国在促进经济发展的同时所共同关心的问题。
近年来,我国的GDP保持健康稳定发展,随着人民收入的不断增长,人民生活水平有所提高,生活消费支出在收入中的比重也有所上升,而衣、食、住、行等各项支出在生活消费支出中的比重在各个地区城乡居民之间也略有不同。
通过对各地区各项支出的统计分析,就能比较清楚地了解到各个地区城乡居民的平均生活水平和生活质量。
利用全国部分地区生活消费.xls,选用本章中介绍的合适的统计分析方法和恰当的显著性水平,试分析各项生活消费支出和地区间生活消费支出是否存在差异。
如果存在差异,请分析差异产生的主要原因,并指出差异较大的支出和地区,试完成一份全面的案例分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验六 方差分析 实验