方差分析和协方差分析协变量和控制变量.docx
- 文档编号:10737051
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:9
- 大小:21.28KB
方差分析和协方差分析协变量和控制变量.docx
《方差分析和协方差分析协变量和控制变量.docx》由会员分享,可在线阅读,更多相关《方差分析和协方差分析协变量和控制变量.docx(9页珍藏版)》请在冰豆网上搜索。
方差分析和协方差分析协变量和控制变量
方差分析和协方差分析,协变量和控制变量
方差分析
方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析〞或“F检验〞,是R.A.Fisher创造的,用于两个及两个以上样本均数差异的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状。
造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。
假定条件和假设检验"
1.方差分析的假定条件为:
〔1〕各处理条件下的样本是随机的。
〔2〕各处理条件下的样本是相互独立的,否那么可能出现无法解析的输出结果。
〔3〕各处理条件下的样本分别来自正态分布总体,否那么使用非参数分析。
〔4〕各处理条件下的样本方差一样,即具有齐效性。
2.方差分析的假设检验 假设有K个样本,如果原假设H0样本均数都一样,K个样本有共同的方差σ,那么K个样本来自具有共同方差σ和一样均值的总体。
如果经过计算,组间均方远远大于组内均方,那么推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。
否那么成认原假设,样本来自一样总体,处理间无差异。
作用
一个复杂的事物,其中往往有许多因素互相制约又互相依存。
方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最正确水平等。
方差分析是在可比拟的数组中,把数据间的总的“变差〞按各指定的变差来源进展分解的一种技术。
对变差的度量,采用离差平方和。
方差分析方法就是从总离差平方和分解出可追溯到指定来源的局部离差平方和,这是一个很重要的思想。
经过方差分析假设拒绝了检验假设,只能说明多个样本总体均值不相等或不全相等。
假设要得到各组均值间更详细的信息,应在方差分析的根底上进展多个样本均值的两两比拟。
多个样本均值间两两比拟 多个样本均值间两两比拟常用q检验的方法,即Newman-kueuls法,其根本步骤为:
建立检验假设-->样本均值排序-->计算q值-->查q界值表判断结果。
多个实验组与一个对照组均值间两两比拟 多个实验组与一个对照组均值间两两比拟,假设目的是减小第II类错误,最好选用最小显著差法〔LSD法〕;假设目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q'界值表。
根本思想
根本思想
通过分析研究中不同来源的变异对总变异的奉献大小,从而确定可控因素对研究结果影响力的大小。
举例分析
下面我们用一个简单的例子来说明方差分析的根本思想:
如某克山病区测得11例克山病患者和13名安康人的血磷值〔mmol/L〕如下:
患者:
0.841.051.201.201.391.531.671.801.872.072.11安康人:
0.540.640.640.750.760.811.161.201.341.351.481.561.87 问该地克山病患者与安康人的血磷值是否不同. 从以上资料可以看出,24个患者与安康人的血磷值各不一样,如果用离均差平方和〔SS〕描述其围绕总均值的变异情况,那么总变异有以下两个来源:
组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等; 组间变异,即由于克山病的影响使得患者与安康人组的血磷值均值大小不等。
而且:
SS总=SS组间+SS组内v总=v组间+v组内 如果用均方〔离差平方和除以自由度〕代替离差平方和以消除各组样本数不同的影响,那么方差分析就是用组间均方去除组内均方的商〔即F值〕与1相比拟,假设F值接近1,那么说明各组均值间的差异没有统计学意义,假设F值远大于1,那么说明各组均值间的差异有统计学意义。
实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表〔方差分析用〕获得。
利用统计学软件分析结果如下:
dataa; inputtypenum; cards; 10.8411.0511.2011.2011.3911.5311.6711.8011.8712.0712.11 20.5420.6420.6420.7520.7620.8121.1621.2021.3421.3521.4821.5621.87 ; run; procanova; classtype; modelnum=type; meanstype; run;
自由度
离差平方和
均方
F值
P值
SS组间〔处理因素〕
1
1.13418185
1.13418185
6.37
0.0193〔有统计学意义〕
SS组内〔抽样误差〕
22
3.91761399
0.17807336
总和
23
5.05179583
分类及举例
单因素方差分析
〔一〕单因素方差分析概念理解步骤 是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。
这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。
这些问题都可以通过单因素方差分析得到答案。
单因素方差分析的第一步是明确观测变量和控制变量。
例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。
单因素方差分析的第二步是剖析观测变量的方差。
方差分析认为:
观测变量值得变动会受控制变量和随机变量两方面的影响。
据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两局部,用数学形式表述为:
SST=SSA+SSE。
单因素方差分析的第三步是通过比拟观测变量总离差平方和各局部所占的比例,推断控制变量是否给观测变量带来了显著影响。
〔二〕单因素方差分析原理总结 容易理解:
在观测变量总离差平方和中,如果组间离差平方和所占比例较大,那么说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,那么说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
〔三〕单因素方差分析根本步骤 1、提出原假设:
H0——无差异;H1——有显著差异 2、选择检验统计量:
方差分析采用的检验统计量是F统计量,即F值检验。
3、计算检验统计量的观测值和概率P值:
该步骤的目的就是计算检验统计量的观测值和相应的概率P值。
4、给定显著性水平,并作出决策〔四〕单因素方差分析的进一步分析 在完成上述单因素方差分析的根本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他几个重要分析,主要包括方差齐性检验、多重比拟检验。
1、方差齐性检验 是对控制变量不同水平下各观测变量总体方差是否相等进展检验。
前面提到,控制变量不同各水平下观测变量总体方差无显著差异是方差分析的前提要求。
如果没有满足这个前提要求,就不能认为各总体分布一样。
因此,有必要对方差是否齐性进展检验。
SPSS单因素方差分析中,方差齐性检验采用了方差同质性〔homogeneityofvariance〕检验方法,其原假设是:
各水平下观测变量总体的方差无显著差异。
2、多重比拟检验 单因素方差分析的根本分析只能判断控制变量是否对观测变量产生了显著影响。
如果控制变量确实对观测变量产生了显著影响,进一步还应确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显区别于其他水平,哪个水平的作用是不显著的,等等。
例如,如果确定了不同施肥量对农作物的产量有显著影响,那么还需要了解10公斤、20公斤、30公斤肥料对农作物产量的影响幅度是否有差异,其中哪种施肥量水平对提高农作物产量的作用不明显,哪种施肥量水平最有利于提高产量等。
掌握了这些重要的信息就能够帮助人们制定合理的施肥方案,实现低投入高产出。
多重比拟检验利用了全部观测变量值,实现对各个水平下观测变量总体均值的逐比照拟。
由于多重比拟检验问题也是假设检验问题,因此也遵循假设检验的根本步骤。
检验统计量的构造方法
〔1〕LSD方法 LSD方法称为最小显著性差异〔LeastSignificantDifference〕法。
最小显著性差异法的字画就表达了其检验敏感性高的特点,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。
正是如此,它利用全部观测变量值,而非仅使用某两组的数据。
LSD方法适用于各总体方差相等的情况,但它并没有对犯一类错误的概率问题加以有效控制。
〔2〕S-N-K方法 S-N-K方法是一种有效划分相似性子集的方法。
该方法适合于各水平观测值个数相等的情况,3、其他检验〔1〕先验比照检验 在多重比拟检验中,如果发现某些水平与另外一些水平的均值差距显著,如有五个水平,其中x1、x2、x3与x4、x5的均值有显著差异,就可以进一步分析比拟这两组总的均值是否存在显著差异,即1/3(x1+x2+x3)与1/2(x4+x5)是否有显著差异。
这种事先指定各均值的系数,再对其线性组合进展检验的分析方法称为先验比照检验。
通过先验比照检验能够更准确地掌握各水平间或各相似性子集间均值的差异程度。
〔2〕趋势检验 当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的,是呈现线性变化趋势,还是呈二次、三次等多项式变化。
通过趋势检验,能够帮助人们从另一个角度把握控制变量不同水平对观测变量总体作用的程度。
多因素方差分析
〔一〕多因素方差分析根本思想 多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。
这里,由于研究多个因素对观测变量的影响,因此称为多因素方差分析。
多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。
例如:
分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。
利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。
〔二〕多因素方差分析的其他功能 1、均值检验 在SPSS中,利用多因素方差分析功能还能够对各控制变量不同水平下观测变量的均值是否存在显著差异进展比拟,实现方式有两种,即多重比拟检验和比照检验。
多重比拟检验的方法与单因素方差分析类似。
比照检验采用的是单样本t检验的方法,它将控制变量不同水平下的观测变量值看做来自不同总体的样本,并依次检验这些总体的均值是否与某个指定的检验值存在显著差异。
其中,检验值可以指定为以下几种:
观测变量的均值〔Deviation〕; 第一水平或最后一个水平上观测变量的均值〔Simple〕; 前一水平上观测变量的均值〔Difference〕; 后一水平上观测变量的均值〔Helmert〕。
2、控制变量交互作用的图形分析 控制变量的交互作用可以通过图形直观分析。
〔三〕多因素方差分析的进一步分析 在上述案例中,已经对广告形式、地区对销售额的影响进展了多因素方差分析,建立了饱和模型。
由分析可知:
广告形式与地区的交互作用不显著,先进一步尝试非饱和模型,并进展均值比拟分析、交互作用图形分析。
1、建立非饱和模型2、均值比拟分析3、控制变量交互作用的图形分析
协方差分析
〔一〕协方差分析根本思想 通过上述的分析可以看到,不管是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。
但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。
例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进展方差分析,显然是不全面的。
因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。
不考虑这些因素进展分析可能会导致:
即使不同的施肥量、不同品种农作物产量没有产生显著影响,但分析的结论却可能相反。
再例如,分析不同的饲料对生猪增重是否产生显著差异。
如果单纯分析饲料的作用,而不考虑生猪各自不同的身体条件〔如初始体重不同〕,那么得出的结论很可能是不准确的。
因为体重增重的幅度在一定程度上是包含诸如初始体重等其他因素的影响的。
〔二〕协方差分析的原理 协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量〔可控〕对观测变量的作用,从而更加准确地对控制因素进展评价。
协方差分析仍然沿承方差分析的根本思想,并在分析观测变量变差时,考虑了协变量的影响,人为观测变量的变动受四个方面的影响:
即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量的影响。
方差分析中的原假设是:
协变量对观测变量的线性影响是不显著的;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。
检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方比。
〔三〕协方差分析的应用举例 为研究三种不同饲料对生猪体重增加的影响,将生猪随机分成三组各喂养不同的饲料,得到体重增加的数据。
由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重的数据,作为自身身体条件的测量指标。
方差分析的应用条件为①各样本须是相互独立的随机样本;②各样本来自正态分布总体;③各总体方差相等,即方差齐性。
[1]
主要内容
分析方法
根据资料设计类型的不同,有以下两种方差分析的方法:
1、对成组设计的多个样本均值比拟,应采用完全随机设计的方差分析,即单因素方差分析。
2、对随机区组设计的多个样本均值比拟,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的异同
两类方差分析的根本步骤一样,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异〔随机误差〕,即:
SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:
SS总=SS处理+SS配伍+SS误差。
根本步骤
整个方差分析的根本步骤如下:
1、建立检验假设; H0:
多个样本总体均值相等; H1:
多个样本总体均值不相等或不全等。
检验水准为0.05。
2、计算检验统计量F值; 3、确定P值并作出推断结果。
参考资料
∙1.c:
\iknow\docshare\data\cur_work\baike.baidu\view\1449141.htm-ref_[1]_786804。
薛薇的"基于SPSS的数据分析"
扩展阅读:
wiki.mbalib./wiki/方差分析*.E6.96.B9.E5.B7.AE.E5.88.86.E6.9E.90.E7.9A.84.E5.BA.94.E7.94.A8.E6.9D.A1.E4.BB.B6
协方差分析
协方差分析〔analysisofcovariance〕
协方差是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进展统计控制的一种综合方差分析和回归分析的方法。
意义
当研究者知道有些协变量会影响因变量,却不能够控制和不感兴趣时〔当研究学习时间对学习绩效的影响,学生原来的学习根底、智力学习兴趣就是协变量〕,可以在实验处理前予以观测,然后在统计时运用协方差分析来处理。
将协变量对因变量的影响从自变量中别离出去,可以进一步提高实验准确度和统计检验灵敏度。
方差是用来度量单个变量“自身变异〞大小的总体参数,方差越大,该变量的变异越大;
协方差是用来度量两个变量之间“协同变异〞大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。
对于仅涉及单个变量的试验资料,由于其总变异仅为“自身变异〞〔如单因素完全随机设计试验资料,“自身变异〞是指由处理和随机误差所引起的变异〕,因而可以用方差分析法进展分析;
对于涉及两个变量的试验资料,由于每个变量的总变异既包含了“自身变异〞又包含了“协同变异〞〔是指由另一个变量所引起的变异〕,须采用协方差分析法来进展分析,才能得到正确结论。
方法
〔一〕回归模型的协方差分析
如果那些不能很好地进展试验控制的因素是可量测的,且又和试验结果之间存在直线回归关系,就可利用这种直线回归关系将各处理的观测值都矫正到初始条件一样时的结果,使得处理间的比拟能在一样根底上进展,而得出正确结论。
这一做法在统计上称为统计控制。
这时所进展的协方差分析是将回归分析和方差分析结合起来的一种统计分析方法,这种协方差分析称为回归模型的协方差分析。
〔二〕相关模型的协方差分析
方差分析中根据均方MS与期望均方EMS间的关系,可获得不同变异来源的方差分量估计值;在协方差分析中,根据均积MP与期望均积EMP间的关系,可获得不同变异来源的协方差分量估计值。
这种协方差分析称为相关模型的协方差分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 和协 变量 控制变量