i第八章单因素方差分析.docx
- 文档编号:6787929
- 上传时间:2023-01-10
- 格式:DOCX
- 页数:32
- 大小:759.88KB
i第八章单因素方差分析.docx
《i第八章单因素方差分析.docx》由会员分享,可在线阅读,更多相关《i第八章单因素方差分析.docx(32页珍藏版)》请在冰豆网上搜索。
i第八章单因素方差分析
幻灯片1
【例】调查了5个不同小麦品系的株高,结果如下。
试判定这5个品系的株高是不是存在显著性不同。
5个小麦品系株高(cm)调查结果
株号
品系
Ⅰ
Ⅱ
Ⅲ
Ⅳ
Ⅴ
1
2
3
4
5
和
平均数
64.6
65.3
64.8
66.0
65.8
326.5
65.3
64.5
65.3
64.6
63.7
63.9
322.0
64.4
67.8
66.3
67.1
66.8
68.5
336.5
67.3
71.8
72.1
70.0
69.1
71.0
354.0
70.8
69.2
68.2
69.8
68.3
67.5
343.0
68.6
幻灯片2
第八章单因素方差分析
One-factoranalysisofvariance
幻灯片3
本章内容
第一节方差分析简述
第二节固定效应模型
第三节随机效应模型
第四节多重比较
第五节方差分析应具有的条件
幻灯片4
第一节方差分析简述
一、方差分析的一样概念
一、概念
方差分析(analysisofvariance,ANOVA):
是同时判定多组数据平均数之间不同显著性的统计假设查验,是两组数据平均数不同显著性t查验的延伸。
幻灯片5
单因素方差分析(一种方式分组的方差分析):
研究对象只包括一个因素(factor)的方差分析。
单因素实验:
实验只涉及一个因素,该因素有a个水平(处置),每一个水平有n次实验重复,如此的实验称为单因素实验。
水平(level):
每一个因素不同的处置(treatment)。
幻灯片6
方差分析
AnalysisofVariance(ANOVA)
幻灯片7
【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的诞生重,结果如下。
判定不同窝的动物诞生重是不是存在显著性不同。
4窝动物的诞生重单位:
g
幻灯片8
二、单因素方差分析的数据格式:
幻灯片9
二、不同处置效应与不同模型
一、方差分析中每一观测值的描述
——线性统计模型
yij:
在第i水平下的第j次观测值;
μ:
总平均数,是对所有观测值的一个参数;
αi:
处置效应,是仅限于对第i次处置的一个参数;
εij:
随机误差成份。
幻灯片10
二、①固定效应:
由固定因素所引发的效应。
②固定因素:
所研究因素各个水平是通过特意选择的,如此的因素称为固定因素。
固定因素的水平能够严格地人为操纵,在水平固定以后,它的效应值也是固定的。
③固定模型:
处置固定因素所用的模型。
幻灯片11
3、①随机效应:
由随机因素所引发的效应。
②随机因素:
所研究因素各个水平是从该因素水平整体中随机抽出的,如此的因素称为随机因素。
随机因素的水平是不能严格人为操纵的,在水平确信以后,它的效应值并非固定。
③随机模型:
处置随机因素所用的模型。
幻灯片12
第二节固定效应模型
一、线性统计模型
要查验a个处置效应的相等性,就要判定各αi是不是为0。
H0:
α1=α2=……=αa=0
HA:
αi≠0(至少有1个i)
假设同意H0,那么不存在处置效应,每一个观测值是由总平均数加上随机误差组成;
假设拒绝H0,那么存在处置效应,每一个观测值是由总平均数、处置效应及误差三部份组成。
幻灯片13
●总变异是测量值yij与总的均数间的不同。
●处置间变异是由处置效应引发的变异。
●处置内变异是由随机误差引发的变异。
用离均差平方和的平均(均方、方差)反映变异的大小
幻灯片14
二、平方和与自由度的分解
1.总平方和(totalsumofsquares,SST):
每一个测量值与总平均数离差的平方和的总和,反映了一组数据总的变异程度。
计算公式为:
dfT=N-1=an-1
校正项(校正系数,correction):
幻灯片15
2.处置间平方和(sumofsquaresamongtreatments,SSA):
各个处置组的平均数与总平均数离差的平方和,SSA反映了遍地理组均数的变异程度。
计算公式为:
dfA=a-1
(含有误差成份)
处置均方(treatmentmeansquare,MSA):
处置间平方和除以自由度。
幻灯片16
3.在同一处置组内尽管每一个受试对象同意的处置相同,但观测值仍各不相同,这是由随机因素(误差)引发的。
误差平方和(errorsumofsquares,SSe)或称处置内平方和(sumofsquareswithintreatment):
遍地理内部观测值与相应处置平均数离差的平方和,SSe反映了遍地理组内观测值的变异程度。
计算公式为:
dfe=dfT-dfA=an-a
误差均方(errormeansquare,MSe):
误差平方和除以误差自由度。
MSe反映了随机因素所造成的
方差的大小。
幻灯片17
三种变异之间的关系
SST=SSA+SSe
dfT=dfA+dfe
处置内变异:
随机误差
处置间变异:
处置因素+随机误差
幻灯片18
One-FactorANOVA
PartitionsofTotalVariation
=
+
●Commonlyreferredtoas:
●SumofSquaresWithin,or
●SumofSquaresError,or
●WithinGroupsVariation
●Commonlyreferredtoas:
●SumofSquaresAmong,or
●SumofSquaresBetween,or
●SumofSquaresModel,or
●AmongGroupsVariation
幻灯片19
均方差,均方(meansquare,MS)
幻灯片20
三、查验统计量F
,
做F单侧上尾查验
当F α1=α2=……=αa=0,遍地理平均数之间不同不显著,以为MSA与MSe不同不大,产生的变异是由随机误差造成的; 当F>Fα时,拒绝零假设,处置平均数间不同显著,MSA显著高于MSe,产生的变异是由处置因素造成的。 幻灯片21 F值与F散布 , 幻灯片22 四、方差分析表 单因素固定效应模型方差分析表 F 均方 自由度 平方和 变差来源 处置间 MSA/MSe MSA a-1 SSA a(n-1) MSe 误差或处置内 SSe na-1 SST 总和 幻灯片23 五、方差分析的指导思想与大体原理 方差分析的指导思想: 是将所有测量值间的总变异依照其变异的来源分解为多个部份,然后进行比较,评判由某种因素所引发的变异是不是具有统计学意义。 幻灯片24 方差分析的大体原理: 将总平方和分解为处置平方和和误差平方和,依照相应的自由度,取得相应的均方; 处置均方反映处置因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小; 处置均方除以误差均方反映处置效应的显著性。 幻灯片25 六、单因素方差分析与成组数据t查验的异同 单因素方差分析 成组数据t查验 相同 平均数不同显著性查验 平均数不同显著性查验 两个平均数不同的查验 多个平均数不同的分析 不同 利用平均数的差 利用平均数的方差 计算统计量t 计算统计量F 幻灯片26 七、实例 【例8.1】调查了5个不同小麦品系的株高,结果如下。 试判定这5个品系的株高是不是存在显著性不同。 5个小麦品系株高(cm)调查结果 株号 品系 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 1 2 3 4 5 和 平均数 64.6 65.3 64.8 66.0 65.8 326.5 65.3 64.5 65.3 64.6 63.7 63.9 322.0 64.4 67.8 66.3 67.1 66.8 68.5 336.5 67.3 71.8 72.1 70.0 69.1 71.0 354.0 70.8 69.2 68.2 69.8 68.3 67.5 343.0 68.6 幻灯片27 解: ①列出方差分析计算表: (编码法-65) 序号 品系 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 1 2 3 4 5 -0.4 0.3 -0.2 1.0 0.8 1.5 2.25 1.93 -0.5 0.3 -0.4 -1.3 -1.1 -3.0 9.00 3.4 2.8 1.3 2.1 1.8 3.5 11.5 132.25 29.43 6.8 7.1 5.0 4.1 6.0 29.0 841.00 174.46 4.2 3.2 4.8 3.3 2.5 18.0 324.00 68.06 总和 57.0 1308.50 277.28 ②利用公式计算各项平方和: 幻灯片28 ③列出方差分析表: 不同小麦品系株高方差分析表 F 均方 自由度 平方和 变差来源 42.23 32.94 0.78 4 20 131.74 15.58 品系间 误差 ﹡﹡ 24 147.32 总和 ﹡α=0.05 ﹡﹡α=0.01 F4,20,0.05=2.866 F4,20,0.01=4.431 F>F0.01 ④结论: 选定的5个不同小麦品系的株高不同极显著。 幻灯片29 下结论 注意: 当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t查验结果等价,对同一资料,有: 幻灯片30 第三节随机效应模型 一、随机效应模型的方差分析 一、方差分析的程序与固定效应模型方差分析的程序一样。 二、随机效应模型方差分析所得结论适用于水平的整体,固定效应模型方差分析所得结论只适用于所选定的a个水平。 幻灯片31 二、实例 【例8.2】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的诞生重,结果如下。 判定不同窝的动物诞生重是不是存在显著性不同。 4窝动物的诞生重单位: g 幻灯片32 解: ①列出方差分析计算表(-30): ②计算各项平方和: 幻灯片33 ③列出方差分析表: 动物诞生重方差分析表 F3,12,0.05=3.49 F ④结论: 不同窝别动物的诞生重没有显著不同。 幻灯片34 三、不等重复时平方和和自由度的计算 幻灯片35 第四节平均值之间的多重比较 同意H0(F 等,不同没有统计学意义。 ——方差分析终止 拒绝H0,同意HA(F>Fα),表示遍地理组均数 不全相等,不同有统计学意义。 哪两均数之间不同显著? 哪两均数之间不同不显著? ——需要进一步做多重比较 幻灯片36 多重比较(multiplecomparison): 通过方差分析,假设结论是遍地理均数不同显著(F>Fα,拒绝H0),那么必需在遍地理均数之间一对一对地做比较,以判定究竟在哪些对均数之间存在显著不同,哪些对之间没有显著不同,这种比较称为多重比较。 幻灯片37 积存Ⅰ类错误的概率为α’ 当有k个均数需作两两比较时,比较的次数共有c==k! /(2! (k-2)! )=k(k-1)/2 设每次查验所用Ⅰ类错误的概率水准为α,积存Ⅰ类错误的概率为α’,那么在对同一实验资料进行c次查验时,在样本彼此独立的条件下,依照概率乘法原理,其积存Ⅰ类错误概率α’与c有以下关系: α’=1-(1-α)c(8.6) 例如,设α=0.05,c=3(即k=3),其积存Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3=0.143 幻灯片38 一、最小显著差数(LeastSignificantDifference,LSD)法 一、最小显著差数法: 把任意两组数据平均数差的绝对值与LSD 比较,以判定不同组数据平均数不同显著性的多重比较方式。 二、LSD的公式推导: 成组数据t查验 当n1=n2 幻灯片39 3、LSD查验程序: ①计算LSD ②列表计算每一对平均数差的绝对值|dx|; ③|dy|>与LSD比较,得出结论。 当|dy|>LSD时, 该对平均数不同显著;不然不同不显著。 幻灯片40 二、Duncan多范围查验 Duncanmultiplerangetest 一、Duncan多范围查验程序: ①将需要比较的a个平均数依照从大到小的顺序从头排列。 ②计算每一对平均数间的差(大值-小值),列成表。 幻灯片41 ③计算临界值Rk,列表。 不同对平均数的差有不同的临界值Rk。 rα(k,df)的值由附表9(多重比较中的Duncan表)查出。 df=a(n-1),是误差项自由度。 k=2,3,…,a k是相较较的两个平均数间包括的平均数的个数(包括这两个平均数),计算公式是两平均数下标的差加上1。 有a个平均数,有a-1个k值,需查出a-1个rα,别离乘以Sy,取得a-1个Rk值。 幻灯片42 ④比较每一对平均数差与相应的Rk, 得出结论。 假设平均数差大于相应的Rk,说明这一对平均数之间不同显著或极显著,以符号“﹡”或“﹡﹡”表示; 假设平均数差小于相应的Rk,说明这一对平均数之间不同不显著。 幻灯片43 二、实例 【例8.1】调查了5个小麦品系的株高,结果如下。 经方差分析判定这5个品系的株高存在显著性不同,试做多重比较分析。 5个小麦品系株高(cm)调查结果 株号 品系 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 1 2 3 4 5 和 平均数 64.6 65.3 64.8 66.0 65.8 326.5 65.3 64.5 65.3 64.6 63.7 63.9 322.0 64.4 67.8 66.3 67.1 66.8 68.5 336.5 67.3 71.8 72.1 70.0 69.1 71.0 354.0 70.8 69.2 68.2 69.8 68.3 67.5 343.0 68.6 幻灯片44 解: ①排序: 品系号 Ⅳ Ⅴ Ⅲ Ⅰ Ⅱ 平均数 排序号 70.8 1 68.6 2 67.3 3 65.3 4 64.4 5 ②求差: 5 4 3 2 1 2 3 4 6.4 4.2 2.9 0.9 5.5 3.3 2.0 3.5 1.3 2.2 ﹡﹡ ﹡﹡ ﹡﹡ ﹡﹡ ﹡﹡ ﹡﹡ ﹡ ﹡﹡ ﹡﹡ ③列表计算Rk: 1.588 1.667 1.710 1.738 4.02 4.22 4.33 4.40 1.165 1.225 1.256 1.284 2.95 3.10 3.18 3.25 ④结论: 品系Ⅰ和Ⅱ间株高不同不显著,品系Ⅲ和Ⅴ间株高不同显著,其余各品系间株高不同极显著。 幻灯片45 二、SNK法 SNK(student-Newman-Keuls)法又称q查验,是依照q值的抽样散布作出统计推论(例8-1)。 1.将各组的平均值按由大到小的顺序排列: 顺序 (1) (2)(3)(4) 平均值28.018.718.514.8 原组号BCAD 2.计算两个平均值之间的差值及组间跨度k,见表8-3第 (2)、(3)两列。 3.计算统计量q值 4.依照计算的q值及查附表6取得的q界值(p286),作出统计推断。 幻灯片46 幻灯片47 Bonferroni法的适用性 当比较次数不多时,Bonferroni法的成效较好。 但当比较次数较多(例如在10次以上)时,那么由于其查验水准选择得太低,结论偏于保守。 幻灯片48 三、Tukey法 幻灯片49 第五节方差分析应具有的条件 一、方差分析应知足的三个条件 一、可加性: 每一个处置效应和误差效应 是可加的; 二、正态性: 实验误差应当是服从正态 散布的独立随机变量; 3、方差齐性: 遍地理的误差方差应具 备齐性。 幻灯片50 二、多个方差齐性查验 ——Bartlett查验 一、Bartlett查验大体原理: 当a个随机样本是从独立正态整体中抽取时,能够计算出统计量K2。 当n=minni充分大时(n>3),K2的抽样散布超级接近于a-1自由度的x2散布。 幻灯片51 二、Bartlett查验程序: ①假设: H0: σ12=σ22=……=σa2 HA: 至少有两个σi2不相等 ②计算查验统计量K2 当遍地理样本含量相同时 ③结论: 当K2>x2a-1,α时拒绝零假设,方差不齐,应做数据变换;不然,同意零假设,方差具有齐性。 幻灯片52 3、变换 ①平方根变换 将每一个观测值取其平方根,做方差齐性查验,假设方差整齐,然后对平方根进行方差分析。 属于泊松散布的数据,常常需要采取平方根变换;当观测数值很小时,如有几个数小于10时,为了矫正,能够利用观测值加上1再取平方根的变换。 幻灯片53 ②平方根终归弦变换 取每一个观测值平方根的终归弦值,然后做方差分析。 适用于以百分数表示的二项散布数据。 ⑴百分数的转变范围专门大时,要利用终归弦变换,变换后的数据能够从附表10中查出;⑵百分数的转变范围在0%~20%,用平方根变换;⑶百分数的转变范围在80%~100%,先用100减去各百分数,然后做平方根变换;⑷百分数的转变范围在30%~70%,能够不做变换。 幻灯片54 ③对数变换 取每一个观测值对数值,然后做方差分析。 ⑴大范围的正整数适用于对数变换;⑵关于一些小的数值,如小于10时,每一观测值都加上1再变换。 幻灯片55 三、方差分析总程序: 一、多个方差齐性查验——Bartlett查验 当K2>x2a-1,α时,方差不齐,应做数据变换;不然,方差具有齐性,能够进入方差分析程序。 二、方差分析 ①列出方差分析计算表(编码法) ②利用公式计算各项平方和 F ③列出方差分析表 ④结论 3、Duncan多范围查验 ①排序 ②求差 ③计算Rk ④结论 4、得出结论,给予生物学说明 幻灯片56 第四节方差分析的假定条件和数据转换 一、方差分析的假定条件(上述条件与两均数比较的t查验的应用条件相同。 ) 1.遍地理组样本来自随机、独立的正态整体(D法、W法、卡方查验); 2.遍地理组样本的整体方差相等(不等会增加I型错误的概率,阻碍方差分析结果的判定) 二、方差齐性查验 1.Bartlett查验法 2.Levene等 3.最大方差与最小方差之比<3,初步以为方差齐同。 幻灯片57 1.Bartlett查验法 幻灯片58 2.Levene查验法 将原样本观看值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其查验结果用于判定方差是不是齐性。 因为levene查验对原数据是不是为正态不灵敏,因此比较稳健。 目前均推荐采纳LEVENE方差齐性查验 幻灯片59 ●三、数据变换 ●改善数据的正态性或方差齐性。 使之知足方差分析的假定条件。 ●平方根终归弦变换——适用于二项散布率(比例)数据。 ●平方根变换——适用于泊松散布的计数资料 ●对数变换——适用于对数正态散布资料 幻灯片60 第五节完全随机设计方式简介 将120名高血脂患者完全随机分成4个例数相等的组 1.编号: 120名高血脂患者从1开始到120,见下面表第1行; 2.取随机数字: 从附表15中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见下面表的第2行; 幻灯片61 3.排序: 按随机数字从小到大(数据相同那么按前后顺序)编序号,见下面表的第3行。 4.事前规定: 序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见下面表的第4行。 幻灯片62 作业: 习题第二、3题。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 因素 方差分析