正交试验方差分析报告通俗易懂.docx
- 文档编号:6422556
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:15
- 大小:364.95KB
正交试验方差分析报告通俗易懂.docx
《正交试验方差分析报告通俗易懂.docx》由会员分享,可在线阅读,更多相关《正交试验方差分析报告通俗易懂.docx(15页珍藏版)》请在冰豆网上搜索。
正交试验方差分析报告通俗易懂
第十一章正交设计试验资料的方差分析
在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法
(一)正交设计的基本概念
正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:
A因素是氮肥施用量,设A1、A2、A33个水平;
B因素是磷肥施用量,设B1、B2、B33个水平;
C因素是钾肥施用量,设C1、C2、C33个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:
用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理
表11-133试验的全面试验方案
正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。
图1中标有‘9’个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。
即:
(1)A1B1C1
(2)A1B2C2(3)A1B3C3
(4)A2B1C2(5)A2B2C3(6)A2B3C1
(7)A3B1C3(8)A3B2C1(9)A3B3C2
上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。
从图1中可以看到,9个试验点分布是均衡的,在立方体的每个平面上有且仅有3个试验点;每两个平面的交线上有且仅有1个试验点。
9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映全面试验的基本情况。
二、正交表及其特性
(一)正交表
表11-2是L8(27)正交表,其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素。
表11-2L8(27)正交表
2水平正交表还有L4(23)、L16(215)等;
3水平正交表有L9(34)、L27(313)、…、等。
(二)正交表的特性
1、任一列中,不同数字出现的次数相同
例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。
2、任两列中,同一横行所组成的数字对出现的次数相同
例如L8(27)的任两列中(1,1),(1,2),(2,1),(2,2)各出现两次;L9(34)任两列中(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)各出现1次。
即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。
用正交表安排的试验,具有均衡分散和整齐可比的特点。
均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均衡的。
由图11-1可以看出,在立方体中,任一平面内都包含3个试验点,任两平面的交线上都包含1个试验点。
整齐可比是指每一个因素的各水平间具有可比性。
因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。
如在A、B、C3个因素中,A因素的3个水平A1、A2、A3条件下各有B、C的3个不同水平,即:
在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。
所以A因素3个水平间具有可比性。
同样,B、C因素3个水平间亦具有可比性。
(三)正交表的类别
1、相同水平正交表各列中出现的最大数字相同的正交表称为相同水平正交表。
L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;
L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。
2、混合水平正交表各列中出现的最大数字不完全相同的正交表称为混合水平正交表。
L8(41×24)表中有一列最大数字为4,有4列最大数字为2。
也就是说该表可以安排1个4水平因素和4个2水平因素。
L16(44×23),L16(4×212)等都混合水平正交表。
三、正交设计方法
【例11·1】某水稻栽培试验选择了3个水稻优良品种(A):
二九矮、高二矮、窄叶青,3种密度(B):
15、20、25(万苗/666.7m2);3种施氮量(C):
3、5、8(kg/666.7m2),试采用正交设计安排一个试验方案。
(一)确定试验因素及其水平,列出因素水平表
表11-3因素水平表
(二)选用合适的正交表
根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。
选用正交表的原则是:
既要能安排下试验的全部因素(包括需要考查的交互作用),又要使部分水平组合数(处理数)尽可能地少。
一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数(包括需要考查交互作用)应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计试验误差。
若各因素及交互作用的自由度之和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差。
此例有3个3水平因素,若不考察交互作用,则各因素自由度之和为因素个数×(水平数-1)=3×(3-1)=6,小于L9(34)总自由度9-1=8,故可以选用L9(34);
若要考察交互作用,则应选用L27(313),此时所安排的试验方案实际上是全面试验方案。
(三)表头设计
表头设计就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。
在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排各因素与交互作用。
此例不考察交互作用,可将品种(A)、密度(B)和施氮量(C)依次安排在L9(34)的第1、2、3列上,第4列为空列,见表2-4。
表11-4表头设计
L9(34)表头设计
L8(27)表头设计
(四)列出试验方案
把正交表中安排因素的各列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。
表11-5正交试验方案
第二节正交试验资料的方差分析
若各号试验处理都只有一个观测值,则称之为单个观测值正交试验;
若各号试验处理都有两个或两个以上观测值,则称之为有重复观测值正交试验。
一、单个观测值正交试验资料的方差分析
对【例11-1】用L9(34)安排试验方案后,各号试验只进行一次,试验结果列于表2-6。
试对其进行方差分析。
表11-6正交试验结果计算表
Ti为各因素同一水平试验指标之和,T为9个试验号的试验指标之和;
为各因素同一水平试验指标的平均数。
该试验的9个观测值总变异由A因素、B因素、C因素及误差变异4部分组成,因而进行方差分析时平方和与自由度的分解式为:
SST=SSA+SSB+SSC+SSe
dfT=dfA+dfB+dfC+dfe
用n表示试验(处理)数;a、b、c表示A、B、C因素的水平数;ka、kb、kc表示A、B、C因素的各水平重复数。
本例,n=9、a=b=c=3、ka=kb=kc=3。
1、计算各项平方和与自由度
矫正数
C=T2/n=37112/9=1530169.00
总平方和
SST=Σx2-C
=(340.02+422.52+…+462.52)-1530169.00
=21238.00
A因素平方和
SSA=Σ
/ka-C
=(1201.52+1291.52+1218.02)/3-1530169.00
=1530.50
B因素平方和
SSB=Σ
/kb-C
=(1092.02+1278.52+1340.52)/3-1530169.00
=11153.17
C因素平方和
SSC=Σ
/kc-C
=(1142.52+1245.02+1323.52)/3-1530169.00
=5492.17
误差平方和
SSe=SST-SSA-SSB-SSC
=21238.00-1530.5-11153.17-5492.17
=3062.16
总自由度dfT=n-1=9-1=8
A因素自由度dfA=a-1=3-1=2
B因素自由度dfB=b-1=3-1=2
C因素自由度dfC=c-1=3-1=2
误差自由度dfe=dfT-dfA-dfB-dfC
=8-2-2-2=2
2、列出方差分析表,进行F检验
表11-7方差分析表
F检验结果表明,三个因素对产量的影响都不显著。
究其原因可能是本例试验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而掩盖了考察因素的显著性。
由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。
此时,可从表11-6中选择平均数大的水平A2、B3、C3组合成最优水平组合A2B3C3。
若F检验结果3个因素对试验指标的影响显著或极显著,进行各因素水平间多重比较常采用SSR法。
本例是选用相同水平正交表L9(34)安排的试验,A、B、C因素各水平重复数相同,即ka=kb=kc=3,它们的标准误相同,即
单个观测值正交试验资料的方差分析,其误差是由“空列”来估计的。
然而“空列”并不空,实际上是被未考察的交互作用所占据。
这种误差既包含试验误差,也包含交互作用,称为模型误差。
若交互作用不存在,用模型误差估计试验误差是可行的;若因素间存在交互作用,则模型误差会夸大试验误差,有可能掩盖考察因素的显著性。
试验误差应通过重复试验值来估计。
所以,进行正交试验最好能有二次以上的重复。
正交试验的重复,可采用完全随机或随机区组设计。
二、有重复观测值正交试验资料的方差分析
【例11·4】为了探讨花生锈病药剂防治效果的好坏,进行了药剂种类(A)、浓度(B)、剂量(C)3因素试验,各有3个水平,选用正交表L9(34)安排试验。
试验重复2次,随机区组设计。
正交试验方案及试验结果(产量kg/小区,小区面积133.3m2)见表11—10,对试验结果进行方差分析。
用r表示试验处理的重复数(区组数);
n,a、b、c,ka、kb、kc的意义同上。
此例r=2;n=9,a=b=c=3,ka=kb=kc=3。
表11-10防治花生锈病药剂种类、浓度、剂量正交试验方案及结果计算表
Ti为各因素同一水平试验指标之和,T为9个试验号的试验指标之和;
为各因素同一水平试验指标的平均数。
对于有重复、且重复采用随机区组设计的正交试验,总变异可以划分为处理间、区组间和误差变异三部分,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四部分。
此时,平方和与自由度分解式为:
SST=SSt+SSr+SSe2
dfT=dft+dfr+dfe2
而SSt=SSA+SSB+SSC+SSe1
dft=dfA+dfB+dfC+dfe1
于是
SST=SSA+SSB+SSC+SSr+SSe1+SSe2
dfT=dfA+dfB+dfC+dfr+dfe1+dfe2
其中:
SSr为区组间平方和;SSe1为模型误差平方和;SSe2为试验误差平方和;SSt为处理间平方和;dfr、dfe1、dfe2、dft为相应自由度。
注意,对于重复采用完全随机设计的正交试验,在平方和与自由度划分式中无SSr、dfr项。
1、计算各项平方和与自由度
矫正数
C=T2/rn=549.02/(2×9)=16744.50
总平方和
SST=Σx2-C
=28.02+35.02+…+30.02-16744.50
=246.62
区组间平方和
SSr=ΣT2r/n-C
=(273.52+275.52)/9-16744.50
=0.22
处理间平方和
SSt=ΣT2t/r-C
=(56.52+69.82+…+59.42)/2-16744.50
=245.96
A因素平方和
SSA=ΣT2A/kar-C
=(191.02+184.42+173.62)/(3×2)-16744.50
=25.72
B因素平方和
SSB=ΣT2B/kbr-C
=(191.42+169.72+187.92)/(3×2)-16744.50
=45.24
C因素平方和
SSC=ΣT2C/kcr-C
=(165.82+195.42+187.82)/(3×2)-16744.50
=78.77
模型误差平方和
SSe1=SSt–SSA–SSB-SSC
=245.96-25.72-45.24.-78.77
=96.23
试验误差平方和
SSe2=SST–SSr-SSt
=246.62-0.22-245.96
=0.44
总自由度dfT=rn-1=2×9-1=17
区组自由度dfr=r-1=2-1=1
处理自由度dft=n-1=9-1=8
A因素自由度dfA=a-1=3-1=2
B因素自由度dfB=b-1=3-1=2
C因素自由度dfC=c-1=3-1=2
模型误差自由度dfe1=dft-dfA-dfB-dfC
=8-2-2-2=2
试验误差自由度dfe2=dfT-dfr-dft=17-1-8=8
2、列出方差分析表,进行F检验
表11-10有重复观测值正交试验资料的方差分析表
首先检验MSe1与MSe2差异的显著性,若经F检验不显著,则可将其平方和与自由度分别合并,计算出合并的误差均方,进行F检验与多重比较,以提高分析的精度;若F检验显著,说明存在交互作用,二者不能合并,此时只能以MSe2进行F检验与多重比较。
本例MSe1/MSe2=802.00**,模型误差均方MSe1与试验误差均方MSe2差异极显著,说明试验因素间交互作用极显著,只能以试验误差均方MSe2进行F检验与多重比较。
F检验结果表明,药剂种类(A)、浓度(B)、剂量(C)3因素对花生产量都有极显著影响;区组间差异不显著。
3、多重比较
(1)若模型误差显著,说明试验因素间存在交互作用,各因素所在列有可能出现交互作用的混杂,此时各试验因素水平间的差异已不能真正反映因素的主效,因而进行各因素水平间的多重比较无多大实际意义,但应进行试验处理间的多重比较,以寻求最处理,即最优水平组合。
进行各试验处理间多重比较时选用试验误差均方MSe2。
模型误差显著,还应进一步试验,以分析因素间的交互作用。
(2)若模型误差不显著,说明试验因素间交互作用不显著,各因素所在列有可能未出现交互作用的混杂,此时各因素水平间的差异能真正反映因素的主效,因而进行各因素水平间的多重比较有实际意义,并从各因素水平间的多重比较中选出各因素的最优水平相组合,得到最优水平组合。
进行各因素水平间的多重比较时,用合并的误差均方
MSe=(SSe1+SSe2)/(dfe1+dfe2)
此时可不进行试验处理间的多重比较。
本例模型误差极显著,说明因素间存在交互作用,不必进行各因素水平间的多重比较,应进行试验处理间的多重比较,以寻求最处理,即最优水平组合。
为了让读者了解多重比较的方法,下面仍对各因素水平间、各试验处理间进行多重比较。
(1)A、B、C因素各水平平均数的多重比较
表11-12A因素各水平平均数的多重比较表(SSR法)
表11-13B因素各水平平均数的多重比较表(SSR法)
表11-14C因素各水平平均数的多重比较表(SSR法)
因为
由dfe=8和k=2,3,查得SSR值并计算出LSR值列于表11-15。
表11-15SSR值与LSR值表
多重比较结果表明:
A因素各水平平均产量间、B因素各水平平均产量间、C因素各水平平均产量间差异显著或极显著。
各因素的最优水平为A1、B1、C2。
注意,本例模型误差显著,试验因素间存在交互作用,不宜从各因素水平间的多重比较中选出各因素的最优水平相组合来得到最优水平组合。
(2)各试验处理平均数间的多重比较
表11-16各试验处理平均数多重比较表(LSD法)
因为
由dfe=8,查得t0.05(8)=2.306,t0.01(8)=3.355,
计算出LSD值为:
LSD0.05=t0.05(8)×=2.306×0.245=0.565
LSD0.01=t0.01(8)×=3.355×0.245=0.822
各试验处理间平均数多重比较结果,除第2号试验处理与第7号试验处理、第3号试验处理与第6号试验处理平均产量差异不显著外,其余各试验处理平均产量间差异极显著或显著,最优水平组合为第2号试验处理A1B2C2(或第7号试验处理A3B1C3)
本例模型误差显著,试验因素间存在交互作用,应以试验处理间的多重比较寻求的最优水平组合,即第2号试验处理A1B2C2(或第7号试验处理A3B1C3)为该试验的最优水平组合。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正交 试验 方差分析 报告 通俗易懂