第七章方差分析.docx
- 文档编号:6105301
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:21
- 大小:238.11KB
第七章方差分析.docx
《第七章方差分析.docx》由会员分享,可在线阅读,更多相关《第七章方差分析.docx(21页珍藏版)》请在冰豆网上搜索。
第七章方差分析
第七章 方差分析
[本章提要]本章要紧通过对实验结果进行分析,辨别其各有关因素对实验结果阻碍的实例,介绍了单因素方差分析和双因素重复实验方差分析的大体方式与应用,最后简单讨论了双因素无重复实验的方差分析。
在科学实验和生产实践中,阻碍一事物的因素往往是很多的。
例如,在化工生产中,有原料成份、原料剂量、催化剂、反映温度、压力、溶液浓度、反映时刻、机械设备及操作人员水平等因素。
每一因素的改变都有可能阻碍产品的数量和质量,有的因素阻碍大些,有的小些。
为了使生产进程稳固,达到优质、高产、低消耗、高效益,就需要找出对产品质量阻碍显著的那些因素。
方差分析确实是辨别各因素效应的一种有效方式,它被普遍地应用于生产实践中。
在试验中,将要考察的指标称为试验指标。
影响试验指标的条件称为因素。
因素所处的状态,称为该因素的水平。
如果在一项试验中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验。
相应的方差分析称为单因素试验的方差分析和多因素试验的方差分析。
在方差分析方面,Excel2000提供的分析工具有:
单因素方差分析、双因素重复试验方差分析和双因素不重复试验方差分析。
本章将通过实例,分别说明这三种方差分析的基本理论以及如何使用Excel2000提供的方差分析工具来解决实际问题。
单因素方差分析
例如,将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。
下表列出了5种经常使用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。
现需要在显著性水平
=下查验这些百分比的均值有无显著的不同。
设各整体服从正态散布,且方差相同。
青霉素
四环素
链霉素
红霉素
氯霉素
在那个地址,实验的指标是抗生素与血浆蛋白质结合的百分比,抗生素为因素,不同的5种抗生素确实是那个因素的五个不同的水平。
假定除抗生素这一因素外,其余的一切条件都相同。
这确实是单因素实验。
实验的目的是要考察这些抗生素与血浆蛋白质结合的百分比的均值有无显著的不同。
即考察抗生素这一因素对这些百分比有无显著阻碍。
这确实是一个典型的单因素实验的方差分析问题。
单因素方差分析的大体理论
与通常的统计推断问题一样,方差分析的任务也是先依如实际情形提出原假设H0与备择假设H1,然后寻觅适当的查验统计量进行假设查验。
本节将借用上面的实例来讨论单因素实验的方差分析问题。
1.提出假设
在上例中,因素A(即抗生素)有s(=5)个水平
,在每一个水平
(j=1,2,…,s)下进行了
=4次独立实验,取得如上表所示的结果。
这些结果是一个随机变量。
表中的数据能够看成来自s个不同整体(每一个水平对应一个整体)的样本值,将各个整体的均值依次记为
,那么按题意需查验假设
:
:
不全相等
为了便于讨论,现在引入总平均
其中
再引入水平
的效应
显然有
,
表示水平
下的整体平均值与总平均的不同。
利用这些记号,本例的假设就等价于假设
:
:
不全为零
因此,单因素方差分析的任务就是检验s个总体的均值
是不是相等,也就等价于查验各水平
的效应
是不是都等于零。
2.查验所需的统计量
假设各整体服从正态散布,且方差相同,即假定各个水平
(j=1,2,…,s)下的样本
来自正态整体
,
与
未知,且设不同水平
下的样本之间彼此独立,那么单因素方差分析所需的查验统计量能够从总平方和的分解导出来。
下面先引入:
水平
下的样本平均值
数据的总平均
总平方和
总平方和
反映了全数实验数据之间的不同,因此
又称为总变差。
将其分解为
其中
上述
的各项
表示了在水平
下,样本观看值与样本均值的不同,这是由随机误差所引发的,因此
叫做误差平方和。
的各项
表示了在水平
下的样本平均值与数据总平均的不同,这是由水平
和随机误差所引发的,因此
叫做因素A的效应平方和。
可以证明
与
彼此独立,且当
:
为真时,
与
别离服从自由度为
的
散布,即
于是,当
:
为真时
这确实是单因素方差分析所需的服从F散布的查验统计量。
3.假设查验的拒绝域
通过上面的分析可得,在显著性水平
下,本查验问题的拒绝域为
为了方便分析比较,通常将上述分析结果编排成如下表所示的方差分析表。
表中的
,
别离称为
的均方。
方差来源
平方和
自由度
均方
F比
因素A
误 差
总 和
单因素方差分析的大体操作
从上面的分析能够看出,若是用手工完成单因素实验方差分析,需要进行大量的计算。
借助于Excel2000的单因素方差分析工具,能够方便地自动完成。
具体操作步骤如下:
选择工具菜单中的数据分析命令,现在弹出数据分析对话框。
在分析工具列表框中,选方差分析:
单因素方差分析工具。
这时将弹出方差分析:
单因素方差分析对话框,如图7-1中间所示。
图7-1
在输入框中指定输入参数。
在输入区域框中指定实验数据所在区域A1:
E5;在分组方式当选定列单项选择钮;选中标志位于第一行复选框;在
框内输入显著性水平。
在输出选项框内指定输出选项。
本例选定输出区域,并键入输出区域左上角单元格地址A7。
单击确信按钮。
即可得到单因素方差分析的结果,如图7-2所示。
在图7-2给出的统计结果中,单元格区域A18:
E23中的数据正好与表7-1所列出的单因素试验方差分析表中的各个统计量相对应,其中组间即为因素A,组内即为误差,共计即为总和,不同源即为方差来源,SS即为平方和,df即为自由度,MS即为均方,F即为F比,P-value为同意原假设
的概率(此值越接近0,说明同意原假设的可能性就越小,反之亦然),Fcrit为拒绝域的临界值
。
根据图7-2给出的方差分析结果知
=>
=,故在显著性水平下拒绝原假设
,以为各抗生素与血浆蛋白质结合的百分比的均值有显著的不同,即各抗生素对这些百分比有显著阻碍。
图7-2
双因素方差分析
若是在一项实验中只有两个因素在改变,而其他因素维持不变,那么称为双因素实验。
双因素实验的方差分析确实是观看两个因素的不同水平对研究对象的阻碍是不是有显著性的不同。
依照是不是考虑两个因素的交互作用,又将双因素方差分析分为双因素重复实验的方差分析和双因素不重复实验的方差分析。
重复实验的方差分析
例如,在生产某种金属材料时,利用了四种原料、三种热处置温度。
关于每种原料与每种热处置温度的组合各生产两次,产品强度的测定结果如图7-3所示。
问原料、处置温度和这二者的交互作用对产品强度是不是有显著的阻碍(取显著性水平
=)?
图7-3
在这里,试验的指标是产品强度,原料和处理温度是因素,它们分别有4个、3个水平,这是一个双因素的试验。
试验的目的是要考察在各种因素的各个水平下产品强度有无显著的差异。
即考察原料和处理温度这两个因素对产品强度有无显著影响。
这就是一个双因素重复试验方差分析问题。
在这种方差分析中,除了考虑两个因素A、B各水平的效应之外,还要考虑A、B各水平的搭配作用即交互作用。
也就是说,本例既要考虑不同的原料、不同的处理温度是否对产品强度有显著影响,还要考虑原料和处理温度这两因素各方案的配合对产品强度是否有影响作用。
1.大体理论
在本例中,有两个因素A(即原料)、B(即处置温度)作用于实验的指标(即产品强度)。
行因素A有r(=4)个水平
,列因素B有s(=3)个水平
。
现对因素A、B的水平的每对组合(
)进行了t(=2,要求t≥2)次实验(称为等重复实验),共取得24(
)个实验值
,i=1,2,…,r,j=1,2,…,s,k=1,2,…,t,如图7-3所示。
假设
,且各
彼此独立,其中
均为未知参数。
①提出假设
与单因素方差分析类似,先引入水平
的效应
,水平
的效应
,和水平
与水平
的交互效应
(这是由
,
搭配起来联合作用而引发的),那么双因素重复实验的方差分析问题确实是查验假设:
行因素A的检验(即检验因素A的每个水平
的效应
是不是都等于零)
:
:
至少有一个
不为零
列因素B的检验(即检验因素B的每个水平
的效应
是不是都等于零)
:
:
至少有一个
不为零
因素A、B交互作用I=A×B的检验(即检验因素A与因素B搭配的每对组合(
)的效应
是不是都等于零)
:
:
至少有一个
不为零
②查验统计量
与单因素方差分析类似,双因素方差分析所需的查验统计量也是从总平方和的分解导出来的。
下面先引入
再引入总平方和
总平方和
反映了全数实验数据之间的不同,将其分解为
其中
误差平方和
因素A的效应平方和
因素B的效应平方和
因素A、B的交互效应平方和
能够证明
,
,
,
,
别离服从自由度为
,
,
,
,
的
散布,且彼此独立。
当
:
为真时,能够证明
类似地,当
,
为真时
这确实是双因素方差分析所需的F查验统计量。
③假设查验的拒绝域
在显著性水平
下,假设查验的拒绝域别离为
,拒绝因素A的原假设
,拒绝因素B的原假设
,拒绝因素A、B交互作用I的原假设
将上述分析结果汇总成如下表所示的方差分析表。
方差来源
平方和
自由度
均方
F比
因素A
因素B
交互作用I
误差
总和
2.大体操作
下面利用Excel2000提供的方差分析:
可重复双因素分析工具求解本例。
具体操作步骤如下:
选择工具菜单中的数据分析命令,现在弹出数据分析对话框。
在分析工具列表框中,选方差分析:
可重复双因素分析工具。
这时弹出方差分析:
可重复的双因素分析对话框,如图7-4所示。
图7-4
在输入框中指定输入参数。
在输入区域框中指定实验数据所在区域A1:
D9(一样为了使输出结果容易阅读明白得,在原始数据区域中应包括标识行和列的标记信息);在每一样本的行数中键入2(因本例的每种原料有两行数据,即对因素A、B的水平的每对组合进行了t=2次实验);在
框内输入显著性水平为。
在输出选项框内指定输出选项。
本例选定输出区域,并键入输出区域左上角单元格地址A11。
单击确信按钮。
所得本例的方差分析结果如图7-5所示。
图7-5
在图7-5给出的统计结果中,单元格区域A46:
E52中的数据正好与表7-2所示的双因素重复试验方差分析表中的各个统计量相对应,其中样本即为行因素A,列即为列因素B,交互即为因素A与B的交互作用,内部即为误差,共计即为总和,不同源即为方差来源,SS即为平方和,df即为自由度,MS即为均方,F即为F比,P-value为同意原假设
的概率,Fcrit为拒绝域的临界值
。
根据图7-5给出的方差分析结果可知:
原料因素
=>
=,拒绝原假设
温度因素
=>
=,拒绝原假设
两因素的交互作用
=>
=,拒绝原假设
因此,能够得出如此的结论:
在显著性水平下,原料和处置温度这两个因素对产品强度的阻碍都是显著的,且
=远大于
=,故二者的交互作用效应是高度显著的。
再比较图7-6中的求和或平均项能够看出,
与
或
与
的搭配都使得产品强度较之其他水平的搭配要高得多。
因此在实际中能够选最优的搭配方案
与
或
与
来生产这种金属材料。
再如,某林场对果树采用了不同的剪枝方案和施肥方案进行试验(如图7-7所示),观察剪枝和施肥对果树的产量是否有显著影响?
两者的交互作用是否显著?
在这里,试验的指标是果树产量,剪枝和施肥是因素,它们分别有3个、4个水平,这也是一个双因素的试验。
试验的目的是要考察在各种因素的各个水平下果树产量有无显著的差异。
即既要考虑不同的剪枝方案、不同的施肥方案是否对果树产量有显著影响,还要考虑剪枝和施肥两因素各方案的配合对果树产量是否有影响作用。
图7-6
图7-7利用Excel2000提供的方差分析:
可重复双因素分析工具,取显著性水平
=,得方差分析结果如图7-8所示。
分析图7-8中的结果可知:
剪枝因素
=>
=,拒绝原假设
施肥因素
=>
=,拒绝原假设
两因素的交互作用
=<
=,同意原假设
图7-8
因此,可以得出这样的结论:
在显著性水平下,剪枝和施肥都对果树产量有显著的影响,但两者的配合对果树产量无显著作用,即剪枝和施肥间无交互作用。
无重复实验的方差分析
在上节的讨论中,考虑了双因素实验中两个因素的交互作用。
为要查验交互作用的效应是不是显著,关于两个因素的每一组合(
)至少要做2次实验,不然就不能将交互作用与误差分离开来。
但如果是在处置实际问题时,已经明白不存在交互作用,或已知交互作用对实验的指标阻碍很小,那么能够不考虑交互作用。
现在,即便k=1,也能对因素A、因素B的效应进行分析。
因此关于两个因素的每一组合(
)只做一次实验即可,故称为双因素无重复实验,相应的方差分析称为双因素无重复实验的方差分析。
对于上节观察剪枝和施肥对果树的产量是否有显著影响的例子,通过分析结果知:
剪枝和施肥这两个因素的配合对果树产量无显著作用,也就是说剪枝和施肥间无交互作用。
对此就可以不考虑交互作用,对于两个因素的每一组合(
)只做一次实验,即进行双因素无重复实验就能够够了。
现假设两个因素的无重复试验结果如下表所示。
因素B
因素A
B1
B2
…
Bs
A1
x11
x12
…
x1s
A2
x21
x22
…
x2s
…
…
…
…
…
Ar
xr1
xr2
…
xrs
再设
,各
彼此独立,其中
均为未知参数。
那么双因素无重复实验的方差分析只需要查验以下两个假设:
行因素A的检验(即检验因素A的每个水平
的效应
是不是都等于零)
:
:
至少有一个
不为零
列因素B的检验(即检验因素B的每个水平
的效应
是不是都等于零)
:
:
至少有一个
不为零
通过与双因素重复试验的方差分析中的同样讨论,可得双因素无重复试验的方差分析表,如下表所示。
方差来源
平方和
自由度
均方
F比
因素A
因素B
误差
总和
取显著性水平为
,可得假设
:
的拒绝域为
假设
:
的拒绝域为
通过本章内容的学习,应把握Excel2000的单因素方差分析和双因素重复实验方差分析工具,并能熟练地运用于实际工作中。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 方差分析