实验设计及其统计分析.docx
- 文档编号:29004756
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:29
- 大小:42.19KB
实验设计及其统计分析.docx
《实验设计及其统计分析.docx》由会员分享,可在线阅读,更多相关《实验设计及其统计分析.docx(29页珍藏版)》请在冰豆网上搜索。
实验设计及其统计分析
成组实验设计及其统计分析
1.试验设
设试验因素A有A1,A22个水平,将全部n(n最好是偶数)个受试对象随机地均分成2组,分别接受A1,A22种处理。
再设每种处理下观测的定量指标数为k,当k=1时,属于一元分析的问题;当k≥2时,属于多元分析的问题。
在成组设计中,因2组受试对象之间未按重要的非处理因素进行两两配对,无法消除个体差异对观测结果的影响,因此,其试验效率低于配对设计。
2.前提条件与检验法的选用
在分析成组设计资料前,需考察资料是否满足下述2个前提条件:
①正态性,即各组数据应独立抽自正态总体;②方差齐性,即2组资料的总体方差应该相等。
下面根据这2个前提条件的满足情况,给出统计检验法的选用办法:
前提条件满足情况 可选用的统计检验法
①、②均满足 成组设计资料的一般t检验
①满足、②不满足 近似t检验,即t'检验;或非参数检验
①不满足 非参数检验
在后2种情形中,若资料经过某种变量变换后能满足①、②2个前提条件,则对变量变换后的数据可用成组设计资料的一般t检验来分析。
3.应用实例
(1)一元的情形
①成组设计资料的一般t检验
[例2.2.8] 随机将20只雌性中年大鼠均分为甲、乙2组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg的内毒素。
分别测得2组大鼠的肌酐(mg/L)数据,试检验2总体均数之间有无显著差别。
甲(对照)组:
6.2,3.7,5.8,2.7,3.9,6.1,6.7,7.8,3.8,6.9
乙(处理)组:
8.5,6.8,11.3,9.4,9.3,7.3,5.6,7.9,7.2,8.2
[分析与解答] 先假定此资料满足正态性这一前提条件(后面将用程序来实现)。
2总体方差的齐性检验:
H0:
σ12=σ22,H1:
σ12≠σ22,α=0.05。
用计算器实现统计计算所需的公式:
(2.2.4)
式中MS1为较大均方、MS2为较小均方,SS、df分别为离差平和及自由度。
F~F(df1,df2),拒绝域:
F≥Fα(df1,df2),则P≤α。
本例的已知条件和中间结果:
甲组:
n=10,df=9,∑X=53.6,X-=5.36,∑X2=313.26,SS=25.964,MS=2.884889
乙组:
n=10,df=9,∑X=81.5,X-=8.15,∑X2=687.17,SS=22.945,MS=2.549444
显然,甲组MS大于乙组MS,故应把甲组的有关统计量放在式(2.2.4)的分子上。
代入公式(2.2.4)计算的结果:
F=1.132
查方差齐性检验用的F临界值表,得:
F0.05(9,9)=4.03,因F
接受H0。
因本例满足方差齐性,可用下面介绍的成组设计资料的一般t检验。
成组设计资料的一般t检验:
H0:
μ1=μ2,H1:
μ1≠μ2,α=0.05。
用计算器实现统计计算所需的公式:
参见相关教材
拒绝域:
若t≥tα(df),则P≤α。
式中m代表X-1-X-2,Sm为X-1-X-2的标准误差,其计算公式如下:
参见相关教材
当n1=n2=n时,Sm化简为:
参见相关教材
本例的已知条件和中间结果:
n1=n2=10,X-1=5.36,SS1=25.964;X-2=8.15,SS2=22.945。
代入式(2.2.7),再代入式(2.2.5)计算的结果:
Sm=0.737179
t=3.7847,df=10+10-2=18
查t临界值表,得:
t0.05(18)=2.101,t0.01(18)=2.878,因t>t0.01(18),故P<0.01,接受H0。
②成组设计资料的t'检验
在上面的例子中,若资料不满足方差齐性,则可改用下面介绍的t'检验:
成组设计资料的t'检验(下面介绍两种法):
H0:
μ1=μ2,H1:
μ1≠μ2,α=0.05。
用计算器实现统计计算所需的公式:
参见相关教材
式中m代表X-1-X-2,Sm为的标准误差,其计算公式如下:
参见相关教材
这里的W1、W2就是各样本标准误差的平,当n1=n2=n时,Sm与式(2.2.7)相同。
因t'并不服从t,那么,怎样获得t'的临界值呢?
下面介绍2种法:
其一,Satterthwaite检验法,此法是用式(2.2.10)求出与t'统计量对应的近似自由度df',然后,按df'查t临界值表,得t'的临界值t'α(df'),拒绝域:
若t'≥t'α(df'),则P≤α。
参见相关教材
其二,Cochran和Cox检验法,此法是只接用式(2.2.11)求出t'的临界值t'α,拒绝域:
若t'≥t'α,则P≤α。
参见相关教材
式(2.2.11)中的t1,t2仍由t临界值表查得,它们分别
为:
t1=tα(n1-1),t2=tα(n2-1)。
此时,不知与t'对应的自由度df'的精确表达式,只知df'介入(n1-1)与(n2-1)之间。
当n1=n2=n时,与式(2.2.8)定义的t'对应的自由度df'=(n-1),并且t'α=tα(n-1)。
本例的已知条件和中间结果:
n1=n2=10,X-1=5.36,SS1=25.964;X-2=8.15,SS2=22.945,W1=0.288489,W2=0.254944。
代入式(2.2.7),再代入式(2.2.8)计算的结果:
Sm=0.737179
t'=3.7846
运用上述的检验法一,将有关统计量代入式(2.2.8)计算df',得:
df'=17.932≈18,查t
临界值表,得:
t0.01(18)=2.878,因t'>t0.01(18),故P<0.01,拒绝H0。
运用上述的检验法二,将有关统计量代入式(2.2.11)计算t'的临界值t'α,因本例n1=n2=10,故t'α=t'α(10-1),即t'0.05=t0.05(10-1)=2.262;t'0.01=t0.01(10-1)=3.250,因t'>t'0.01,故P<0.01,拒绝H0。
单因素K水平设计及其统计分析
1.试验设计
此设计仅能安排1个试验因素,按受试对象的抽取或分组的随机程度不同可细分为以下2类:
其一,完全随机设计─从符合条件的总体中完全随机地抽取所需数目的受试对象,再将全部受试对象完全随机地分配到K个组中去。
此时,受试对象与试验因素间无直接联系;
其二,组内完全随机设计─按试验因素的K个水平将全部受试对象划分成K个子总体,再分别从K个子总体中完全随机地抽取所需数目的受试对象。
此时,试验因素的各水平决定了受试对象各自应归属的组别。
上述2种情形下收集的定量资料的统计分析方法是相同的,每此只考虑1个定量指标时,可用一元方差分析或相应的非参数法,每次考虑2个及以上定量指标时,需用多元方差分析。
2.应用实例
(1)一元的情形
[例2.3.1] 为了研究轻度和重度再障贫血患者血清中可溶性CD8抗原水平(U/ml)与正常人有无显著差别,以反映患者免疫状态紊乱而导致造血功能障碍的程度。
从3种人群中分别随机地抽取了10人,测得CD8抗原水平如下,试比较3个总体均数之间有无显著差别。
正常组:
234,318,402,382,621,408,243,141, 42, 98;
轻度组:
509,518,555,758,845,712,585,448,753,896;
重度组:
851,562,918,631,653,843,659,849,762,901。
[说明] 单因素多水平资料通常用表格的形式、按列给出各组数据,采取现在的表达方式只是为了节省篇幅。
[分析与解答] H0:
μ1=μ2=μ3,H1:
μ1、μ2、μ3不等或不全相等,α=0.05。
本例属于组内完全随机设计类型。
①用计算器实现统计计算
设组数为k,第j组的例数为nj,N=∑nj,离均差平和为SS,均方为MS,自由度为df,用b,e和t分别代表“组间”、“组内或误差”和“总和”。
检验统计量F按式(2.3.1)计算。
(2.3.1)
此式中MSb与MSe的计算方法与步骤如下:
C(校正数)=(∑∑Xij)2/N =全部数据和的平方之均数;
SSt(总离均差平和)=∑∑X2ij-C=各数据平后求和减去C;
Tj(第j组数据之和)=∑Xji
SSb(组间离均差平和)=∑kj=1T2j/nj-C=各组数据和的平的均数之和减去C
SSe(组内离均差平和)=SSt-SSb
MSb(组间均方)=SSb/dfb, MSe(组内均方)=SSe/dfe
查方差分析用的F临界值表,得Fα(dfb,dfe),若F≥Fα(dfb,dfe),则P≤α,反之,则有P>α。
本例的已知条件与中间结果:
组别 n ∑X X- ∑X2 T2/n
1 10 2889 288.9 1105811 834632.1
2 10 6579 657.9 4543717 4328324.1
3 10 7629 762.9 5965515 5820164.1
合计 30 17097 … 11615043 10983120.3
计算C、SS、MS等中间结果和F统计量的值:
C=9743580.3,SSt=11615043-C=1871462.7SSb=10983120.3-C=1239540,dfb=3-1=2, SSe=SSt-SSb=631922.7,dfe=30-3=27
MSb=SSb/dfb=619770,MSe=SSe/dfe=23404.54444,F=MSb/MSe≈26.48
查方差分析用的F临界值表,发现F值明显大于F0.05(2,27)=3.35,故进一步查α=0.01所对应的F临界值,得F0.01(2,27)=5.49,因F=26.48>F0.01(2,27)=5.49,故P<0.01,拒绝H0,接受H1。
单组实验设计及其统计分析
1.与均数检验有关的单组设计
(1)试验设计
设某一指标的理论均数μ0(一般为公认值或标准值)已知,在某一特定的条件下,通过试验得到一组样本观测值Xi(i=1,2,…,n)。
问题是:
该样本所代表的总体的均数μ与理论均数μ0之间是否有显著差别?
资料处理时,可用单组设计的t检验。
设某K(K≥2)个指标在专业上有一定的联系,其理论均值向量μ0=(μ01,μ02,…,μ0k)'(一般为公认值或标准值)已知,在某一特定的条件下,通过试验得到K组(每个指标只有1组)样本观测值。
问题是:
该样本所代表的总体均值向量μ=(μ1,μ2,…,μk)'与理论均值向量μ0之间是否有显著差别?
资料处理时,可用单组设计的T2检验,在SAS软件中,凡用T2检验的场合,均用Wilks'∧检验代替,因前者是后者的特例(下同)。
(2)应用实例
①一元的情形─只有1个定量指标
[例2.2.1] 已知某水样中含CaCO3的真值为20.70mg/L,现用某法重复测定该水样11次,得其含量(mg/L)分别为:
20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00,22.00。
问用该法测CaCO3含量所得的总体均数与真值之间有无显著差别?
[分析与解答] H0:
μ=μ0,H1:
μ≠μ0,α=0.05。
用计算器实现统计计算所需的公式:
参见相关教材
式中为的标准误差,t~t(df)。
拒绝域:
若t≥tα(df),则P≤α。
本例的已知条件和中间结果:
n=11,=20.7,=21.037273,∑X=231.41,∑X2=4879.2945,S=1.051628
=0.317078。
代入公式(2.2.1)计算的结果:
t=|21.037273-20.7|/0.317078=1.064
查t临界值表,得:
t0.05(10)=2.228,因t
分割设计及其资料的统计分析
1.在配伍组设计试验之后子第2个处理因素
[例2.4.5] 为研究不同瘤株的生瘤效果和不同浓度蛇毒的抑瘤作用,有人先将48只小鼠按条件均分成3个配伍组,每个区组内的16只小鼠随机地均分成4组,分别接种4只同的瘤株,使它们生瘤,1天后再对接种同1种瘤株的4只小鼠分别腹腔注射4只同浓度的蛇毒,连续用蛇毒抑瘤10天,停药1天后解剖测瘤重,设计形式见表2.4.5。
试分位同瘤株的生瘤效果和不同浓度的蛇毒的抑瘤效果。
表2.4.5 不同瘤株与不同浓度的蛇毒共同作用后对小鼠抑瘤效果的影响
────────────────────────────────────────
区组 瘤 重(g)
───────────────────────────────────
因素 A(瘤株):
A1(S180) A2(HS) A3(EC) A4(ARS)
S (B1 B2 B3 B4)(B1B2B3B4)(B1B2B3B4)(B1 B2 B3 B4)
────────────────────────────────────────
1 0.800.360.170.28 ……………… ………………0.480.180.440.22
2 0.760.260.280.13 ……………… ………………0.570.300.270.30
3 0.360.310.160.11 ……………… ………………0.330.290.270.37
────────────────────────────────────────
注:
详细资料见下面的SAS程序。
[分析与解答] 若仅从形式上看,此设计就是含区组因素的4×4析因设计,但试验因素A(瘤株)与区组因素S先出现在试验中,在试验因素B未加入之前,实际上是1个配伍组设计,这样就形成了所谓的1级单位;1天后B因素才参入试验,B与A×B就形成了所谓的2级单位,相当于把1个完整的试验分割成前后2道工序来完成,故称之为裂区(或分割)设计。
H0:
因素A各水平下的均数相等,H1:
因素A各水平下的均值不等或不全相等,α=0.05。
对因素B和A×B也有类似假设。
交叉实验设计及其统计分析
为了更好地消除或减少重要的非处理因素的影响,常用交叉设计取代配对设计。
此设计一般只适合安排1个2水平的试验因素,2个与试验因素无交互作用的重要非处理因素。
1.试验设计
选取n(n为偶数)个受试对象,按某属性(即第1个区组因素)将受试对象配成n/2对,用随机的方法决定每对中的1个受试对象接受2种处理的先后顺序(即第2个区组因素),让该对中的另1个受试对象接受处理的顺序相反。
2种处理先后作用于同1个受试对象,并且交叉出现在各对受试对象之间,故称为交叉设计。
值得注意的是:
由于2种处理先后作用于同1个受试对象,故此设计仅限于处理的作用在短时间内就能消失的试验问题中。
否则,易造成2种处理的效应混杂。
2.应用实例
[例2.3.7] 为研究A(90402中药复方)、B(安慰剂)2种药物(处理因素)对提高高原劳动能力的影响,以条件近似的12名健康人测试,把受试对象和测定顺序Ⅰ(1992.12.18~12.24)与Ⅱ(1993.4.6~4.10)作为2个重要的非处理因素,每人都用2种药物各1次,条件最接近的每2人配成1对,用随机的方法确定每对中之一使用A、B药物的顺序,另1个人的顺序相反。
有人进行了交叉设计并收集到试验数据如下,观测指标为PWC170(即把心跳校正到每分钟170次时能做的功(kg.m)),试分析此资料。
表2.3.4 2种药物对提高高原劳动能力的试验结果
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
受试者 药物与PWC170 受试者 药物与PWC170
━━━━━━━━━━━ ━━━━━━━━━━━━
编 号 顺序:
Ⅰ Ⅱ 编 号 顺序:
Ⅰ Ⅱ
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
1 A 159.4 B 153.8 2 B 129.4 A 159.8
3 A 156.1 B . 4 B 122.1 A 137.6
... ................... ... .................
11 A 180.1 B 150.7 12 B 122.8 A .
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
注:
详细资料见[ANOVAN5.PRG];第3号与第12号两人的数据不全,不参入计算。
[分析与解答] H0:
2种药物的影响结果相同;H1:
2种药物的影响结果不同;α=0.05。
对2个区组因素─受试者、测定顺序也有类似的假设。
拉丁方设计及其统计分析
若试验中涉及到3个因素,当它们之间不存在交互作用或交互作用可以忽略不计,且各因素均取相同水平时,适合于选择拉丁方设计。
1.试验设计
假定某项研究中涉及1个试验因素,它有K个水平,同时,还需排除2个重要非处理因素的影响,研究者希望采用拉丁方设计。
于是,需选用K×K拉丁方设计格式之一作为此设计的核心部分,K×K拉丁方阵中的每一个字母代表试验因素的一个水平;让2个区组因素也各取K个水平,并把它们分别放在K×K拉丁方阵的横向和纵向上,由2个区组因素便形成了K×K种水平组合,每种水平组合下伴有试验因素的1个水平,此3个水平便构成了1个特定的试验条件,每个试验条件下做1次试验(若数据间变异很大,建议做2次以上重复试验)。
常见的正交拉丁方(同阶的任何2个拉丁方阵之间互相正交)设计格式如下,使用时可选其一。
每1个拉丁方阵具有如下的性质:
每个拉丁字母在每行及每列中只出现1次且仅容许出现1次;同阶的任何2个拉丁方阵具有如下的性质:
任何2富同符号(字母或数字)都只相遇1次。
3×3 4×4
ABC abc ABCD abcd αβγδ
BCA cab BADC cdab δγβα
CAB bca CDAB dcba βαδγ
DCBA badc γδαβ
5×5
ABCDE abcde αβγδε 12345
BCDAE cdeab δεαβγ 51234
CDEAB eabcd εαβγδ 45123
DEABC bcdea βγδεα 34512
EABCD deabc δεαβγ 23451
[说明] 同阶方阵中几个方阵分别用不同符号表示是为了便于把其中任何2个搭配起来使用(即希腊拉丁方设计),一般统计书上一律用拉丁字母A,B,…,给出。
[例2.3.8] 为研究5富同剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到鼠的种系和体重对观测指标可能有一定的影响,设计试验时,最好将这2个重要的非处理因素一并安排。
根据专业知识得知,这3个因素之间的交互作用可忽略不计,请选用合适的试验设计方案,并对所收集的定量资料进行统计分析。
表2.3.5 5富同剂量的甲状腺提取液对豚鼠甲状腺重的影响情况
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
甲状腺提取液的剂量(字母)与甲状腺重(g/200g体重)
种 系 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━
体重:
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
1 C 65 E 85 A 57 B 49 D 79
2 E 82 B 63 D 77 C 70 A 46
3 A 73 D 68 C 51 E 76 B 52
4 D 92 C 67 B 63 A 41 E 68
5 B 81 A 56 E 99 D 75 C 66
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
注:
具体剂量分别为A(273),B(308),C(319),D(391),E(410)。
[分析与解答] H0:
各剂量所对应的观测指标的总体均数相等,H1:
各剂量所对应的观测指标的总体均数不等或不全相等;α=0.05。
对种系和体重2个区组因素也有类似的假设。
[输出结果的解释] 含3个因素的方差分析模型总体上看是显著的,因F=3.94,P=0.0123;处理因素dose的作用非常显著,因F=8.01,P=0.0022;2个区组因素的作用均不显著。
[专业结论] 结合5只同剂量的均数可知,随着剂量增加,甲状腺重的均数也在增加。
配对实验设计及其统计分析
1.试验设计
在处理因素分别取2只同水平时,对同一个指标观测到2个数据,这2个数据来自同1个受试对象或来自非常相同(对重要的非处理因素而言)的2个受试对象,故可把这2个数据看作一对。
这种设计称为配对设计。
根据每对数据所对应的条件的严格与否,可将配对设计划分为以下3种:
①自身配对设计─每对数据测自同一个受试对象;
②同源配对设计─每对数据测自同一窝(或胎)的2个受试对象;
③条件相近者配对设计─每对数据测自条件(指最重要的非处理因素)相近的2个受试对象。
处理配对设计资料的思想是:
先考虑1个指标的情形,无论是采取上述3种配对设计中的哪一种形式,都可将每对中的2个数据相减(各对数据相减的顺序要一致)求愁值d,若处理的2个水平之间本质上没有差别,而且,配对的条件又十分严格,由每对数据所算得的差值d都应接近于零。
于是,我们可把d的均数看作样本均数,把零看作理论均数,问题转化为对d的总体均数与零比较的假设检验。
常用的法有配对比较的t检验或符号秩检验。
同理,可考虑多个指标的情形,最后问题转化为对差量的总体均值向量与零向量比较的假设检验。
需用T2检验,可用Wilks'∧检验代替。
2.应用实例
(1)一元的情形
[例2.2.5] 分别从10例乳癌患者化疗前和化疗后1天的尿
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验设计 及其 统计分析