生物统计学优秀教案5.docx
- 文档编号:25707731
- 上传时间:2023-06-11
- 格式:DOCX
- 页数:20
- 大小:166.30KB
生物统计学优秀教案5.docx
《生物统计学优秀教案5.docx》由会员分享,可在线阅读,更多相关《生物统计学优秀教案5.docx(20页珍藏版)》请在冰豆网上搜索。
生物统计学优秀教案5
生物统计学教案
第五章统计推断
教学时间:
5学时
教学方法:
课堂板书讲授
教学目的:
重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。
讲授难点:
一个、两个样本的差异显著性检验
统计假设检验:
首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。
参数估计:
通过样本统计量估计总体参数。
5.1单个样本的统计假设检验
5.1.1一般原理及两种类型的错误
例:
已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。
已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。
1、假设:
H0:
μ=μ0或H0:
μ-μ0=0
HA:
μ>μ0μ<μ0μ≠μ0三种情况中的一种。
本例的μ0=10.00g,因此
H0:
μ=10.00
HA:
μ>10.00或μ<10.00或μ≠10.00
2、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。
从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数
服从N(0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即P(U>u),P(U<-u),以及P(|U|>u)的概率。
如果得到的值很小,则
抽自平均数为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。
显著性检验:
根据小概率原理建立起来的检验方法。
显著性水平:
拒绝零假设时的概率值,记为α。
通常采用α=0.05和α=0.01两个水平,当P<0.05时称为差异显著,P<0.01时称为差异极显著。
3、临界值
例从上述动物群体中抽出含量n=10的样本,计算出
=10.23g,并已知该批动物的总体平均数μ绝不会小于10.00g,规定的显著水平α=0.05。
根据以上条件进行统计推断。
H0:
μ=10.00HA:
μ>10.00
根据备择假设,为了得到
落在上侧尾区的概率P(U>u),将
标准化,求出u值。
P(U>1.82)=0.03438,P<0.05,拒绝H0,接受HA。
在实际应用中,并不直接求出概率值,而是建立在α水平上H0的拒绝域。
从正态分布上侧临界值表中查出P(U>uα)=α时的uα值,U>uα的区域称为在α水平上的H0拒绝域,而U
接受域的端点一般称为临界值。
本例的u=1.82,从附表3可以查出u0.05=1.645,u>uα,落在拒绝域内,拒绝H0而接受HA。
4、单侧检验和双侧检验
上尾单侧检验:
上例中的HA:
μ>μ0,相应的拒绝域为U>uα。
对应于HA:
μ>μ0时的检验称为上尾单侧检验。
下尾单侧检验:
对应于HA:
μ<μ0时的检验称为下尾单侧检验。
其拒绝域为U<-uα。
双侧检验:
对应于HA:
μ≠μ0时的检验称为双侧检验。
双侧检验的拒绝域为|U|>uα/2。
5、单侧检验和双侧检验的效率:
在样本含量和显著水平相同的情况下,单侧检验的效率高于双侧检验。
这是因为在做单侧检验
利用了已知有一侧是不可能这一条件,从而提高了它的辨别力。
所以,在可能的条件下尽量做单侧检验。
例上例已经计算出u=1.82,上尾单侧检验的临界值u9,0.05=1.645,u>uα,结论是拒绝零假设。
在做双侧检验时u仍然等于1.82,双侧检验的临界值为u9,0.05/2=1.96,|u| 6、两种类型的错误 (1)I型错误,犯I型错误的概率记为α α=P(I型错误)=P(拒绝H0|H0是正确的,μ=μ0) (2)II型错误,犯II型错误的概率记为β βμ1=P(II型错误)=P(接受H0|H0是错误的,μ=μ1) 例继续上例,抽出n=10的样本, =10.20g,检验假设 H0: μ=10.00gHA: μ>10.00g 标准化的样本平均数 临界值u0.05=1.645,u 结论是不能拒绝H0。 以样本平均数表示的临界值,可由下式得出 在下图中 的位置已用竖线标出。 犯I型错误的概率α,由竖线右侧μ0=10.00曲线下面积给出。 犯II型错误的概率由竖线左侧μ1=10.30曲线下面积给出。 犯II型错误的概率β10.30=0.2327。 从上图中可以看出 (1)当μ1越接近μ0时,犯II型错误的概率越大。 (2)降低犯I型错误的概率,必然增加犯II型错误的概率。 (3)为了同时降低犯两种错误的概率,必须增加样本含量。 7、关于两个概念的说明: (1)当P<α时,所得结论的正确表述应为: 由样本平均数推断出的总体平均数μ与μ0之间的差异有统计学意义。 即它们属于两个不同总体。 习惯上称为“差异是显著的”。 (2)接受H0的更严密的说法应是: 尚无足够理由拒绝H0。 但习惯上采用接受H0和拒绝H0这种表达方法。 5.1.2单个样本显著性检验的程序(略) 5.1.3在σ已知的情况下,单个平均数的显著性检验-u检验 检验程序如下: 1、假设从σ已知的正态或近似正态总体中抽出含量为n的样本。 2、零假设H0: μ=μ0 备择假设HA: ①μ>μ0 ②μ<μ0 ③μ≠μ0 3、显著性水平在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量 5、相应于2中各备择假设之H0的拒绝域 ①u>uα ②u<-uα ③|u|>uα/2 6、得出结论并给予解释 例已知豌豆籽粒重量服从正态分布N(377.2,3.32)在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量? 解①σ已知 ②假设: H0: μ=377.2 HA: μ>377.2 ③显著性水平: α=0.05 ④σ已知,使用u检验 ⑤H0的拒绝域: 因HA: μ>μ0,故为上尾检验,当u>u0.05时拒绝H0。 u0.05=1.645。 ⑥结论: u>u0.05,即P<0.05,所以拒绝零假设。 栽培条件的改善,显著地提高了豌豆籽粒重量。 5.1.4σ未知时平均数的显著性检验-t检验 检验程序如下: 1、假设从σ未知的正态或近似正态总体中抽出含量为n的样本。 2、零假设: H0: μ=μ0 备择假设: HA: ①μ>μ0 ②μ<μ0 ③μ≠μ0 3、显著性水平: 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量: 当σ未知时以s代替之,标准化的变量称为t,服从n-1自由度的t分布。 t分布的临界值可从附表4中查出。 5、相应于2中各备择假设之H0的拒绝域: ①t>tα ②t<-tα ③|t|>tα/2 6、得出结论并给予解释。 例已知玉米单交种群单105的平均穗重μ0=300g。 喷洒植物生长促进剂后,随机抽取9个果穗,其穗重为: 308、305、311、298、315、300、321、294、320g。 问喷药后与喷药前的果穗重差异是否显著? 解①σ未知 ②假设: H0: μ=300 HA: μ≠300 激素类药物需有适当的浓度,浓度适合时促进生长,浓度过高时反而抑制生长,在这里喷药的效果是未知的,并非仅能促进生长,需采用双侧检验 ③显著性水平: α=0.05 ④σ未知应使用t检验,已计算出 =308,s=9.62 ⑤H0的拒绝域: 因HA: μ≠μ0,故为双侧检验,当|t|>t0.025时拒绝H0。 t0.025=2.306。 ⑥结论: 因|t|>t0.025,即P<0.05,所以拒绝零假设。 喷药前后果穗重的差异是显著的。 若规定α=0.01,t0.01/2=3.355,t 5.1.5变异性的显著性检验-χ2检验 χ2检验的基本程序如下: 1、假设从正态总体中随机抽取含量为n的样本,计算出样本s2。 2、零假设: H0: σ=σ0 备择假设: HA: ①σ>σ0 ②σ<σ0 ③σ≠σ0 3、显著性水平: 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量: 统计量χ2服从n–1自由度的χ2分布。 5、相应于2中各备择假设之H0的拒绝域: ①χ2>χ2α ②χ2<χ21-α ③χ2<χ21-α/2和χ2>χ2α/2 6、得出结论并给予解释。 例一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽出10株,它们的株高为: 90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐? 解 ①μ未知,对未知总体的方差做检验 ②假设: H0: σ=14cm0 HA: σ<σ0 小麦经提纯后株高只能变得更整齐,因而使用下侧检验。 ③显著性水平: 在α=0.01水平上做检验 ④检验统计量: ⑤相应于备择假设HA: σ<σ0之H0的拒绝域为χ2<χ21-α,从附表6中可以查出χ20.99=2.09 ⑥结论: 因χ2<χ20.99,即P<0.01,所以拒绝H0。 结论是植株经提纯后变得非常整齐。 5.2两个样本的差异显著性检验 问题的提出(P78) 5.2.1两个方差的检验-F检验 F检验的基本程序如下: 1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,分别计算出s12和s22。 与总体平均数μi无关。 2、零假设: H0: σ1=σ2 备择假设: HA: ①σ1>σ2 ②σ1<σ2 ③σ1≠σ2 3、显著性水平: 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量: 在抽样分布一章中已经给出F的定义 在零假设σ1=σ2下,统计量F变为 5、相应于2中各备择假设之H0的拒绝域: ①相应于HA: σ1>σ2,应做上尾单侧检验,当F>Fα时拒绝H0。 ②相应于HA: σ1<σ2,应做下尾单侧检验,当F 一种变通的办法是把s2中较大者称为s12,这时只会用上侧检验,处理起来更方便些,对于结果无影响。 ③相应于HA: σ1≠σ2,应做双侧检验,当F>Fα/2和F 6、得出结论并给予解释。 例测定了20位青年男子和20位老年男子的血压值,问老年人血压值个体间的波动是否显著高于青年人? (数据略)P80 解1 ①人类血压值是服从正态分布的随机变量。 ②假设: H0: σ1=σ2 HA: σ1<σ2 老年人的血压值在个体之间的波动,只会大于青年人,决不会小于青年人。 ③显著性水平: 规定α=0.05 ④检验统计量: 先计算出s12=193.4,s22=937.7 ⑤建立H0的拒绝域: 根据备择假设,应为下侧检验,当F 下侧临界值 ⑥结论: F 结论是拒绝H0,老年人血压值在个体之间的波动大于年青人。 解2若以s2中较大者作为分子,备择假设则变为HA: σ2>σ1,成为上尾检验,所用的检验统计量为: 在查临界值时应注意,现在df2是分子,df1是分母。 F0.05=2.18,F>F0.05,P<0.05,结论仍然是拒绝H0。 5.2.2标准差(σi)已知时,两个平均数间差异显著性的检验 检验程序如下: 1、从σ1和σ2已知的正态或近似正态总体中抽出含量分别为n1和n2 的样本。 2、零假设H0: μ1=μ2 备择假设HA: ①μ1>μ2 ②μ1<μ2 ③μ1≠μ2 3、显著性水平在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量 在σi已知时两平均数差的标准化变量 在H0: μ1=μ2下,检验统计量为: 上式的分母称为平均数差的标准误差,记为 5、相应于2中各备择假设之H0的拒绝域 ①u>uα ②u<-uα ③|u|>uα/2 6、得出结论并给予解释 例调查两个不同渔场的马面鲀体长,每一渔场调查20条。 平均体长分别为: =19.8cm, =18.5cm。 σ1=σ2=7.2cm。 问在α=0.05水平上,第一号渔场的马面鲀是否显著高于第二号渔场的马面鲀体长? 解 ①马面鲀体长是服从正态分布的随机变量,σ1和σ2已知。 ②假设: H0: μ1=μ2 HA: μ1>μ2 ③显著性水平: 已规定为α=0.05 ④统计量的值: ⑤建立H0的拒绝域: 上尾单侧检验,当u>u0.05时拒绝H0。 从表中查出u0.05=1.645. ⑥结论: u 5.2.3标准差(σi)未知但相等时两平均数间差异显著性检验-成组数据t检验 I.方差齐性检验: 使用双侧F检验。 1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2 的两个随机样本,分别计算出s12和s22。 2、零假设: H0: σ1=σ2 备择假设: HA: σ1≠σ2 3、显著性水平: α=0.05 4、检验统计量: 5、建立H0的拒绝域: 对于方差齐性应做双侧检验,当F>Fα/2和F 6、得出结论判断方差是否相等。 II.平均数差异显著性检验 1、从σ1和σ2未知的正态或近似正态总体中抽出含量分别为n1和n2 的样本。 2、零假设: H0: μ1=μ2 备择假设: HA: ①μ1>μ2 ②μ1<μ2 ③μ1≠μ2 3、显著性水平: 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量: 在标准差未知时,平均数差的标准化变量在抽样分布一章中已经给出。 在H0: μ1=μ2下,检验统计量为: 服从n1-1+n2-1自由度的t分布。 在n1=n2=n时,上式可简化为: 在n1和n2都很大时,n1-1≈n1,n2-1≈n2,上式又可简化为: 5、相应于2中各备择假设之H0的拒绝域: ①t>tα ②t<-tα ③|t|>tα/2 6、得出结论并给予解释。 例两个小麦品种从播种到抽穗所需天数如下表,问两者所需的天数差异是否显著? 品种1品种2 X1X1′=X1-100X1′2X2X2′=X2-100X2′2 1011110000 1000098-24 99-1110000 99-1199-11 98-2498-24 1000099-11 98-2498-24 99-1198-24 99-1199-11 99-1110000 和-814-1119 平均数99.298.9 解 I.方差齐性检验: 使用双侧F检验。 ①小麦生长天数是服从正态分布的随机变量。 ②假设: H0: σ1=σ2 HA: σ1≠σ2 ③显著性水平: α=0.05 ④检验统计量: ⑤建立H0的拒绝域: F9,9,0.025=4.026,F9,9,0.975=0.248 ⑥结论: F0.975 方差具齐性。 II.平均数差异显著性检验 ①小麦生长天数是服从正态分布的随机变量。 ②假设: H0: μ1=μ2 HA: μ1≠μ2 ③显著性水平: α=0.05 ④检验统计量: ⑤建立H0的拒绝域: 本例为双侧检验,当|t|>tα/2时拒绝H0,从附表4中查出t18,0.025=2.10。 ⑥结论: t 两个小麦品种从播种到抽穗所需天数差异不显著。 例两种激素类药物对肾组织切片氧消耗的影响,结果为: (1)n1=9,x1=27.92,s12=8.673; (2)n2=6,x2=25.11,s22=1.843。 问两种药物对肾组织切片养消耗的影响差异是否显著? 解I.方差齐性检验 H0: σ1=σ2HA: σ1≠σ2α=0.05 F 可以接受σ1=σ2的假设。 II.平均数间差异显著性检验 H0: μ1=μ2HA: μ1≠μ2α=0.05 t0.025=2.160,t>t0.025,即P<0.05。 结论是: 在α=0.05水平上,两种药物对肾组织切片氧消耗的影响刚刚达到显著。 5.2.4标准差(σi)未知且可能不等时,两平均数间差异显著性检验(略) 5.2.5配对数据的显著性检验-配对数据t检验 例下表为不同组合的杂种F1籽粒蛋白质含量 父本西地迈罗A(a)矬巴子1A(b)d=(a)-(b)d2 玛纳斯红8.4787.9940.4840.234 红菲特瑞他7.5127.1410.3710.138 忻粱77.2228.267–1.0451.092 平罗娃娃头8.0538.280–0.2270.052 平顶冠7.6896.7400.9490.901 洋大粒8.5287.6320.8960.803 忻粱526.9725.9131.0591.121 东海红公鸡7.7318.169–0.7980.637 板农15.7607.570–1.8103.276 歪脖黄7.9307.5690.3610.131 千斤红7.2556.3220.9330.870 忻粱716.7956.4170.3780.143 总计1.5119.397 1、高粱蛋白质含量是服从正态分布的随机变量;配对数据。 2、零假设: H0: 备择假设: HA: ① ② ③ 3、显著性水平: 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量: 标准化变量t 在零假设μd=0下,上式变为 t服从n-1自由度的t分布,其中的n为数据的对子数。 5、相应于2中各备择假设之H0的拒绝域: ①t>tα ②t<-tα ③|t|>tα/2 6、得出结论并给予解释。 上例的推断如下: H0: μd=0HA: μd≠0α=0.05 t11,0.025=2.201,|t| 5.2.6-5.2.9(略)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 优秀 教案