生物统计学课件001.docx
- 文档编号:23359251
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:19
- 大小:72.43KB
生物统计学课件001.docx
《生物统计学课件001.docx》由会员分享,可在线阅读,更多相关《生物统计学课件001.docx(19页珍藏版)》请在冰豆网上搜索。
生物统计学课件001
第一章绪论—科学试验及其误差控制
第一节科学研究与科学试验
一、农业和生物学领域的科学研究
科学研究是人类认识自然、改造自然、服务社会的原动力。
农业和生物学领域的科学研究推动了人们认识生物界的各种规律,促进人们发掘出新的农业技术和措施,从而不断提高农业生产水平,改进人类生存环境。
自然科学中有二大类科学,一类是理论科学,一类是实验科学。
理论科学研究主要运用推理,包括演绎和归纳的方法。
实验科学研究主要通过周密设计的实验来探新。
农业和生物学领域中与植物生产有关的专业包括农学、园艺、草业、植物保护、生物技术、农业资源与环境等,所涉及的学科大多数是实验科学。
这些领域中科学实验的方法主要有二类,一类是抽样调查,另一类是科学试验。
生物界千差万别,变化万端,要准确地描述自然,通常必须通过抽样的方法,使所做的描述具有代表性。
同理,要准确地获得试验结果,必须严格控制试验条件,使所比较的对象间尽可能少受干扰而能把差异突出地显示出来。
二、科学研究的基本过程和方法
(一)科学研究的基本过程
科学研究的目的在于探求新的知识、理论、方法、技术和产品。
基础性或应用基础性研究在于揭示新的知识、理论和方法;应用性研究则在于获得某种新的技术或产品。
在农业科学领域中不论是基础性研究还是应用性研究,基本过程均包括3个环节:
(1)根据本人的观察(了解)或前人的观察(通过文献)对所研究的命题形成一种认识或假说;
(2)根据假说所涉及的内容安排相斥性的试验或抽样调查;(3)根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论逐步发展、深化。
(二)科学研究的基本方法
1.选题科学研究的基本要求是探新、创新。
研究课题的选择决定了该项研究创新的潜在可能性。
优秀的科学研究人员主要在于选题时的明智,而不仅仅在于解决问题的能力。
最有效的研究是去开拓前人还未涉及过的领域。
不论理论性研究还是应用性研究,选题时必须明确其意义或重要性,理论性研究着重看所选课题在未来学科发展上的重要性,而应用性研究则着重看其对未来生产发展的作用和潜力。
科学研究不同于平常一般的工作,它需要进行独创性的思维。
因此要求所选的课题使研究者具有强烈的兴趣,促进研究者心理状态保持十分敏感。
反之若所选的课题并不激发研究者的兴趣,那么这项研究是难以获得新颖的见解和成果的。
有些课题是资助者设定的,这时研究者必须认真体会它的确实意义并激发出对该项研究的热情和信心。
2.文献科学的发展是累积性的,每一项研究都是在前人建筑的大厦顶层上添砖加瓦,这就首先要登上顶层,然后才能增建新的层次,文献便是把研究工作者推到顶层,掌握大厦总体结构的通道。
选题要有文献的依据,设计研究内容和方法更需文献的启示。
查阅文献可以少走弯路,所花费的时间将远远能为因避免重复、避免弯路所节省的时间所补偿,绝对不要吝啬查阅文献的时间和功夫。
科学文献随着时代的发展越来越丰富。
百科全书是最普通的资料来源,它对于进入一个新领域的最初了解是极为有用的。
文献索引是帮助科学研究人员进入某一特定领域作广泛了解的重要工具。
专业书籍可为所进入的领域提供一个基础性的了解。
评论性杂志可使科学研究人员了解有关领域里已取得的主要成绩。
文摘可帮助研究人员查找特定领域研究的结论性内容,使之跟上现代科学前进的步伐。
科学期刊和杂志登载最新研究的论文,它介绍一项研究的目的、材料、方法以及由试验资料推论到结果的全过程,优秀的科学论文,可给人们以研究思路和方法上的启迪。
各个有实力的研究机构都十分重视图书、期刊、文献的搜集,图书馆是研究人员工作的一个关键场所。
现代通信和网络技术的发展,使一些期刊、杂志通过网络为研究人员提供服务,今后计算机及网络系统将可能是文献探索的主要工具。
3.假说在提出一项课题时,对所研究的对象总有一些初步的了解,有些来自以往观察的累积,有些来自文献的分析。
因而围绕研究对象和预期结果之间的关系,研究者常已有某种见解或想法,即已构成了某种假说,而须通过进一步的研究来证实或修改已有的假说。
一项研究的目的和预期结果总是和假说相关联的,没有形成假说的研究,常常是含糊的、目的性不甚明确的。
即便最简单的研究,例如进行若干个外地品种与当地品种的比较试验,实际上有其假说,即“某地引入种可能优于当地对照种”,只不过说这类研究的假说比较简单而已。
简单的假说只是某些现象的概括;复杂的假说则要进一步假定出各现象之间的联系,这种联系可能是平行的,也可能是因果的,复杂的假说中甚至还可能包含类推关系。
假说只是一种尝试性的设想,即对于所研究对象的试探性概括,在它没有被证实之前,决不能与真理、定律混为一谈。
科学的基本方法之一是归纳,从大量现象中归纳出真谛;演绎是科学的另一基本方法,当构思出一个符合客观事实的假说时,可据此推演出更广泛的结论。
这中间形式逻辑是必要的演绎工具。
自然科学研究人员应自觉地训练并用好归纳、演绎以及形式逻辑的方法。
4.假说的检验假说有时也表示为假设。
在许多研究中假设是简单的,它们的推论也很明确。
对假说进行检验,可以重新对研究对象进行观察,更多的情况是进行实验或试验,这是直接的检验。
有时也可对假说的推理安排试验进行验证,这是一种间接的检验,验证了所有可能的推理的正确性,也就验证了所做的假说本身,当然这种间接的检验要十分小心,防止漏洞。
5.试验的规划与设计围绕检验假说而开展的试验,需要全面、仔细地规划与设计。
试验所涉及的范围要覆盖假说涉及的各个方面,以便对待检验的假说可以作出无遗漏的判断。
比较是科学研究中常用的方法,有比较才有鉴别。
农业和生物学领域的研究中常常采用比较试验的方法,从比较中确定出最确凿的理论、方法和技术。
比较研究中十分重要的是选定恰当的比较标准。
比较试验中比较的对象不一定只有两个,可以是一组对象间的比较。
这组比较的对象是按假说的内涵选定的,称为一组处理。
这一组处理可能是某一因子(因素)量的不同级别或质的不同状态(水平),也可能是不同因子(因素)的不同级别(或状态)的组合,全部处理规定了整个研究的内容和范围,称为试验方案,这是狭义的理解。
广义的试验方案是指包括实施步骤在内的整个试验计划。
确定试验方案是试验规划与设计的核心部分。
如上所述,试验方案中必须明确比较的标准或对照处理。
农业和生物学的试验中十分重视试验结果的代表性和重演性,从而可以明确研究结果的适用范围和稳定程度。
因而要求试验材料和试验的环境条件有代表性。
这是因为作为试验材料的生物体是存在遗传分化的,作为应用试验结果的地点是有地理、季节、土壤等环境差异的。
设计一项试验时必须考虑到试验材料和试验环境的代表性和典型性。
农业和生物学试验中供试的一组处理间的差异是在一定的试验条件下在供试材料身上体现出来的,因而要确切暴露出处理间或供试因子、级别间的差异,必须严格控制供试材料及试验条件的一致性;在多个因子的试验时还要将所比较的那个因子以外的因子控制在相同的水平上。
这是比较试验的“唯一差异”原则。
供试的生物体、试验条件除了因系统的原因有变异外,还有许多偶然因素所致的变异。
试验研究应严格排除这种系统性的变异。
剩下的偶然性波动确实是不能完全控制的。
一个试验中试验结果(数据)包含了这种偶然性波动,要正确地从试验数据提取结论必须与试验的偶然性波动相比较,只有证实试验表现出来的效应显然不是偶然性波动所致,才能合乎逻辑地作出正确的结论。
因而在设计试验时必须考虑到可以确切估计出排除了系统误差的试验效应和试验的偶然性误差,从而在两者的比较中引出关于试验对象的结论。
农业和生物学的试验中常将排除系统误差和控制偶然误差的试验设置称为试验设计,这是狭义的理解,广义的理解则是指整个研究工作的设计。
第二节试验方案
一、试验因素与水平
如上节所述,试验方案是根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。
农业与生物学研究中,不论农作物还是微生物,其生长、发育以及最终所表现的产量受多种因素的影响,其中有些属自然的因素,如光、温、湿、气、土、病、虫等,有些是属于栽培条件的,如肥料、水分、生长素、农药、除草剂等。
进行科学试验时,必须在固定大多数因素的条件下才能研究一个或几个因素的作用,从变动这一个或几个因子的不同处理中比较鉴别出最佳的一个或几个处理。
这里被固定的因子在全试验中保持一致,组成了相对一致的试验条件;被变动并设有待比较的一组处理的因子称为试验因素,简称因素或因子(factor),试验因素的量的不同级别或质的不同状态称为水平(level)。
试验因素水平可以是定性的,如供试的不同品种,具有质的区别,称为质量水平;也可以是定量的,如喷施生长素的不同浓度,具有量的差异,称为数量水平。
数量水平不同级别间的差异可以等间距,也可以不等间距。
所以试验方案是由试验因素与其相应的水平组成的,其中包括有比较的标准水平。
试验方案按其供试因子数的多少可以区分为以下3类:
(1)单因素试验(single-factorexperiment)单因素试验是指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。
这是一种最基本的、最简单的试验方案。
例如在育种试验中,将新育成的若干品种与原有品种进行比较以测定其改良的程度,此时,品种是试验的唯一因素,各育成品种与原有品种即为各个处理水平,在试验过程中,除品种不同外,其它环境条件和栽培管理措施都应严格控制一致。
又例如为了明确某一品种的耐肥程度,施肥量就是试验因素,试验中的处理水平就是几种不同的施肥量,品种及其它栽培管理措施都相同。
(2)多因素试验(multiple-factororfactorialexperiment)多因素试验是指在同一试验方案中包含2个或2个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。
各因素不同水平的组合称为处理组合(treatmentcombination)。
处理组合数是各供试因素水平数的乘积。
这种试验的目的一般在于明确各试验因素的相对重要性和相互作用,并从中评选出1个或几个最优处理组合。
如进行甲、乙、丙3个品种与高、中、低3种施肥量的2因素试验,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3×3=9个处理组合。
这样的试验,除了可以明确2个试验因素分别的作用外,还可以检测出3个品种对各种施肥量是否有不同反应并从中选出最优处理组合。
生物体生长受到许多因素的综合作用,采用多因素试验,有利于探究并明确对生物体生长有关的几个因素的效应及其相互作用,能够较全面地说明问题。
多因素试验的效率常高于单因素试验。
(3)综合性试验(comprehensiveexperiment)这也是一种多因素试验,但与上述多因素试验不同。
综合性试验中各因素的各水平不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。
这种试验方案的目的在于探讨一系列供试因素某些处理组合的综合作用,而不在于检测因素的单独效应和相互作用。
单因素试验和多因素试验常是分析性的试验;综合性试验则是在对于起主导作用的那些因素及其相互关系已基本清楚的基础上设置的试验。
它的处理组合就是一系列经过实践初步证实的优良水平的配套。
例如选择一种或几种适合当地条件的综合性丰产技术作为试验处理与当地常规技术作比较,从中选出较优的综合性处理。
二、试验指标与效应
用于衡量试验效果的指示性状称试验指标(experimentalindicator)。
一个试验中可以选用单指标,也可以选用多指标,这由专业知识对试验的要求确定。
例如农作物品种比较试验中,衡量品种的优劣、适用或不适用,围绕育种目标需要考察生育期(早熟性)、丰产性、抗病性、抗虫性、耐逆性等多种指标。
当然一般田间试验中最主要的常常是产量这个指标。
各种专业领域的研究对象不同,试验指标各异。
例如研究杀虫剂的作用时,试验指标不仅要看防治后植物受害程度的反应,还要看昆虫群体及其生育对杀虫剂的反应。
在设计试验时要合理地选用试验指标,它决定了观测记载的工作量。
过简则难以全面准确地评价试验结果,功亏一篑;过繁琐又增加许多不必要的浪费。
试验指标较多时还要分清主次,以便抓住主要方面。
试验因素对试验指标所起的增加或减少的作用称为试验效应(experimentaleffect)。
例如,某水稻品种施肥量试验,每亩施氮10kg,亩产量为350kg,每亩施氮15kg,亩产量为450kg;则在每亩施氮10kg的基础上增施5kg的效应即为450-350=100(kg/亩)。
这一试验属单因素试验,在同一因素内两种水平间试验指标的相差属简单效应(simpleeffect)。
在多因素试验中,不但可以了解各供试因素的简单效应,还可以了解各因素的平均效应和因素间的交互作用。
表1.1为某豆科植物施用氮(N)、磷(P)的2×2=4种处理组合(N1P1,N1P2,N2P1,N2P2)试验结果的假定数据,用以说明各种效应。
(1)一个因素的水平相同,另一因素不同水平间的产量差异仍属简单效应。
如表1.1Ⅱ中18-10=8就是同一N1水平时P2与P1间的简单效应;28-16=12为在同一N2水平时P2与P1间的简单效应;16-10=6为同一P1水平时N2与N1间的简单效应;28-18=10为同一P2水平时N2与N1间的简单效应。
(2)一个因素内各简单效应的平均数称平均效应,亦称主要效应(maineffect),简称主效。
如表1.1Ⅱ中N的主效为(6+10)/2=8,这个值也是二个氮肥水平平均数的差数,即22-14=8;P的主效为(8+12)/2=10,也是二个磷肥水平平均数的差数,即23-13=10。
(3)两个因素简单效应间的平均差异称为交互作用效应(interactioneffect),简称互作。
它反映一个因素的各水平在另一因素的不同水平中反应不一致的现象。
将表1.1以图1.1表示,可以明确看到,Ⅰ中的二直线平行,反应一致,表现没有互作。
交互作用的具体计算为(8-8)/2=0,或(6-6)/2=0。
图1.1Ⅱ中P2-P1在N2时比在N1时增产幅度大,直线上升快,表现有互作,交互作用为(12-8)/2=2,或为(10-6)/2=2,这种互作称为正互作。
图1.1Ⅲ和Ⅳ中,P2-P1在N2时比在N1时增产幅度表现减少或大大减产,直线上升缓慢,甚至下落成交叉状,这是有负互作。
Ⅲ中的交互作用为(4-8)/2=-2,Ⅳ中为(-2-8)/2=-5。
表1.12×2试验数据(解释各种效应)
试验
因素
N
Ⅰ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
24
21
6
平均
14
20
6
P2-P1
8
8
8
0,0/2=0
Ⅱ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
28
23
10
平均
14
22
8
P2-P1
8
12
10
4,4/2=2
Ⅲ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
20
19
2
平均
14
18
4
P2-P1
8
4
6
-4,-4/2=-2
Ⅳ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
14
16
-4
平均
14
15
1
P2-P1
8
-2
3
-10,-10/2=-5
因素间的交互作用只有在多因素试验中才能反映出来。
互作显著与否关系到主效的实用性。
若交互作用不显著,则各因素的效应可以累加,主效就代表了各个简单效应。
在正互作时,从各因素的最佳水平推论最优组合,估计值要偏低些,但仍有应用价值。
若为负互作,则根据互作的大小程度而有不同情况。
Ⅲ中由单增施氮(N2P1)及单增施磷(N1P2)来估计氮、磷肥皆增施(N2P2)的效果会估计过高,但N2P2还是最优组合,还有一定的应用价值。
而Ⅳ中N2P2反而减产,如从各因素的最佳水平推论最优组合将得出错误的结论。
Ⅰ
Ⅱ
Ⅲ
Ⅳ
图1.12×2试验的图示(解释交互作用)
两个因素间的互作称为一级互作(firstorderinteraction)。
一级互作易于理解,实际意义明确。
三个因素间的互作称二级互作(secondorderinteraction),余类推。
二级以上的高级互作较难理解,实际意义不大,一般不予考察。
三、制订试验方案的要点
拟订一个正确有效的试验方案,以下几方面供参考:
1.拟订试验方案前应通过回顾以往研究的进展、调查交流、文献探索等明确试验的目的,形成对所研究主题及其外延的设想,使待拟订的试验方案能针对主题确切而有效地解决问题。
2.根据试验目的确定供试因素及其水平。
供试因素一般不宜过多,应该抓住1~2个或少数几个主要因素解决关键性问题。
每因素的水平数目也不宜过多,且各水平间距要适当,使各水平能有明确区分,并把最佳水平范围包括在内。
例如通过喷施矮壮素以控制某种植物生长,其浓度试验设置50、100、150、200、250ppm等5个水平,其间距为50ppm。
若间距缩小至10ppm便须增加许多处理,若处理数不多,参试浓度的范围窄,会遗漏最佳水平范围,而且由于水平间差距过小,其效应因受误差干扰而不易有规律性地显示出来。
如果涉及试验因素多,一时难以取舍,或者对各因素最佳水平的可能范围难以作出估计,这时可以将试验分为两阶段进行,即先做单因素的预备试验,通过拉大幅度进行初步观察,然后根据预备试验结果再精细选取因素和水平进行正规试验。
预备试验常采用较多的处理数,较少或不设重复;正规试验则精选因素和水平,设置较多的重复。
为不使试验规模过大而失控,试验方案原则上应力求简单,单因素试验可解决的就不一定采用多因素试验。
3.试验方案中应包括有对照水平或处理,简称对照(check,符号CK)。
品种比较试验中常统一规定同一生态区域内使用的标准(对照)种,以便作为各试验单位共同的比较标准。
4.试验方案中应注意比较间的唯一差异原则,以便正确地解析出试验因素的效应。
例如根外喷施磷肥的试验方案中如果设喷磷(A)与不喷磷(B)两个处理,则两者间的差异含有磷的作用,也有水的作用,这时磷和水的作用混杂在一起解析不出来,若加进喷水(C)的处理,则磷和水的作用可分别从A与C及B与C的比较中解析出来,因而可进一步明确磷和水的相对重要性。
5.拟订试验方案时必须正确处理试验因素及试验条件间的关系。
一个试验中只有供试因素的水平在变动,其他因素都保持一致,固定在某一个水平上。
根据交互作用的概念,在一种条件下某试验因子的最优水平,换了一种条件,便可能不再是最优水平,反之亦然。
这在品种试验中最明显。
例如在生产上大面积推广的扬麦1号小麦品种、农垦58号水稻品种,在品比试验甚至区域试验阶段都没有显示出它们突出的优越性,而是在生产上应用后,倒过来使主管部门重新认识其潜力而得到广泛推广的。
这说明在某种试验条件下限制了其潜力的表现,而在另一种试验条件下则激发了其潜力的表现。
因而在拟订试验方案时必须做好试验条件的安排,绝对不要以为强调了试验条件的一致性就可以获得正确的试验结果。
例如品种比较试验时要安排好密度、肥料水平等一系列试验条件,使之具有代表性和典型性。
由于单因子试验时试验条件必然有局限性,可以考虑将某些与试验因素可能有互作(特别负互作)的条件作为试验因素一起进行多因素试验,或者同一单因素试验在多种条件下分别进行试验。
6.多因素试验提供了比单因素试验更多的效应估计,具有单因素试验无可比拟的优越性。
但当试验因素增多时,处理组合数迅速增加,要对全部处理组合进行全面试验(称全面实施)规模过大,往往难以实施,因而以往多因素试验的应用常受到限制。
解决这一难题的方法就是利用本书后文将介绍的正交试验法,通过抽取部分处理组合(称部分实施)用以代表全部处理组合以缩小试验规模。
这种方法牺牲了高级交互作用效应的估计,但仍能估计出因素的简单效应、主要效应和低级交互作用效应,因而促进了多因素试验的应用。
第三节试验误差及其控制
一、试验数据的误差和精确性
通过试验的观察或测定,获得试验数据,这是推论试验结果的依据。
然而研究工作者获得的试验数据往往是含有误差的。
例如测定一个大豆品种南农88-48的蛋白质含量,取一个样品(specimen)测得结果为42.35%,再取一个样品测得结果为41.98%,两者是同一品种的豆粒,理论上应相等,但实际不等,如果再继续取样品测定,所获的数据均可能各不相等,这表明实验数据确有误差。
通常将每次所取样品测定的结果称为一个观察值(observation),以y表示。
理论上这批大豆种子的蛋白质含量有一个理论值或真值,以
表示,则
,即观察值=真值+误差,每一观察值都有一误差
,可正,可负,
。
若上述大豆种子是在冷库中保存的,另有一部分是在常温下保存的,也取样品测定其蛋白质含量,其结果为41.20%,40.80%,…,同样每一观察值均包含有误差。
但比较冷库的种子和常温的种子,在常温条件下长期保存后,其蛋白质含量有所降低。
照理两者都是同一品种、同一田块里收获来的种子,其蛋白质含量应相同。
但实际不同,有误差,这种误差是能追溯其原因的。
因而对同一块田里同一品种种子蛋白质含量的测定,观察值间存在变异,这种变异可归结为两种情况,一种是完全偶然性的,找不出确切原因的,称为偶然性误差(spontaneouserror)或随机误差(randomerror);另一种是有一定原因的称为偏差(bias)或系统误差(systematicerror)。
若以上例中冷库保存的大豆种子为比较的标准,其种子蛋白质含量的观察值可表示为:
在常温下保存的大豆种子蛋白质含量的观察值可表示为:
式中,
代表南农88-48大豆品种蛋白质含量的真值(理论值),
、
分别为每一样品观察值的随机误差,
则为室温保存下(可能由于呼吸作用)导致的偏差或系统误差。
两种保存方法下蛋白质含量的差数
包含了系统偏差和随机误差两个部分。
abcd
图1.2由打靶图示试验的准确性与精确性
试验数据的优劣是相对于试验误差而言的。
系统误差使数据偏离了其理论真值;偶然误差使数据相互分散。
因而系统误差(
值)影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;而偶然误差(
、
值)影响了数据的精确性,精确性是指观测值间的符合程度。
图1.2以打靶的情况来比喻准确性和精确性。
以中心为理论真值,a表示5枪集中在中心,准而集中,具有最佳的准确性和精确性;b表示5枪偏离中心有系统偏差但很集中,准确性差,而精确性甚佳;c表示5枪既打不到中心,又很分散,准确性和精确性均很差;d表示5枪很分散,但能围绕中心打,平均起来有一定准确性,但精确性很差。
农业和生物学试验中,常常采用比较试验来衡量试验的效应。
如果两个处理均受同一方向和大小的系统误差干扰,这往往对两个处理效应之间的比较影响不大。
当然若两处理分受两种不同方向和大小系统误差的干扰,便严重影响两个处理效应间的真实比较了。
但一般的试验,只要误差控制得好,后面一种情况出现较少。
因而研究工作者在正确设计并实施试验计划的基础上,十分重视精确性或偶然误差的控制,因为这直接影响到后文所要介绍的统计推论的正确性。
二、试验误差的来源
研究工作者通过试验获得了观测值,其目的是要了解研究对象的真值。
若观察中包含了大量的误差便无法由观察值对真值做出估计,因而必须尽量减少误差的干扰。
如上所述,系统误差是一种有原因的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 课件 001