生物统计学笔记.docx
- 文档编号:10445279
- 上传时间:2023-02-11
- 格式:DOCX
- 页数:60
- 大小:4.76MB
生物统计学笔记.docx
《生物统计学笔记.docx》由会员分享,可在线阅读,更多相关《生物统计学笔记.docx(60页珍藏版)》请在冰豆网上搜索。
生物统计学笔记
生物统计学
Statisticsistheintroductionofmathematicallanguageintospecificfieldsofscienc.
Itisanartandscienceforcollecting,analyzing,showingandinterpretingdata.
Sourcesofrandomness
Theprobleminvolvesalargenumberofdata,cannotbefullystudied,canonlybeusedina"certainway"toinvestigatepartofit.
Therandomerroroftheexperiment,thatis,theerrorcausedbytheuncontrolled,unrecongnizedfactorsinthetestprocess.
Twomajorfactions
Classical
Theprobabilityofaneventcanbeexplainedbyalargenumberofrepeatedexperiments,andthisexplanationdoesnotdependonthecognitivebody.
Bayes
Anyinferenceoftheparametersisnecessaryandcanonlybebasedontheposteriordistributionofparameters.
Commonstatisticalterms
Population:
Individual:
Sample:
asetofindividualsdrawnfromapopulationiscalledasample.
Eachindividualthatmakesupasampleiscalledasampleunit.
Thenumberofindividualsincludedinthesampleiscalledsamplesizeorsamplesizes,andthesamplecapacityisoftenrecordedasn.
Generallyinbiologicalresearch,n<=30samplesareusuallycalledsmallsamples.thecalculationandanalysisofsomestaticsbetweensmallandbigsamplesaredifferent.
Thebasiccharactersticofstatisticalanalysisistoinferthewholebysample.
Variablesandconstants
Deviationanderror
Deviation:
randomerror:
samplingerror
systematicerror:
lopsodederror
生物统计学教学大纲
2018年3月5日
18:
26
第一章 绪论(2学时)
主要内容:
介绍课程的性质、内容和考核方式;了解生物统计学的发展历史和基本概念;通过具体实例说明生物体中随机现象的普遍性。
重点和难点:
让学生认识到随机性在生命系统中具有普遍性。
1.生物统计发展历史
2.生物体中随机现象的普遍性
第二章:
试验·与特征数的计算(2学时)
主要内容:
试验资料的类型、收集与整理,层次分布表、直方图等收集和显示数据方式;特征数的计算,包括平均数、众数、方差、极差等。
重点和难点:
特征数的计算,平均数、众数、方差和极差的含义
1.试验材料的收集与整理
2.特征数的计算
第三章:
概率和概率分布(4学时)
主要内容:
大数定理;几种常见的理论分布,二项分布、泊松分布和正态分布;统计数的分布,t分布、χ2分布、F分布。
重点和难点:
几种常见的理论分布和统计数的分布
1.概率基础知识
2.几种常见的理论分布
3.统计数的分布
第四章:
统计推断 (8学时)
主要内容:
假设检验的原理和方法,具体假设检验方法,包括u检验、t检验和方差的同质性检验;参数估计和点估计,非参数检验。
重点和难点:
假设检验的原理和方法,具体假设检验方法
1.假设检验的原理和方法
2.样本平均数的假设检验
3.样本频率的假设检验
4.方差的同质性检验
第五章:
卡方检验(2学时)
主要内容:
卡方检验的原理和方法,Pearson定理;卡方检验的应用,适合性检验和独立性检验。
重点和难点:
卡方检验的原理和方法
1.卡方检验的原理和方法
2.适合性检验
3.独立性检验
第六章:
方差分析(4学时)
主要内容:
方差分析、协方差分析的原理和方法,单因素、多因素方差分析,单因素、多因素协方差分析。
重点和难点:
方差分析、协方差分析的原理和方法
1.方差分析的基本原理
2.单因素方差分析
3.二因素方差分析
第七章:
直线回归与相关分析(4学时)
主要内容:
直线回归的原理和方法,曲线拟合的原理和方法,相关分析的原理和方法。
重点和难点:
重点是直线回归的原理和方法,相关分析的原理和方法
1.直线回归分析
2.直线相关
第八章:
试验设计及其统计分析(2学时)
主要内容:
试验设计的基本原理,常用试验设计和分析方法。
重点和难点:
重点是试验设计的基本原理,难点是每个原理的具体实现方式和相关分析方法。
1.试验设计的基本原则:
重复、随机和局部控制
2.局部控制的方法:
比对设计、随机区组设计和拉丁方设计等
第九章:
扩展知识(4学时,理论课)
主要内容:
课程项目实践相关知识,包括统计学和生物学相关基础知识,如多重检验和小样本检验等统计学知识,以及DNA突变和单核苷酸多态性、基因型与表型、转录因子结合等生物学知识。
重点和难点:
生物学和统计学之间的内在逻辑关系
1.DNA突变、转录因子结合、表型之间的联系
2.课程项目实践和统计学在各个环节的衔接关系
实践环节:
课程项目实践(16学时,上机操作)
主要内容:
根据生物统计学基本原理约设置4个生物学问题,在教师提供数据和具体解析待解决生物学问题的前提下,学生自行完成项目。
项目结果以书面报告形式和课堂展示两种方式进行。
重点和难点:
通过课程项目实践使学生初步具备应用统计学基本概念和方法分析并解决具体生物问题的能力。
1.模式生物基因组GC含量特征或基因突变方向特征
2.基因型和表型关联分析
3.转录因子结合位点
4.自由选题
来自<>
生物统计学概念及主要内容
2018年3月9日
19:
54
Theconceptandmaincontentofbiostatistics
Concept:
Biostatisticsistheapplicationofmathematicalstatisticsinbiologicalresearch
Sourcesofbiologicalrandomness
Variability,uncertainty,complexity
Collationofdata&caculationofthecharacteristicnumber
2018年3月9日
20:
03
Typeoftestdata:
Collectionandcollationoftestdata
Quantitativecharacterisacharacterwhichcouldbecountedormeasured,thedatagetinthiswayiscalleddataofquantitativecharacteristics
Thequantitativetraitdataisdividedintotwokinds,discretetypeandcontinous.
Qualitativecharactermeansthecharacterwhichcouldbemeasureddirectly.
Thedataobtainedfromtheobservationofqualitytraitsisthequalitycharacterdata.Thistypeoftraitcannotbedirecylyusedasanumericalvalue,toobtaindataonsuchtraits,itisnecessarytoquantifytheresultsoftheirobservations.
Collectionoftestdata:
Overall,samples
Randomsampingmustmeet2conditions:
Equalopportunityofeachindividualbeingdrawninthewhole
Independentofeachotherinthewhole,whetherbeingdrawnisnotaffectedbyotherindividual.
Finishingoftestdata:
Theformulationofthedistributiontable
Thecaculationofthecharacteristicnumber
2018年3月11日
16:
47
Thedistributionofvariableshastwodistinctbasiccharacteristics:
centealizationanddispersion
Arithmeticmean:
thesummeansthenumber
Median:
thenumberstandingatthemiddleoftheline
Mode:
thevaluethathasthemostoccurrencesoftheobservedvalue
Geometric:
Applicationscope:
thegeometricalmeannumberisapplicabletothelogarithmicnormaldistributionofvariablex,andthedataofnormaldistributionafterlogarithmictransformation.
Harmonicmean:
Thereciprocalofthearithmeticmeanofthereciprocaloftheobservationsinthedata
Theimportantnatureofarithemeticaverages:
Thesumofthedeviationsisequaltozero
Thesquaresumofthedeviationisminimum
Range:
thedifferencebetweenthemaximumvalueandtheminimumvalueofasamplevariable
Variance:
Standarddeviation:
Thecharacteristicsofstandarddeviation:
Thesizeofthestandarddeviation,affectedbymultipleobservations,iftheobservationnumberoflargedifferencesbetweenthedifferenceisalsolarge,andviseversaissmall
Coefficientofvariabilit:
CV=s/x×100%
Thedegreeofrelativevariabilityofdifferentsamplescanbecompared
Probabityandprobilitydistribution
2018年3月12日
12:
40
Theconcept:
Wheatherornotsomethinghappens
Frequency:
thenumberofoccurrencesoftheeventdicidedbythetotaltimes
Probability:
thefrequencyobtainedafterextensivetestings,whichisanapproximatevalue.
Classocalprobabilty:
theprobablityiscalculateddirectyfromthecharacteristicsoftheevent.
Geometricprobablityisconsideredasarandomexperimentwithaninfinitenumberofpossiblebasicevents
Theaxiomaticdefinitionofprobablity:
Caculationofprobability:
Plot&andevents,mutexevents,opposingevents,independentevents,completeeventsystem
Thelawofprobabilitycaculation:
theadditiontheoremofmutexevents.
定理:
若事件A与B互斥,则P(A+B)=P(A)+P(B)
推理1P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
推理2P(A)=1-P(A)
推理3完全事件系的和事件的概率为1。
Probabilitydistributionofdiscretevariables
Probabilitydistributionofcontinuoustypevariables
Theprobabilitydependonthedistributiondensityfunction
Lawoflargenumbers:
Chebyshevinequalities:
Berrnoulli'slawoflargenumbers:
Sinchinlawoflargenumbers:
第二节:
几种常见的理论分布:
二项分布:
实验只有两个对立结果,具有重复性和独立性
二项分布的形状和参数:
p值较小且n不大时,分布是偏倚的,随着n的增大,分布趋于对称;当p趋于0.5时,分布趋于对称
当n足够大时,符合泊松分布
泊松分布函数的推导:
正态分布:
特征:
分布曲线由μ,σ决定,前者确定曲线中心位置,后者确定正太分布的变异度
他方分布:
特征:
(1)χ2分布于区间[0,+∝)。
(2)χ2分布的偏斜度随自由度降低而增大,当自由度df=1时,曲线以纵轴为渐近线。
(3)随自由度df的增大,χ2分布曲线渐趋左右对称,当df>30时,卡方分布已接近正态分布。
t分布
(1)t分布曲线是左右对称的,围绕平均数μt=0向两侧递降。
(2)t分布受自由度制约,每个自由度都有一条t分布曲线。
(3)和正态分布相比,t分布顶端偏低,尾部偏高,自由度df>30时,其曲线接近正态分布曲线,n→∝时则和正态分布曲线重合。
F分布:
(1)F分布的平均数μF=1,F的取值区间为[0,+∝)
(2)F分布曲线的形状仅决定于n1和n2。
在n1=1或2时,F分布曲线呈严重倾斜的反向J型,当n1≧3时,转为左偏曲线。
统计数的分布
如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。
现有一N=3总体,具有变量3,4,5,可以求出
μ=4,σ2=0.6667,σ=0.8165。
现以n=2作独立的有放回式抽样。
中心极限定理:
样本平均数差数分布:
(1)样本平均数差数的平均数=总体平均数的差数.
(2)样本平均数差数的方差=两样本平均数方差之和.
样本平均数差数的标准误差
(3)从两个独立正态分布总体中抽出的样本平均数差数的分布,也是正态分布。
统计推断
2018年4月16日
21:
39
假设检验的原理与方法
一概念:
假设检验(hypothesistest)又称显著性检验(significancetest),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。
小概率原理
概率很小的事件在一次抽样试验
中实际是几乎不可能发生的。
小概率事件在一次抽样中基本上不会发生。
二、假设检验的步骤
例:
设矽肺病患者的血红蛋白含量具平均数μ0=126(mg/L),σ2=240(mg/L)2的正态分布。
现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x=136(mg/L)。
问:
该药物治疗是否有效?
治疗后n=6x=136
那么μx=μ0?
即克矽平对治疗矽肺是否有效?
1、提出假设
例:
克矽平治疗矽肺病是否能提高血红蛋白含量?
x-μ0=136-126=10(mg/L)这一差数
是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数μ是否还是治疗前的126(mg/L)?
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数和治疗前的平均数来自不同总体,即克矽平有疗效。
2、确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作α。
统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取α=0.05和α=0.01两个显著水平。
3、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使用不同的检验方法。
4、作出推断结论:
是否接受假设
小概率原理
P=0.1142>0.05
所以不能拒绝H0,从而得出结论:
使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。
三、双尾检验与单尾检验
四、两类错误
1、当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加。
2、n,σ2可使两类错误的概率都减小.
如果从正态总体N(μ,σ2)进行抽样,其样本平均数N(μ,σ2/n)。
辛钦大数定律
方差的同质性检验
一、一个样本方差的检验---正态总体
例:
已知某农田受到重金属的污染,经抽样测定其铅浓度为4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2μg·g-1,样本方差为0.150(μg·g-1)2,试检验受到污染的农田铅浓度的方差是否与正常农田铅浓度的方差0.065(μg·g-1)2相同。
1、此题为一个样本方差与给定方差的同质性检验,使用检验。
2、样本方差S2、给定方差和自由度已知
3、双尾检验
二、两个样本方差的检验---正态总体
例:
两个小麦品种千粒重(g)调查结果
品种甲:
50,47,42,43,39,51,43,38,44,37
品种乙:
36,38,37,38,36,39,37,35,33,37
即sX2=22.933,sY2=2.933,nX=nY=10,检验两种结果方差是否有显著差异
1、此题为通过两个样本检验总体方差的同质性,使用F检验。
2、两个样本方差S2和自由度已知
3、双尾检验
样本平均数的假设检验
一、一个样本平均数的检验
1、总体方差σ2已知,采用u检验法---正态总体
例:
某鱼场按常规方法所育鲢鱼一月龄的平均体长为7.25cm,(标准差为1.58cm)现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,其平均体长为7.65cm,标准差为1.58cm,
问新育苗方法与常规方法有无显著差异?
(1)这是一个样本平均数的假设检验,因总体σ2已知,采用u检验;
(2)新育苗方法的鱼苗体长≥或≤常规方法鱼苗体长,应进行双尾检验。
2、总体方差σ2未知
例:
某鱼塘水中的含氧量,多年平均为4.5(mg/L),该鱼塘设10个点采集水样,测定含氧量为:
4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)
试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。
(1)这是一个样本平均数的假设检验,因总体σ2未知,n=10<30,可用s2代替σ2进行t检验;
(2)该次测定的水中含氧量可能>或<多年平均值,用双尾检验。
例:
生产某种纺织品,要求棉花纤维长度平均为30mm,现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求?
(1)这是一个样本平均数的假设检验,因总体σ2未知,可用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 笔记