生物统计学复习资料整理副本.docx
- 文档编号:3231510
- 上传时间:2022-11-20
- 格式:DOCX
- 页数:14
- 大小:39.20KB
生物统计学复习资料整理副本.docx
《生物统计学复习资料整理副本.docx》由会员分享,可在线阅读,更多相关《生物统计学复习资料整理副本.docx(14页珍藏版)》请在冰豆网上搜索。
生物统计学复习资料整理副本
生物统计学复习资料
第一章
1.生物统计学的基本作用:
1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性
3)提供由样本推断总体的方法
4)提供试验设计的一些重要原则
2.生物统计学:
是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。
3.总体:
具有相同性质的个体所组成的集合
4.个体:
组成整体的基本单元
5.样本:
从总体中抽出的若干个体所构成的集合
6.变量:
相同性质的事物间表现差异性的某项特征。
按其性质分为连续变量和非连续变量。
变量可以是定量的,也可以是定性的。
7.连续变量:
表示在变量范围内可抽出某一范围的所有值
8.非连续变量:
也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:
是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:
对总体特征的度量
11.统计数:
由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:
试验因素相对独立的作用
13.误差:
是试验中不可控因素所引起的观测值偏离真值的差异
14.随机误差:
由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:
由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:
是指在试验过程中,人为因素所引起的差错。
17.准确性:
在调查或试验中某一试验指标或性状的观测值与真实值接近程度
18.精确性:
指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章
1.次数分布:
在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状
3.间断性变数:
指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:
指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在
5.质量性状资料的方法:
统计次数法,评分法
统计次数法:
于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数
给分法:
给予每类性状以相对数量的方法。
6.试验资料搜集方法:
调查和试验
7.资料调查方法:
普查和抽样调查
抽样调查:
根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
8.随机抽样满足条件:
1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相互独立的
9.统计表要求:
1)标题:
简明扼要,准确地说明表的内容,有时须注明时间、地点
2)标目:
分横纵两项,横列在表的左侧,纵列表上端,须注计算单位
3)数字:
一律用阿拉伯数字,以小数点对齐,无数字用“/”表示
4)线条:
多用三线条。
上下两条边路略粗
10.统计图绘制的要求:
1)标题简明扼要,列于图的下方
2)横纵坐标两轴有刻度,注明单位
3)横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为5.4或6.5
4)图中要不同颜色或线条代表不同的事物时,应有图例说明
11.计数资料基本采用单项式分组法进行整理
12.计量资料的整理一般采用组距式分组法
13.次数分布图分类:
条形图、饼图、直方图、多边形图、散点图
14.变量的基本特征:
1)集中性:
变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。
特征数是平均值
2)离散性:
变量有着离中分散变异的性质。
特征数是变异数,常用的指标是极差、方差、标准差和变异系数
15.平均数的种类:
算术平均数、中位数、纵数、几何平均数
1)算数平均数:
是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
特性:
a样本中各观测值与平均数之差-离均差-的总和等于零。
b样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小
2)中位数:
是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
3)众数:
资料中出现次数最多的那个观测值或次数最多一组的中点值。
4)方差:
指用样本容量n来除离均差平方和,得到平均的平方和。
5)标准差:
指方差的平方根和。
16.标准差的作用;
1)表示变量分布的离散度
2)利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的比例
3)估计平均数的标准误
4)进行平均数的区间估计和变异系数的计算
17.组距:
根据极差分成若干组,每组的距离相等,称为组距。
组距=极差/组数
18.全距(极差):
是指样本数据资料中最大观测值与最小观测值的差值。
组中值:
是指两个组限下线和上限的中间值。
19.自由度:
样本内独立且能自由变动的离均差的个数。
20.变异系数:
样本的标准差除以平均数的百分比
21.平均数的用处:
平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;
作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:
离均差之和为零;
离均差平方和为最小。
21.标准差的用处:
标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;
在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;
在正态分布中,X+-S内的观测值个数占总个数的68.26%,X-+2s内的观测值个数占总个数的95.49%,x-+3s内的观测值个数占总个数的99.73%。
标准差的特征:
表示变量分布的离散程度;
标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;
估计平均数的标准差;
进行平均数区间估计和变异数的计算。
22.比较总体和样本的平均数、标准差:
总体平均数µ=∑x/N,式中分母为总体观察个数N;样本平均数x=∑x/n,公式中n是样本容量;样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量;而总体标准差σ=,分母上是总体观测值个数N;而样本标准差是s=
,分母上是样本自由度n-1.样本标准差s是总体标准差σ的无偏估计值。
第三章:
1.事件:
一种事物常存在几种可能出现的情况,每种情况都为一次事件。
2.随机事件:
在一定条件下,可能出现,也可能不出现的事件。
3.随机现象:
在原本条件不变的条件下,重复进行观察,其结果未必相同的现象。
随机现象三个特征:
1)试验可以在相同条件下多次重复且相互独立;
2)给定条件下每次试验结果不只一个;
3)每次试验不能预料出现那种结果,但可以大概预知。
4.常见的理论分布:
离散型随机变量的二项分布、泊松分布、连续型随机变量的正态分布
5.事件的相互关系:
1)和事件:
事件A和事件B至少有一件发生而构成的新事件
2)积事件:
事件A和事件B同时发生而构成的新事件
3)互斥事件:
事件A和事件B不能同时发生
4)对立事件:
事件A和事件B必有一个发生,但二者不能同时发生
5)独立事件:
事件A的发生或事件B的发生毫无关系
6)完全事件:
如果多个事件A1、A2…两两互斥,切每次试验结果必然发生其一
6.加法定理是互斥事件A和B的和事件的概率等于事件A和事件B的概率之和
7.乘法定理是独立事件的概率的乘积
8.大数定理:
样本容量越大,样本统计数与总体参数之差越小
9.二项分布、泊松分布与正态分布的关系:
如果n相当大或p与q基本接近时,二项分布接近于正态分布;当λ较大时,泊松分布也接近正态分布。
10.正态分布的特征:
1)当x=u是,f(x)有最大值
2)当x-u的绝对值相等时,f(x)值也相等,正态分布是以u为中心向左右两侧对称分布
3)(X-u)/σ的绝对值越大,f(x)值也越小,但f(x)永不会等于0,所以正态分布以x轴为渐近线
4)正态分布的曲线完全由参数u和σ决定,u确定正态分布曲线在x轴上的中心位置,减小,曲线左移,增大曲线右移。
σ确定正态分布曲线的展开程度,越小,曲线展开程度越小,曲线越陡高,反之亦然
5)正态分布曲线在x=u+σ处各有一个拐点,曲线通过拐点是改变弯曲的方向
6)正态分布的概率密度曲线与渐近线X轴所围成的全部面积必然等于1
11.无偏估计值:
如果参数所有样本的某一统计数的平均数等于总体的相应参数
(1)样本平均数是总体平均数的无偏估计值
(2)样本方差是总体方差的无偏估计值
(3)样本标准差不是总体的标准差的无偏估计值
12.中心极限定理:
如果被抽样总体不是正态总体,但具有平均数u和σ2,当样本容量n不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数u和方差σ2/n
13.t分布的特征:
1)t分布曲线是左右对称,围绕平均数u=0向两侧递降
2)t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线
3)和正态分布相比,t分布的顶部偏低,尾部偏高,自由度大于等于30时,其曲线就比较接近正态分布曲线,当自由度趋向于无穷大时和正态分布曲线重合
14.重置抽样(放回式抽样):
指从总体中抽取一个个体,记下其特征数后再放回总体的抽样方法。
15.非重置抽样(不放回式抽样):
指从总体中抽取一个个体,记下其特征数后不再放回的抽样方法。
16.抽样分布:
指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。
17.无偏估计:
指在统计数上如果所有可能样本的统计数的平均数等于总体相应的参数,则称这个统计数为总体相应参数的无偏估计量。
18.频率与概率之间的转化:
事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。
二者的关系是:
当试验次数n充分大时,频率转化为概率。
19.正态分布、标准正态分布、正态分布曲线的特点
正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ²=1的正态分布为标准正态分布。
正态分布具有以下特点:
标准正态分布具有以下特点:
①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值
;②、正态分布是以μ为中心向左右两侧对称的分布③、
的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);④、正态分布曲线完全由参数μ和来决定⑤、正态分布曲线在x=μ±处各有一个拐点;⑥、正态分布曲线与x轴所围成的面积必定等于1。
正态分布具有两个参数μ和,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;决定正态分布曲线的展开程度,越小曲线展开程度越小,曲线越陡,越大曲线展开程度越大,曲线越矮宽。
第四章
1.统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。
2.参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。
参数估计包括点估计和区间估计。
3.统计推断包括假设检验和参数估计两个方面
任务:
分析误差产生的原因,确定差异的性质,排除误差干扰,从而对总体的特征做出正确的判断。
4.假设检验:
根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 复习资料 整理 副本