生物统计学讲稿第14章.docx
- 文档编号:23821642
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:17
- 大小:70.94KB
生物统计学讲稿第14章.docx
《生物统计学讲稿第14章.docx》由会员分享,可在线阅读,更多相关《生物统计学讲稿第14章.docx(17页珍藏版)》请在冰豆网上搜索。
生物统计学讲稿第14章
生物统计学讲稿
绪论
第一节生物统计学的性质和作用
一、什么是生物统计学
1、定义:
生物统计学就是运用统计学的原理和方法,来研究生物界数量现象的科学方法。
它是一门应用统计方法或数学逻辑来搜集、整理、分析和解释生物界数量现象的科学方法。
是统计学和生物科学相结合的边缘学科。
工具:
显微镜、电子显微镜、
2、生物统计学的特点、属性:
详细讲解生物统计学的归纳性和概率性。
要求个体间的度量值而不是个体间的分类,要求的是数据而不是修饰词
二、为什么要学习生物统计学
1.“生物统计学”能为我们提供数据整理分析的方法
2.“生物统计学”能为我们提供由样本推断总体的方法
3.“生物统计学”能为我们分析变异因素提供一系列决策和方法
4.“生物统计学”可以帮助我们分析现象之间的关系
5.“生物统计学”对实验设计也有指导作用
第二节学习生物统计学的预备知识
一、总体和样本
(一)总体
具有共同性质的个体所构成的集团无限总体有限总体
(二)样本
由总体中随机抽取的若干个体所构成的集团样本容量(n)
大样本(n30),小样本(n≤30),随机样本
二、变数和变量
1.变数:
定义及表示方法,X、Y……
2.变量:
定义及表示方法,x1、x2、x3、……
观察值的概念
三、参数和统计量
1.参数:
特征数,如平均数、标准差
2.统计量:
标准差s、平均数
四、误差、偏差和错误
误差=观察值-真值
偏差=观察值-平均观察值
误差和偏差统称为“随机误差”,简称“机误”
五、准确度和精确度
准确度:
观察值与真值之间的符合程度。
精确度:
重复观察值之间彼此相符合的程度。
复习思考题
1.什么叫总体?
什么叫样本?
如何使抽取的样本具有代表性?
2.精确度的概念及作用?
3.错误和误差是一回事吗?
如何克服试验中发生错误?
4.生物统计学的基本特点是什么?
第一章数据整理
第一节频数分布
一、试验资料的性质
(一)、数量性状的资料
1.连续型数据(度量数据)
2.离散型数据(间断、不连续数据)
(二)、质量性状的资料
能观察而不能量测的性状,如花色、有芒无芒
1.应用统计次数的方法
2.给予每类性状以相当的数量
二、频数表和频数图的绘制
(一)离散型数据资料的整理
(二)连续型数据种资料的整理
1.求极差R=maxx-minx
2、确定组数和组距
3、选定组限、组界和组中点值
4、归组,统计各组的频数和频率
(三)属性性状资料的整理
(四)、频数(率)分布图
1、直方图(用于连续型数据)
2、多边形图
3、条形图(二维和三维)
4、累积频数图
(五)、研究频数分布的意义
1、根据频数分布,可以看出数据的集中情况,常用平均数表示全部数据的集中点。
2、根据频数分布,可以看出数据的变异情况,一般以变异数反映数据的离中趋势和变异性。
3、从频数分布图可以看出曲线的形状。
(六)、频数(率)分布的不恒定性
由于抽样具有随机性,即使在同一总体中抽出的两个样本容量相同的样本,其样本的频数分布也不完全一致,有时差异还会很大,这就是频数分布的不恒定性。
因此,当用样本推断总体时,推断的结果也会有所不同;这就需要对总体的分布有所了解,在后续章节中我们会涉及相关的问题。
第二节平均数和变异数
一、平均数
(一)、平均数的意义和种类
平均数是数量资料的代表值,表示资料中观察值的中心位置,并且可以作为资料的代表值与另一组资料相比较,借以明确二者间相差的情况。
1、算术平均数
2、中位数Md
将资料内所有观察值按从大到小排列,居于中间位置的观察值称为中位数。
奇数、偶数
3、众数Mo
资料中最常见的观察值或频数最多的一组中点值,称为众数。
4、几何平均数G
如有n个观察值,其相乘积再开n次方所得的数值,即为几何平均数。
(二)、算术平均数的定义公式及其基本特征
1、算术平均数的定义公式
2、算术平均数的基本特征
•算术平均数的大小受每个观察值的影响。
•如果每个xi都相乘以相同的k,则平均数也应乘以k。
•如果每个xi都相加上相同的A,则平均数也应加上A。
•如果是n1个数的平均数,是n2个数的平均数,那
么全部n1+n2个数的算术平均数是加权平均数,
*离均差的代数和是“零”。
**离均差的平方和最小。
(三)、算术平均数的计算方法
1、非频数资料(小样本)
直接按定义公式计算,平均数的单位与观察值的单位相同。
2、频数资料(大样本)
I.离散型数据
II连续型数据
二、变异数
表示数据资料离中趋势和变异程度的统计数叫变异数。
(一)、变异数的意义和种类
1、极差R
R=maxX-minX
例题
2、方差
将各个离均差平方求和,所得数值称离均差的平方和,缩写为SS,平方和除以自由度的商值为方差。
3、标准差
方差的平方根就是标准差,以s表示。
4、变异系数CV
应用实例。
(二)、标准差的计算方法和特性
1、非频数资料
按计算公式计算,应用实例。
2、频数资料的计算
I离散型数据
II连续型数据
两者的应用实例。
3、标准差的特性及作用
•标准差的大小受多个观察值的影响,如果观察值间的差异较大,其离均差也大,因而标准差也大,反之亦反。
•在计算标准差时,对各观察值加上或减去一个常数,其标准差不变。
如果给各观察值乘或除以一个常数a,则所得的标准差扩大或缩小了a倍。
•在正态布情况下,利用标准差可以计算观察值在特定区域里的比例。
•标准差表示数据资料的离散程度,标准差小,说明数据资料比较集中在平均数附近;标准差大,则表明数据比较分散。
讲解课后习题,留课后作业,训练学生使用科学计算器计算平均数、变异数的能力。
复习思考题
1.什么是数量性状?
其数据的特点是什么?
2.什么是质量性状?
在生物统计学里如何研究质量形状?
3.什么是频数表(图)?
研究频数(图)分布的意义?
4.说明平均数的意义和种类。
5.算术平均数的基本特征是什么?
6.试证明“离均差的代数和为零”和“离均差的平方和最小”。
7.什么是加权平均数?
如何计算加权平均数?
8.什么叫变异数?
说明变异数的种类和意义。
9.什么是标准差?
什么是变异系数?
说明变异系数和标准差应用有何不同?
10.说明频率分布不稳定性的产生原因。
第二章概率的基本知识
第一节基本概念
自然现象(事件)
确定现象:
必然现象(事件)、不可能现象(事件)
非确定现象:
随机现象(事件)
一、随机现象(事件)
在一组条件的实现之下,可能发生也可能不发生的现象(事件)。
二、概率
随机事件发生可能性大小的数值表征。
三、概率论
研究(随机现象)偶然现象本身规律性的科学
四、统计学
基于观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性的科学就是统计学。
应用实例讲解。
第二节事件、事件的关系和运算
一、试验
同一组综合条件的实现。
二、事件
1、基本事件:
试验的每一个基本结果。
用a、b……表示
2、事件:
基本事件的集合,用A、B……表示
3、样本空间:
全部基本事件的集合,用W表示
4、必然事件:
每次试验一定出现的结果,W
5、不可能事件:
任何一次试验都不出现的结果,V,空集
三、事件的关系
利用多媒体投影动画,图示事件之间的关系。
利用实际事例,进一步地说明它们的应用价值。
1、对立事件
定义
对立事件实例
2、包含:
定义,包含事件实例
3、相等:
定义,相等事件实例
四、事件的运算
1、事件的和(并)
定义,运算实例
2、事件的交(积)
定义,运算实例
3、互不相容事件
定义,运算实例
第三节概率——频率的稳定性
一、概率的统计定义
1、定义
强调研究方法
定义:
假定在相似的条件下重复进行同一类试验,事件A的发生次数a与总试验次数n的比数称为频率(a/n),则在试验总次数n逐渐增大时,事件A的频率愈来愈稳定地接近于定之值p,于是定义A的概率为p,并记为:
P(A)=p。
当n充分大时,P(A)=p(a/n)
2、概率的性质
•任何事件(A)的概率均满足:
0≤P(A)≤1;
•必然事件的概率为1;
•不可能事件的概率为0。
二、概率的古典定义
1、应用条件:
如果随机现象具备以下特点,a随机试验的全部可能的结果(基本事件数)是有限的,b各基本事件间是互不相容且等可能的,则可以应用概率的古典概型进行概率计算。
2、古典概型
若随机现象的基本事件总数为n,事件数为m,则随机事件A的概率
三、小概率的实际不可能性原理
小概率的事件在一次试验中是不可能发生的,在现实生活中可以将其视为不可能事件。
四、几种概率的运算法则
利用多媒体投影详细图示几种常用概率的运算法则。
1、对立事件的概率:
2、互不相容事件的概率加法:
3、独立事件的概率乘法:
4、完全事件系的概率:
复习思考题
1.什么概率论?
什么叫统计学?
两者的关系是什么?
2.什么是试验?
3.举例说明什么是必然事件、什么是随机事件?
请说明事件之间的关系。
4.什么是概率?
利用统计概率的定义说明概率的性质。
5.什么是统计概率?
要想了解随机事件的发生规律,应如何进行研究?
6、试阐述“小概率实际不可能性”的原理及应用。
7、说明随机事件的概率计算法则。
第三章几种常见的概率分布
第一节随机变量
一、随机变量
在随机试验中被测量的量,称随机变量。
有时随机试验的结果为数量,有时随机试验的结果不是数量,要人为地量化。
二、随机变量的种类
1、离散型随机变量
随机变量可能取得的数值为有限个或是可数无穷多个彼此孤立的数值。
如杂草的株数、人数等。
2、连续型随机变量
随机变量可取某一(有限或无限)区间内的任何数值,则称其为连续型随机变量。
如身高、株高等。
三、总体和样本
1、总体:
随机变量可能取得的数值的全体,称总体。
2、样本:
总体中随机变量的n次观察值,称样本。
3、用随机变量来表示随机事件:
讲解概率的基础知识习题,留课后作业。
第二节有关概率分布的几个概念
一、离散型随机变量的概率函数
二、连续型随机变量的概率密度函数和分布曲线
1、概率密度函数
2、分布曲线
三、累积函数(分布函数)
概念:
累积函数是随机变量X取得小于或等于X0的值的概率,我们以F(x0)表示。
数学表达式:
1、连续型随机变量的累积函数
2、离散型随机变量的概率函数
四、概率分布表和概率分布图
概念和图形
五统计分布和理论分布
由样本而来的频率分布称为统计分布或经验分布,由总体而来的概率分布称为理论分布或总体分布。
对于各种各样的频率分布,都有其相应的理论分布即随机变量规律的理想化模型去适应它们。
六、总体的特征数(参数)
(一)总体的理论平均数(数学期望)
1、定义
2、应用实例
(二)、总体的方差
1、定义
2、应用实例
第三节二项分布
一、二项分布的应用条件
1.每次试验只有两种互不相容的结果。
2.每一种结果在各次试验中的发生概率恒定。
二、二、解决的问题
将各次试验独立地进行n次,求在n次试验中,事件A发生x次的概率
三、二项分布的概率函数
四、二项分布的总体参数
平均数:
=np,
方差:
2=npq,
五、应用实例
重点讲解例题:
如果某玉米种子的发芽率为0.85,若每穴播4粒种子,问田间缺苗率是多少?
间苗率是多少?
每穴有两株玉米苗的概率是多少?
通过例题讲解,进一步理解二项分布的概念、概率函数和累计函数的意义,和能够解决的实际问题
第四节泊松分布
一、应用条件及描述的现象
二、概率函数
三、总体参数
四、应用实例
重点讲解二项分布于泊松分布的关系、概率函数的推导过程和泊
松分布的应用实例。
其他问题的课堂处理同二项分布。
复习思考题
1、什么是随机变量?
举例说明随机变量的种类?
2、举例说明如何利用随机变量表示一个事件?
如何利用随机变量定义总体和样本?
3.为什么连续型随机变量取得某一具体观测值的概率是0?
4.离散型随机变量和连续型随机变量的累积函数有何区别?
5.累计函数和分布曲线的主要用途。
6.二项分布的应用前提和条件?
7.泊松分布和二项分布概率函数的关系?
第五节正态分布
一、正态分布的意义
二、正态分布的密度函数和累积函数
1、正态分布的表示方法
2、密度函数和分布曲线
3、
正态分布的累积函数
三、标准正态分布
称=0,=1时的正态分布为标准正态分布,记为N(0,1)
1、标准正态分布的密度函数和累积函数
2、标准正态分布的特性
•在u=0时,(u)达到最大值
•当u不论向哪个方向远离0时,e的指数都变成一个绝对值值越来越大的
负数,因此(u)的值都减小。
•曲线以纵坐标为对称轴,即(u)=(-u)
•曲线在u=-1和u=1处有两个拐点
•曲线和横轴所夹的面积为1
•对于标准正态曲线的累积分布函数(u)的值,有编制好的数值表,从
表中可以查出(u)的值•
四、正态分布表的查法
1、标准正态分布表的查法2、非标准正态分布表的查法及标准正态离差的
计算
五、正态分布的分位数及分位数表的查法
1、单侧(上侧和下侧)分位数
2、双侧分位数
复习思考题:
1、正态分布的意义和特点。
2、正态分布的密度函数和分布曲线的特点。
3、什么是正态分布的分位数?
都有哪些种?
第四章抽样分布
在生物统计学中,最基本的问题是研究总体与样本之间的关系问题。
抽样分布就是从总体到样本的方向来研究两者的关系的,目的是要了解从已知的总体到从这个总体中抽出的样本的变异特点如何,应较细致地了解有关内容。
第一节中心极限定理
一、定理内容
二、对初步判定一个随机变量是否符合正态分布的意义
第二节从一个正态总体中抽取的样本统计量的分布
一、样本平均数的分布
1、u-分布
2、t-分布
密度函数、分布曲线、与u分布的关系和差别
3、t分位数表的查法
二、样本方差的分布-卡方分布
1、卡方分布
密度函数、分布曲线、
2、卡方分位数表的查法
上侧分位数和下侧分位数的定义,查表方法。
第三节从两个正态分布总体中抽取的样本平均数和方差的分布
一、总体方差已知时的样本平均数差数的分布-u分布
随机变量、标准化的随机变量的数学表达式,
与正态总体参量的关系
二、总体方差未知但相等的分布t-分布
随机变量、标准化的随机变量的数学表达式,
与正态总体参量的关系
三、两个样本方差比的分布-F分布
随机变量、标准化的随机变量的数学表达式,概率密度函数,
累积函数,分布曲线
随机变量与正态总体参量的关系
熟练掌握F分位数的定义方法和分位数表的查法。
复习思考题:
1.如何初步判断一个生物性状是否符合正态分布?
2.在一个正态总体中抽取的样本平均数的分布,与总体标准差有怎样的关系?
3.2分位数和F分位数的下侧分位数表示方法为什么与t分位数、u分位数的下侧分位数表示方法不同?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 讲稿 14