生物统计学教案1Word格式.docx
- 文档编号:20452206
- 上传时间:2023-01-23
- 格式:DOCX
- 页数:12
- 大小:113.45KB
生物统计学教案1Word格式.docx
《生物统计学教案1Word格式.docx》由会员分享,可在线阅读,更多相关《生物统计学教案1Word格式.docx(12页珍藏版)》请在冰豆网上搜索。
放回式抽样:
从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。
非放回式抽样:
从总体中抽出个体后,不再放回,即做第二次抽样。
抽样的目的:
从总体中获得一个有代表性的样本,以便通过样本推断总体。
应注意的问题:
①样本必须有代表性。
②样本含量与可实施性之间的平衡。
1.2数据类型及频数(率)分布
1.2.1连续型数据和离散型数据
连续型数据:
与某种标准比较所得到的数据。
又称为度量数据。
离散型数据:
由记录不同类别个体的数目所得到的数据。
又称为计数数据。
1.2.2频数(率)分布表和频数(率)分布图的编绘
例1.1调查每天出生的10名新生儿中体重超过3公斤的人数,
共调查120天,结果如下:
表1-1每10名新生儿中体重超过3Kg的人数的
频数(率)分布表
频数(率)分布:
把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。
频数(率)分布还可以用图形表示,见图1-1。
图1-1每10名新生儿中体重超过3Kg的人数的频数分布图
下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。
例1.2表1-2列出了高粱“三尺三”提纯时所调查的100个数据。
表1-2“三尺三”株高测量结果
155153159155150159157159151152
159158153153144156150157160150
150150160156160155160151157155
159161156141156145156153158161
157149153153155162154152162155
161159161156162151152154157162
158155153151157156153147158155
148163156163154158152163158154
164155156158164148164154157165
158166154154157167157159170158
从上表中除可以看出最大值为170,最小值为141,以及平均高度大约在150-160之外,很难再看出什么规律出来。
但将以上数据列成频数分布表以后,便可以清楚地看出数据的变化规律。
表1-3“三尺三”株高频数(率)分布表
把频数(率)按组界的顺序排列起来,便得到了连续型数据的频数(率)分布。
从频数分布表中可见到的规律性:
1、植株矮的频数低,植株高的频数也低,植株中等高度的频数最高。
2、频数分布基本是两侧对称的。
3、植株平均高度在156-158厘米范围内。
编制连续型数据频数(率)分布表的要点:
1、求出极差R,R=maxx–minx,根据极差决定划分的组数,一般以10–15组为宜。
2、根据极差和组数求出组距,按照组距划分组限。
组限是按实验记录数据划分的每一组的上下限。
3、确定组界,组界是每一组实际值的上下界。
4、计算中值,中值是每一组组限的平均值。
5、以唱票的方式把原始数据添入相应的组限内,统计出每组的频数并计算出相应的频率。
连续型数据的频率分布同样可以用频数(率)分布图表示。
下面是频数(率)分布的直方图。
图1-2“三尺三”株高直方图
横轴表明组界,纵轴标明频数(率),以每一组的组界为一边,相应的频数(率)为另一边,作成连续的矩形,构成直方图。
连续型数据的频数(率)分布还可以用多边形图表示。
图1-3“三尺三”株高多边形图
横轴为中值,纵轴为频数(率),标上各点,连接各点构成多边形图。
第三种频数(率)图是累积频数图。
首先编制出累积频数(率)表。
再以横轴为中值,纵轴为频数(率)绘图。
表1-4“三尺三”株高的累计频数分布表
中值
累积频数(率)
142
1
157
71
145
3
160
86
148
7
163
96
151
20
166
99
154
43
169
100
图1-4“三尺三”株高累计频数分布图
1.2.3研究频数(率)分布的意义
1、可以描述数据的集中点,以平均值表示。
2、可以描述数据变异的情况。
3、可以描述数据分布的形状。
4、可以显示数据中的不规则的情况。
1.2.4频数(率)分布的不恒定性
频数(率)分布是样本分布,由于不同次抽样的随机误差,造成样本间的波动。
见下例。
表1-5每10名行人中男性人数分布表
样本1
样本2
男性人数
频数
0
2
9
6
17
18
4
27
25
5
46
40
29
30
12
8
10
总计
150
1.3样本的几个特征数
样本特征数:
描述样本分布特征的数字。
如,平均数、标准差、偏斜度和峭度。
1.3.1平均数
我们在这里使用的是算术平均数,以后一律简称为平均数。
平均数以
表示,读作“x杠”或“杠x”。
计算公式如下:
(1.1)
第二种平均数称为中位数,中位数是有序数列中点位置上的数。
第三种平均数是众数,所谓众数是指具有最高频数的组值或中值。
1.3.2平均数的计算方法
1、非频数资料:
非频数资料可以直接使用(1.1)式计算,不再举例。
2、频数资料:
计算离散型数据的频数资料时,可用下式:
(1.2)
其中:
x=组值,f=频数,N=总频数,k=组数
以下计算例1.1的平均数。
根据表1–1中的数据,列成下表。
x
f
fx
60
19
114
39
273
34
272
90
总计
120
850
由公式(1.2)得
每10名新生儿中,平均有7名体重超过3公斤。
计算连续型数据的频数资料时,与离散型数据类似。
只要用连续型数据的中值代替离散型数据的组值即可,这里不再举例。
1.3.3标准差
可以用三个量来度量数据的离散程度。
1、范围:
又称为极差,它是一组数据的最大值与最小值的差。
例如,以下5个数:
96.4、96.6、97.2、97.4、97.8(ml)。
它们的范围(R)
R=97.8–96.4=1.4ml
优点:
简单。
缺点:
只利用了一组数据的两个极端值,不能客观地反映一组数据中每一个数据与平均数的偏离程度。
为了解决范围所存在的缺点,需要求出一组数据中的每一个数与平均数的离差,然后再对该离差进行平均,以其平均数反映数据的离散程度。
2、平均离差:
先看下表
xml
离均差
ml
ml2
96.6
-0.48
0.48
0.2304
97.2
+0.12
0.12
0.0144
96.4
-0.68
0.68
0.4624
97.4
+0.32
0.32
0.1024
97.8
+0.72
0.72
0.5184
和=0
和=2.32
和=1.3280
为了求得离均差的平均数,首先要求离均差的和,从表中可见离均差的和为0。
为了解决负数问题,求离均差绝对值的和,再以样本含量平均,从而得出平均离差(MD)。
3、标准差:
解决负数的问题除取绝对值外,另一个办法是取离均差的平方。
所有离均差的平方相加称为离差平方和。
按习惯做法,应当用样本含量n平均,但在这里不用n而用n–1平均,所得结果称为样本方差,记为s2。
(1.3)
上例中的方差
方差的单位是原始数据的平方,为了使单位与原始数据相同,还必须对方差开方,开放后的方差称为标准差,记为s。
(1.4)
上例的标准差为
抽样理论证明,三种对总体离散程度估计的方法中,标准差估计得最可靠,以后我们一律使用标准差。
1.3.4标准差的计算方法
1、非频数资料
由1.4式计算标准差首先要计算出平均数,给计算带来一定的困难也影响结果的准确性。
可将1.4式变为以下形式
(1.5)
例1.3计算以下数据的标准差:
26252824232527273021。
解最好列成以下表格的形式计算
26
676
25
625
28
784
24
576
23
529
27
729
30
900
21
441
和
256
6614
将最后一行代入1.5式
如果对上表中的数字进行编码,则计算更为简便。
取C=26。
-1
-2
-3
16
-5
-4
62
将上表中的最后一行代入1.5式中,得s=2.59。
与未编码的结果一样。
2、频数资料
离散型数据可按下式计算
(1.6)
其中,f=频数,x=组值,N=总频数,k=组数。
对于连续型数据,只需将1.6式中的组值x,改为中值m。
一般m的值都较大,需对m进行编码后再计算。
对于频数资料的计算不再举例,同学可用例1.1和例1.2的数据为例进行练习。
1.3.6变异系数
标准差可以反映数据的离散程度,如果在两个样本之间进行比较,还要考虑标准差是在什么样的基础上进行的波动,即需要考虑两个样本平均数的大小。
例如马和狗体重的标准差相同,那么谁更整齐呢?
一定是马,因为马的体重远远大于狗。
为此,引入变异系数(CV)这一概念。
(1.7)
例如,有以下两个样本:
A=120±
5.0;
B=70±
4.0,如果只看标准差前者没有后者整齐,但前者的变异是在120的基础上,而后者只是在70的基础上。
它们的变异系数分别为:
CVA=0.042CVB=0.057
其结果还是A比B整齐。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 教案