李春喜《生物统计学》第三版课后作业答案docxWord格式文档下载.docx
- 文档编号:18667203
- 上传时间:2022-12-31
- 格式:DOCX
- 页数:23
- 大小:106.32KB
李春喜《生物统计学》第三版课后作业答案docxWord格式文档下载.docx
《李春喜《生物统计学》第三版课后作业答案docxWord格式文档下载.docx》由会员分享,可在线阅读,更多相关《李春喜《生物统计学》第三版课后作业答案docxWord格式文档下载.docx(23页珍藏版)》请在冰豆网上搜索。
制表和绘图时应注意些什么?
(1)对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表式,这种统计表称之为次数分布表。
(2)次数分布图是指把次数分布资料画成图状,包括条形图、饼图、直方图、多边形图和散点图。
(3)制表和绘图的基本步骤包括:
①求全距;
②确定组数和组距;
③确定组限和组中值;
④分组,编制次数分布表。
(4)制表和绘图时需要注意的是事先确定好全距、组数、组距、各组上下限,再按观测值的大小来归组。
习题2.2算数平均数与加权数形式上有何不同?
为什么说它们的实质是一致的?
(1)形式不同在于计算公式的不同:
算数平均数的计算公式为M=;
加权平均数的计算公式为M=。
(2)因为它们反映的都是同一组数据的平均水平。
习题2.3平均数与标准差在统计分析中有什么作用?
它们各有哪些特性?
(1)平均数(mean)的用处:
①平均数指出了一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;
②作为样本或资料的代表数据与其它资料进行比较。
(2)平均数的特性:
①离均差之和等于零;
②离均差平方和为最小。
(3)标准差(standarddeviation)的用处:
①标准差的大小,受实验或调查资料中多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小;
②在计算标准差时,如果对各观测值加上火减去一个常数a,标准差不变;
如果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了a倍;
③在正态分布中,一个样本变量的分布可以作如下估计:
±
s内的观测值个数约占观测值总个数的68.26%,±
2s内的观测值个数约占总个数的95.49%,±
3s内的观测值个数约占观测值总个数的99.73%。
(4)标准差的特性:
①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;
②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;
③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算;
④进行平均数区间估计和变异系数的计算。
习题2.4总统和样本的平均数、标准差有什么共同点?
又有什么联系和区别?
(1)总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。
二者区别在于,总体平均数用μ表示,μ=,公式中分母为总体观测值的个数N,样本平均数用
=,公式中的分分母为样本观测值的个数n。
样本平均数是总体平均数μ的无偏估计值。
(2)总体和样本的标准差都等于离均差的平方和除以样本容量。
二者的区别在于,总体标准差用σ表示,,分母上总体观测值的个数N;
标准差用s表示,,分母上是样本自由度n-1。
样本标准差s是总体标准差σ的无偏估计值。
习题2.5
见下图——
100例30-40岁健康男子血清总胆固醇(mol/L)的次数分布表
组限(mol/L)
组中值(mol/L)
次数
频率
累积频率
2.60-
2.870
2
0.02
3.10-
3.370
8
0.08
0.10
3.60-
3.850
12
0.12
0.22
4.10-
4.375
24
0.24
0.46
4.60-
4.845
20
0.20
0.66
5.10-
5.325
18
0.18
0.84
5.60-
5.825
7
0.07
0.91
6.10-
6.345
0.99
6.60-
0.000
0.00
7.10-
7.220
1
0.01
1.00
习题2.6
这100例男子的血清总胆固醇基本呈正态分布,中间4.1-5.1mol/L的最多,两边少,但6.6-7.1mol/L的没有。
习题2.7
由上表可知:
平均数μ=4.7389,标准差s=0.86665,而CV=s/μ*100%=18%
习题2.8
由习题2.7的表可知:
中位数Median=4.6600,平均数μ=4.7389,两数相差0.0789,符合正态分布。
习题2.9
分析见下图:
由上图可知:
“24号”玉米的平均数Μ=20,标准差s=1.24722,而CV=s/Μ*100%=6.24%;
“金皇后”玉米的平均数Μ=20,标准差s=3.39935,而CV=s/Μ*100%=17.00%,比较二者的变异系数CV,“24号”玉米的的变异系数CV比“金皇后”玉米的小得多,说明“24号”玉米的整齐度大于“金皇后”玉米。
习题2.10
由上图可知,贻贝单养的平均数μ1=42.46,极差R1=53-25=28.00,标准差s1=6.97579,CV1=s1/μ1*100%=16.43%;
贻贝与海带混养的平均数μ2=52.10,极差R1=69-39=30.00,标准差s2=6.33503,CV2=s2/μ2*100%=12.16%,虽然单养的极差较小(28),但贻贝与海带混养的平均数更大(52.10),且混养的变异系数更小,即其整齐度更有优势,由此得出,贻贝与海带混养的效果更好。
第三章概率与概率分布(P48)
习题3.1试解释必然事件、不可能事件和随机事件。
举出几个随机事件例子。
(1)必然事件(certainevent)是指在一定条件下必然出现的事件;
相反,在一定条件下必然不出现的事件叫不可能事件(impossible);
而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件(randomevent)。
(2)例如,发育正常的鸡蛋,在39℃下21天会孵出小鸡,这是必然事件;
太阳从西边出来,这是不可能事件;
给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
习题3.2什么是互斥事件?
什么是对立事件?
什么是独立事件?
试举例说明。
(1)事件A和事件B不能同时发生,即A·
B=V,那么称事件A和事件B为互斥事件(mutuallyexclusionevent),如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。
(2)事件A和事件B必有一个发生,但二者不能同时发生即A+B=U,A×
B=V,则称事件A与事件B为对立事件(contraryevent),如抛硬币时向上的一面不是正面就是反面。
事件A与事件B的发生毫无关系。
(3)事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件(independentevent),如第二胎生男生女与第一台生男生女毫无关系。
习题3.3什么是频率?
什么是概率?
频率如何转化为概率?
(1)事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率(frequency),记为W(A)。
(2)事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率(probability)。
(3)二者的关系是:
当试验次数n充分大时,频率转化为概率。
习题3.4什么是正态分布?
什么是标准正态分布?
正态分布曲线有何特点?
u和δ对正态分布曲线有何影响?
(1)正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
(2)μ=0,σ2=1的正态分布为标准正态分布,记为N(0,1)。
(3)正态分布具有以下特点:
①正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值
;
②正态分布是以μ为中心向左右两侧对称的分布③
的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);
④正态分布曲线完全由参数μ和?
来决定⑤正态分布曲线在x=μ±
?
处各有一个拐点;
⑥正态分布曲线与x轴所围成的面积必定等于1。
(4)正态分布具有两个参数μ和?
,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;
决定正态分布曲线的展开程度,?
越小曲线展开程度越小,曲线越陡,?
越大曲线展开程度越大,曲线越矮宽。
习题3.5
查附表1可得:
(1)P=(0.3<
μ<
1.8)=F(μ=1.8)-F(μ=0.3)=0.96407-0.6107=0.3533
(2)P=(-1<
1)=F(μ=1)-F(μ=-1)=0.8413-0.1587=0.6826
(3)P=(-2<
2)=F(μ=2)-F(μ=-2)=0.97725-0.02275=0.9545
(4)P=(-1.96<
1.96)=F(μ=1.96)-F(μ=-1.96)=0.97500-0.02500=0.9500
(5)P=(-2.58<
2.58)=F(μ=2.58)-F(μ=-2.58)=0.99506-0.00494=0.9901
习题3.6
解:
因为x服从μ=4,σ=4的正太分布N(4,16),故通过标准化转换公式u=可转化为:
(1)P(-3<
x≤4)→→P(-1.75<
μ≤0)
P=(-1.75<
μ≤0)=F(μ=0)-F(μ=-1.75)=0.5000-0.04006=0.45994
(2)P(x<
2.44)→→P(μ<
-0.39)
P=(μ<
-0.39)=F(μ=-0.39)=0.6517
(3)P(x>
-1.5)→→P(μ>
-1.375)≈P(μ>
-1.38)
P=(μ>
-1.38)=1-F(μ=-1.38)=1-0.08379=0.91621
(4)P(x≥-1)→→P(μ>
-1.25)
P=(μ≥-1.25)=1-F(μ=-1.25)=1-0.1056=0.89440
习题3.7
(1)根据基因分离定律和基因自由组合定律可知:
F1代非糯稻Ww与糯稻ww回交,F2代糯稻和非糯稻的概率均为1/2,其中糯稻有200*1/2=100株,非糯稻有200*1/2=100株。
(2)糯稻为2000*1/4=500株,非糯稻为2000*3/4=1500株。
习题3.8
由题意可知这种遗传符合泊松分布,P=0.0036
(1)∵,λ=np=200*0.0036=0.72,
∴P
(1)=0.721*e-0.45/1!
=0.72*e-0.45=0.4591
(2)调查的株数n应满足e-λ=e-np=0.01
因此n==≈1280(株)
习题3.9
此题符合二项分布,n=5,p=0.425,q=1-0.425=0.575
故“四死一生”的概率P(4)=p4q1=5*0.4254*0.5751=0.09378
习题3.10
设x服从这一正态分布。
因为x服从μ=16,σ=2的正太分布N(16,4),故通过标准化转换公式u=可转化为:
(1)P(10<
x<
20)→→P(-3<
2)
∵P=(-3<
2)=F(μ=2)-F(μ=-3)=0.97725-0.001350=0.97590
∴落于10到20间的数据的百分数为97.59%。
12)或P(x>
20)→→P(μ<
-2)或P(μ>
∵P1=(μ<
-2)=F(μ=-2)=0.02275
P2=(μ>
2)=1-F(μ=2)=1-0.97725=0.02275
∴P1(μ<
-2)或P2(μ>
2)的总概率P=P1+P2=0.02275+0.02275=0.04550
∴小于12或大于20的数据的百分数为4.55%。
习题3.11
(1)查附表3可知,当df=5时:
①P(t=2.571)=0.05,故P(t≤-2.571)=0.05/2=0.025
②P(t=4.032)=0.01,故P(t>
4.032)=0.01/2=0.005
(2)查附表4可知,当df=2时:
①P(
=0.05)=0.975,故P(
≤0.05)=0.975
②P(
=5.99)=0.05,故P(
>
5.99)=1-0.05=0.95
③∵P(
=0.05)=0.975,故P
0.05)=1-0.975=0.025
P(
=7.38)=0.025,故P(
<
7.38)=0.025
∴P(0.05<
7.38)=P(
7.38)-P(
0.05)=0.025-0.025=0
(3)查附表5可知,当df1=3,df2=10时:
①P(F>
3.71)=0.05
②P(F>
6.55)=0.01
第四章统计推断(P78-79)
习题4.1什么是统计推断?
统计推断有哪两种?
其含义是什么?
(1)统计推断(statisticalinference)是根据总体理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。
(2)统计推断主要包括参数估计和假设检验两个方面。
(3)①假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率水平(或显着水平)上应该接受或否定的哪种假设的推断。
②参数估计则是由样本结果对总体参数在一定概率水平下所做出的估计。
参数估计包括点估计(pointestimation)和区间估计(intervalestimation)。
习题4.2什么是小概率原理?
它在假设检验中有什么作用?
(1)小概率原理(littleprobability)是指概率很小的事件在一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的事件作为小概率事件。
(2)它是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;
如果某事件的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。
习题4.3假设检验中的两类错误是什么?
如何才能少犯两类错误?
(1)在假设检验中如果H0是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;
如果H0不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。
(3)假设检验中的两类错误是弃真错误和取伪错误。
为了减少犯两类错误的概率要做到:
显着水平α的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;
尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。
习题4.4什么叫区间估计?
什么叫点估计?
置信度与区间估计有什么关系?
(1)区间估计(intervalestimation)指根据一个样本的观测值给出总体参数的估计范围,给出总体参数落在这一区间的概率。
(2)点估计(pointestimation)是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。
(3)置信度与区间估计的关系为;
对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。
习题4.5
(1)①假设,即改变饵料后对虾体重无显着变化;
,即改变饵料后对虾体重显着变化。
②由于置信度,确定显着水平。
③计算统计量:
④作出推断:
由于,否定,接受。
认为改变饵料后对虾体重显着变。
(2)鲜活与人工配饵料各半喂养方式对虾体重的点估计为:
(3)鲜活与人工配合饵料各半喂养方式下对虾体重的区间估计为:
推断:
认为采用鲜活与人工配合饵料各半喂养方式下对虾体重为19.7648~20.2352g,这个估计置信度为95%。
习题4.6
解:
(1)假设H0:
该测定结果与常规枝条含氮量没有显着差异;
HA:
该测定结果与常规枝条含氮量有显着差异。
(2)确定显着性水平α=0.05
(3)计算统计量,经SPSS单样本T检验得到如下结果:
(4)作出推断:
由上表可知P=0.719>
α=0.05,故接受原假设即接受H0,否定HA认为该测定结果与常规枝条含氮量没有显着差异。
习题4.7
本题中,s1=25.4,n1=128,s2=46.8,n2=69
(1)假设,即三化螟两代每卵块的卵数没有显着差异;
,即三化螟两代每卵数有显着差异。
(2)确定显着性水平。
(3)计算统计量:
因为,否定,接受。
认为三化螟两代每卵块的卵数有极显着差异。
习题4.8
首先作F检验
(1)假设H0:
即北方、南方动物鸟翅长变异一样;
即北方、南方动物鸟翅长变异不一样。
(3)计算统计量,经SPSS独立样本T检验得到如下结果:
由上表可知P=0.561>
α=0.05,故接受原假设即接受H0,否定HA,即北方、南方动物鸟翅长具有同质性。
再进行平均值的检验:
即北方、南方动物鸟翅长没有显着差异;
即北方、南方动物鸟翅长有显着差异。
(4)作出推断:
由上表可知P=0.886>
α=0.05,故接受原假设即接受H0,否定HA,认为北方、南方的动物鸟翅没有显着差异。
习题4.9
即治疗前后血压没有显着差异;
即治疗前后血压有显着差异。
(3)计算统计量,经SPSS配对样本T检验得到如下结果:
P值为0.000<
α=0.05,故否定H0,接受HA认为中草药青木香治疗高血压的效果达到极显着水平。
习题4.10
即两种病毒的致病力没有显着差异;
即两种病毒的致病力有显着差异。
P=0.034<
α=0.05,故否定H0,接受HA;
认为两种病毒的致病力间的差异达到显着水平。
习题4.11
检验该批棉花种子是否合格
P≤0.8,即该批棉花种子不合格;
HA:
P>
0.8,即该批棉花种子合格
由上表可知P=0.261>
α=0.05,故接受H0,否定HA;
认为该批棉花种子不合格。
习题4.12
即两医院乳腺癌手术后5年的生存率间没有显着差异;
即两医院乳腺癌手术后5年的生存率间有显着差异。
由上表可知P=0.296>
即两医院乳腺癌手术后5年的生存率间未达着差异。
习题4.13
即两种饵料的方差相同;
即两种饵料的方差不同
由上表可知方齐次性检验中P=0.523>
认为两种饵料的方差具有同质性。
第五章χ2检验(P89-90)
习题5.1什么是χ2检验?
什么情况下的假设检验?
(1)χ2检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
即根据样本的频数分布来推断总体的分布。
它属于自由分布的非参数检验。
它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。
所以,凡是可以应用比率进行检验的资料,都可以用χ2检验。
(2)χ2检验主要有三种用途:
一个样本方差的同质性检验,适合性检验和独立性检验。
一个样本方差的同质性检验用于检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物统计学 李春喜生物统计学第三版 课后作业答案docx 李春喜 生物 统计学 第三 课后 作业 答案 docx