生物统计学课后习题答案.pdf
- 文档编号:3217400
- 上传时间:2022-11-20
- 格式:PDF
- 页数:136
- 大小:1.18MB
生物统计学课后习题答案.pdf
《生物统计学课后习题答案.pdf》由会员分享,可在线阅读,更多相关《生物统计学课后习题答案.pdf(136页珍藏版)》请在冰豆网上搜索。
第一章第一章统计数据的收集与整理统计数据的收集与整理1.1算术平均数是怎样计算的?
为什么要计算平均数?
答:
答:
算数平均数由下式计算:
nyynii1,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。
计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。
1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?
答:
答:
标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。
1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?
答:
答:
变异系数可以说是用平均数标准化了的标准差。
在比较两个平均数不同的样本时所得结果更可靠。
1.4完整地描述一组数据需要哪几个特征数?
答:
答:
平均数、标准差、偏斜度和峭度。
1.5下表是我国青年男子体重(kg)。
由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。
根据表中所给出的数据编制频数分布表。
666964656466686562646961616866576669666570645867666667666662666664626265646566726066656161666762656561646264656265686865676862637065646562666263686568576766686364666864636064696566676767656767666864675966656356666363666763706770626472696767666864657161636164646769706664656463706462697068656365666468696563676370656867696665676674646965646565686765656667726567626771696565756269686865636666656261686564676664606168676359656064636962716960635967616869666469656867646466697368606063386267656569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:
答:
首先建立一个外部数据文件,名称和路径为:
E:
dataexer1-5e.dat。
所用的SAS程序和计算结果如下:
procformat;valuehfmt56-57=56-5758-59=58-5960-61=60-6162-63=62-6364-65=64-6566-67=66-6768-69=68-6970-71=70-7172-73=72-7374-75=74-75;run;dataweight;infileE:
dataexer1-5e.dat;inputbw;run;procfreq;tablebw;formatbwhfmt.;run;TheSASSystemCumulativeCumulativeBWFrequencyPercentFrequencyPercent-56-5731.031.058-5941.372.360-61227.3299.762-634615.37525.064-658327.715852.766-677725.723578.368-694515.028093.370-71134.329397.772-7351.729899.374-7520.7300100.01.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。
它们的平均数相等吗?
标准差相等吗?
能够解释为什么吗?
答:
答:
用means过程计算,两个样本分别称为1y和2y,结果见下表:
TheSASSystemVariableNMeanStdDev-Y11064.50000003.5039660Y21063.90000003.1780497-随机抽出的两个样本,它们的平均数和标准差都不相等。
因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。
1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?
为什么?
本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?
答:
答:
不是简单的随机样本。
从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。
应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。
1.8证明niniiiiiCyyyyyy1122,。
其中若用Cyyii或iiCyy编码时,前式是否仍然相等?
答:
答:
(1)令Cyyii则Cyy平均数特性之。
niiniiniiyyCyCyyy121212
(2)令Cyyii则Cyy平均数特性之。
2122112CyyCyCyyyniiniinii用第二种编码方式编码结果,两式不再相等。
1.9有一个样本:
nyyy,21,设B为其中任意一个数值。
证明只有当yB时,niBy12最小。
这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。
答:
答:
令2Byp,为求使p达最小之B,令02BBy则ynyBBy02。
1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下1:
10.09.37.29.18.58.010.510.69.610.17.06.79.57.810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.810.09.97.54.57.67.09.76.28.06.98.38.610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。
答:
答:
首先建立一个外部数据文件,名称和路径为:
E:
dataexr1-10e.dat。
SAS程序及结果如下:
optionsnodate;procformat;valuehfmt3.5-4.4=3.5-4.44.5-5.4=4.5-5.45.5-6.4=5.5-6.46.5-7.4=6.5-7.47.5-8.4=7.5-8.48.5-9.4=8.5-9.49.5-10.4=9.5-10.410.5-11.4=10.5-11.4;run;datawheat;infileE:
dataexr1-10e.dat;inputheight;run;procfreq;tableheight;formatheighthfmt.;run;proccapabilitygraphicsnoprint;varheight;histogram/vscale=count;insetmeanvarskewnesskurtosis;run;TheSASSystemTheFREQProcedureCumulativeCumulativeheightFrequencyPercentFrequencyPercent-3.5-4.411.0011.004.5-5.499.001010.005.5-6.41111.002121.006.5-7.42323.004444.007.5-8.42424.006868.008.5-9.41111.007979.009.5-10.41515.009494.0010.5-11.466.00100100.001.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH)数据的接收范围频数表2如下:
(略作调整)HDBH数据的接收范围/(UL-1)频数2141245.90913277.818211309.727319341.636426373.545522405.454511437.363613469.27276501.18183533.09092根据上表中的数据作出直方图。
答:
答:
以表中第一列所给出的数值为组界,直方图如下:
1.12灵长类手掌和脚掌可以握物一侧的皮肤表面都有突起的皮肤纹嵴。
纹嵴有许多特征,这些特征在胚胎形成之后是终生不变的。
人类手指尖的纹型,大致可以分为弓、箕和斗三种类型。
在手指第一节的基部可以找到一个点,从该点纹嵴向三个方向辐射,这个点称为三叉点。
弓形纹没有三叉点,箕形纹有一个三叉点,斗形纹有两个三叉点,记录从三叉点到箕或斗中心的纹嵴数目称为纹嵴数(fingerridgecount,FRC)。
将双手十个指尖的全部箕形纹的纹嵴数和/或斗形纹两个纹嵴数中较大者相加,称为总纹嵴数(totalfingerridgecount,TFRC)。
下表给出了大理白族人群总纹嵴数的频数分布3:
TFRC分组中值频数113020231504015170608719080299111010054111130120631311501406815117016051171190180181912102006首先判断数据的类型,然后绘出样本频数分布图,计算样本的四个特征数并描述样本分布形态。
答:
答:
总纹脊数属计数数据。
计数数据的频数分布图为柱状图,频数分布图如下:
样本特征数(以TFRC的中值计算)SAS程序:
optionsnodate;datatfrc;doi=1to10;inputy;inputn;doj=1ton;output;end;end;cards;202401608802910054120631406816051180182006;run;procmeansmeanstdskewnesskurtosis;vary;run;结果见下表:
TheSASSystemAnalysisVariable:
YMeanStdDevSkewnessKurtosis-126.533333332.8366112-0.2056527-0.0325058-从频数分布图可以看出,该分布的众数在第七组,即总纹脊数的中值为140的那一组。
分布不对称,平均数略小于众数,有些负偏。
偏斜度为-0.2056527,偏斜的程度不是很明显,基本上还可以认为是对称的,峭度几乎为零。
1.13海南粗榧叶长度的频数分布4:
叶长度/mm中值频数2.02.22.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 课后 习题 答案