生物统计学答案统计数据的收集与整理.docx
- 文档编号:2434075
- 上传时间:2022-10-29
- 格式:DOCX
- 页数:17
- 大小:210.72KB
生物统计学答案统计数据的收集与整理.docx
《生物统计学答案统计数据的收集与整理.docx》由会员分享,可在线阅读,更多相关《生物统计学答案统计数据的收集与整理.docx(17页珍藏版)》请在冰豆网上搜索。
生物统计学答案统计数据的收集与整理
第一章统计数据的收集与整理
1.1算术平均数是怎样计算的?
为什么要计算平均数?
答:
算数平均数由下式计算:
,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。
计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。
1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?
答:
标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。
1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?
答:
变异系数可以说是用平均数标准化了的标准差。
在比较两个平均数不同的样本时所得结果更可靠。
1.4完整地描述一组数据需要哪几个特征数?
答:
平均数、标准差、偏斜度和峭度。
1.5下表是我国青年男子体重(kg)。
由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。
根据表中所给出的数据编制频数分布表。
66
69
64
65
64
66
68
65
62
64
69
61
61
68
66
57
66
69
66
65
70
64
58
67
66
66
67
66
66
62
66
66
64
62
62
65
64
65
66
72
60
66
65
61
61
66
67
62
65
65
61
64
62
64
65
62
65
68
68
65
67
68
62
63
70
65
64
65
62
66
62
63
68
65
68
57
67
66
68
63
64
66
68
64
63
60
64
69
65
66
67
67
67
65
67
67
66
68
64
67
59
66
65
63
56
66
63
63
66
67
63
70
67
70
62
64
72
69
67
67
66
68
64
65
71
61
63
61
64
64
67
69
70
66
64
65
64
63
70
64
62
69
70
68
65
63
65
66
64
68
69
65
63
67
63
70
65
68
67
69
66
65
67
66
74
64
69
65
64
65
65
68
67
65
65
66
67
72
65
67
62
67
71
69
65
65
75
62
69
68
68
65
63
66
66
65
62
61
68
65
64
67
66
64
60
61
68
67
63
59
65
60
64
63
69
62
71
69
60
63
59
67
61
68
69
66
64
69
65
68
67
64
64
66
69
73
68
60
60
63
38
62
67
65
65
69
65
67
65
72
66
67
64
61
64
66
63
63
66
66
66
63
65
63
67
68
66
62
63
61
66
61
63
68
65
66
69
64
66
70
69
70
63
64
65
64
67
67
65
66
62
61
65
65
60
63
65
62
66
64
答:
首先建立一个外部数据文件,名称和路径为:
E:
\data\exer1-5e.dat。
所用的SAS程序和计算结果如下:
procformat;
valuehfmt
56-57='56-57'58-59='58-59'60-61='60-61'
62-63='62-63'64-65='64-65'66-67='66-67'
68-69='68-69'70-71='70-71'72-73='72-73'
74-75='74-75';
run;
dataweight;
infile'E:
\data\exer1-5e.dat';
inputbw@@;
run;
procfreq;
tablebw;
formatbwhfmt.;
run;
TheSASSystem
CumulativeCumulative
BWFrequencyPercentFrequencyPercent
-----------------------------------------------------
56-5731.031.0
58-5941.372.3
60-61227.3299.7
62-634615.37525.0
64-658327.715852.7
66-677725.723578.3
68-694515.028093.3
70-71134.329397.7
72-7351.729899.3
74-7520.7300100.0
1.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。
它们的平均数相等吗?
标准差相等吗?
能够解释为什么吗?
答:
用means过程计算,两个样本分别称为和,结果见下表:
TheSASSystem
VariableNMeanStdDev
----------------------------------------
Y11064.50000003.5039660
Y21063.90000003.1780497
----------------------------------------
随机抽出的两个样本,它们的平均数和标准差都不相等。
因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。
1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?
为什么?
本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?
答:
不是简单的随机样本。
从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。
应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。
1.8证明若用或编码时,前式是否仍然相等?
答:
(1)令
则平均数特性之③。
(2)令
则平均数特性之②。
用第二种编码方式编码结果,两式不再相等。
1.9有一个样本:
,设B为其中任意一个数值。
证明只有当
最小。
这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。
答:
令,为求使p达最小之B,令
则。
1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下[1]:
10.0
9.3
7.2
9.1
8.5
8.0
10.5
10.6
9.6
10.1
7.0
6.7
9.5
7.8
10.5
7.9
8.1
9.6
7.6
9.4
10.0
7.5
7.2
5.0
7.3
8.7
7.1
6.1
5.2
6.8
10.0
9.9
7.5
4.5
7.6
7.0
9.7
6.2
8.0
6.9
8.3
8.6
10.0
4.8
4.9
7.0
8.3
8.4
7.8
7.5
6.6
10.0
6.5
9.5
8.5
11.0
9.7
6.6
10.0
5.0
6.5
8.0
8.4
8.3
7.4
7.4
8.1
7.7
7.5
7.1
7.8
7.6
8.6
6.0
7.0
6.4
6.7
6.3
6.4
11.0
10.5
7.8
5.0
8.0
7.0
7.4
5.2
6.7
9.0
8.6
4.6
6.9
3.5
6.2
9.7
6.4
5.8
6.4
9.3
6.4
编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。
答:
首先建立一个外部数据文件,名称和路径为:
E:
\data\exr1-10e.dat。
SAS程序及结果如下:
optionsnodate;
procformat;
valuehfmt
3.5-4.4='3.5-4.4'4.5-5.4='4.5-5.4'5.5-6.4='5.5-6.4'
6.5-7.4='6.5-7.4'7.5-8.4='7.5-8.4'8.5-9.4='8.5-9.4'
9.5-10.4='9.5-10.4'10.5-11.4='10.5-11.4';
run;
datawheat;
infile'E:
\data\exr1-10e.dat';
inputheight@@;
run;
procfreq;
tableheight;
formatheighthfmt.;
run;
proccapabilitygraphicsnoprint;
varheight;
histogram/vscale=count;
insetmeanvarskewnesskurtosis;
run;
TheSASSystem
TheFREQProcedure
CumulativeCumulative
heightFrequencyPercentFrequencyPercent
---------------------------------------------------------------------
3.5-4.411.0011.00
4.5-5.499.001010.00
5.5-6.41111.002121.00
6.5-7.42323.004444.00
7.5-8.42424.006868.00
8.5-9.41111.007979.00
9.5-10.41515.009494.00
10.5-11.466.00100100.00
1.11北太平洋宽吻海豚羟丁酸脱氢酶(HDBH)数据的接收范围频数表[2]如下:
(略作调整)
HDBH数据的接收范围/(U·L-1)
频数
<214
1
<245.9091
3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 答案 统计数据 收集 整理