统计学答案.docx
- 文档编号:3543520
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:38
- 大小:32.53KB
统计学答案.docx
《统计学答案.docx》由会员分享,可在线阅读,更多相关《统计学答案.docx(38页珍藏版)》请在冰豆网上搜索。
统计学答案
1
附录1:
各章练习题答案
第1章绪论(略)
第2章统计数据的描述
2.1
(1)属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
(3)条形图(略)
2.2
(1)频数分布表如下:
40个企业按产品销售收入分组表
(2)某管理局下属40个企分组表
2.3频数分布表如下:
某百货公司日商品销售额分组表
服务质量等级家庭数(频率)频率%
A1414
B2121
C3232
D1818
E1515
合计100100
按销售收入分组
(万元)
企业数
(个)
频率
(%)
向上累积向下累积
企业数频率企业数频率
100以下
100~110
110~120
120~130
130~140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
5
14
26
33
37
40
12.5
35.0
65.0
82.5
92.5
100.0
40
35
26
14
7
3
100.0
87.5
65.0
35.0
17.5
7.5
合计40100.0————
按销售收入分组(万元)企业数(个)频率(%)
先进企业
良好企业
一般企业
落后企业
11
11
9
9
27.5
27.5
22.5
22.5
合计40100.0
按销售额分组(万元)频数(天)频率(%)
25~30
30~35
4
6
10.0
15.0
2
直方图(略)。
2.4
(1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
直方图(略)。
(3)茎叶图如下:
2.5
(1)属于数值型数据。
(2)分组结果如下:
(3)直方图(略)。
35~40
40~45
45~50
15
9
6
37.5
22.5
15.0
合计40100.0
按使用寿命分组(小时)灯泡个数(只)频率(%)
650~66022
660~67055
670~68066
680~6901414
690~7002626
700~7101818
710~7201313
720~7301010
730~74033
740~75033
合计100100
6518
6614568
67134679
6811233345558899
6900111122233445566677888899
70001122345666778889
710022335677889
720122567899
73356
74147
分组天数(天)
-25~-206
-20~-158
-15~-1010
-10~-513
-5~012
0~54
5~107
合计60
3
2.6
(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7
(1)茎叶图如下:
(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.8箱线图如下:
(特征请读者自己分析)
Min-Max
25%-75%
Medianvalue
35
45
55
65
75
85
95
2.9
(1)x=274.1(万元);Me=272.5;QL=260.25;QU=291.25。
(2)s=21.17(万元)。
2.10
(1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:
尽管两个企
业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了
总平均成本。
2.11x=426.67(万元);s=116.48(万元)。
2.12
(1)
(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差
的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范
围就可能越大。
2.13
(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2)男生:
x=27.27(磅),s=2.27(磅);
女生:
x=22.73(磅),s=2.27(磅);
(3)68%;
(4)95%。
2.14
(1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:
0.024;
172.1
=4.2=sv
A班
树茎
B班
数据个数树叶树叶数据个数
03592
14404484
297512245667778912
119766533211060112346889
23988777665555544433321007001134498
7665520081233456
663222090114566
0100003
4
幼儿组身高的离散系数:
0.032;
71.3
=2.3=sv
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对
较大。
2.15下表给出了一些主要描述统计量,请读者自己分析。
2.16
(1)方差或标准差;
(2)商业类股票;(3)(略)。
2.17(略)。
第3章概率与概率分布
3.1设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
3.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)。
考虑逆事件A=“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:
P(A)=(1.0.2)(1.0.1)(1.0.1)=0.648
于是P(A)=1.P(A)=1.0.648=0.352
3.3设A表示“合格”,B表示“优秀”。
由于B=AB,于是
P(B)=P(A)P(B|A)=0.8×0.15=0.12
3.4设A=第1发命中。
B=命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件
的概率即可求得脱靶的概率。
P(B)=P(A)P(B|A)+P(A)P(B|A)
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):
P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
3.5设A=活到55岁,B=活到70岁。
所求概率为:
(|)()()0.630.75
()()0.84
PBAPABPB
PAPA
====
3.6这是一个计算后验概率的问题。
设A=优质率达95%,A=优质率为80%,B=试验所生产的5件全部优质。
P(A)=0.4,P(A)=0.6,P(B|A)=0.955,P(B|A)=0.85,所求概率为:
方法A方法B方法C
平均165.6平均128.73平均125.53
中位数165中位数129中位数126
众数164众数128众数126
标准偏差2.13标准偏差1.75标准偏差2.77
极差8极差7极差12
最小值162最小值125最小值116
最大值170最大值132最大值128
5
0.6115
0.50612
0.30951
()(|)()(|)
(|)=()(|)==
PAPBAPAPBA
PABPAPBA
+
决策者会倾向于采用新的生产管理流程。
3.7令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。
由题意得:
P(A1)=0.25,
P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别
为:
(1)P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
(2)0.3506
0.0385
0.0135
0.250.040.300.050.450.03
(|)0.450.033==
++
=
×××
×PAB
3.8据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。
其概率分布如下表:
期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)
3.9设被保险人死亡数=X,X~B(20000,0.0005)。
(1)收入=20000×50(元)=100万元。
要获利至少50万元,则赔付保险金额应该不超过50
万元,等价于被保险人死亡数不超过10人。
所求概率为:
P(X≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为:
P(X>20)=1-P(X≤20)=1-0.99842=0.00158
(3)支付保险金额的均值=50000×E(X)
=50000×20000×0.0005(元)=50(万元)
支付保险金额的标准差=50000×σ(X)
=50000×(20000×0.0005×0.9995)1/2=158074(元)
3.10
(1)可以。
当n很大而p很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ=
np=20000×0.0005=10,即有X~P(10)。
计算结果与二项分布所得结果几乎完全一致。
(2)也可以。
尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用
正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,
即有X~N(10,9.995)。
相应的概率为:
P(X≤10.5)=0.51995,P(X≤20.5)=0.853262。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计
算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这
就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来
计算就会出现非常大的误差。
此时宜用泊松分布去近似。
3.11
(1))(1.6667)=0.04779
30
(150)(150200<.
.
PX<=PZ<=PZ
合格率为1-0.04779=0.95221或95.221%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
xi0123
P(X=xi)0.2160.4320.2880.064
6
(|200|){|||200|}0.9
3030
PXKPZXK.
.<==<≥
即:
{}0.95,K/30≥1.64485,故K≥49.3456。
30
PZ 3.12设X=同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2) (1)X的最可能值为: X0=[(n+1)p]=[7×0.2]=1(取整数) (2)ΣΣ= = >=.≤=.. 2 0 6 (2)1 (2)160.20.8 k PXPXCkkk =1-0.9011=0.0989 第4章抽样与抽样分布 4.1a.20,2b.近似正态c.-2.25d.1.50 4.2a.0.0228b.0.0668c.0.0062d.0.8185e.0.0013 4.3a.0.8944b.0.0228c.0.1292d.0.9699 4.4a.101,99b.1c.不必 4.5趋向正态 4.6.a.正态分布,213,4.5918b.0.5,0.031,0.938 4.7.a.406,1.68,正态分布b.0.001c.是,因为小概率出现了 4.8.a.增加b.减少 4.9.a.正态b.约等于0c.不正常d.正态,0.06 4.10a.0.015b.0.0026c.0.1587 4.11.a.(0.012,0.028)b.0.6553,0.7278 4.12.a.0.05b.1c.0.000625 第5章参数估计 5.1 (1)=0.79。 (2)E=1.55。 xσ 5.2 (1)=2.14。 (2)E=4.2。 (3)(115.8,124.2)。 xσ 5.3(2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4(7.1,12.9)。 5.5(7.18,11.57)。 5.6(18.11%,27.89%);(17.17%,22.835)。 5.7 (1)(51.37%,76.63%); (2)36。 5.8(1.86,17.74);(0.19,19.41)。 5.9 (1)2±1.176; (2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 5.10 (1)d=1.75,=2.63; (2)1.75±4.27。 ds 5.11 (1)10%±6.98%; (2)10%±8.32%。 5.12(4.06,14.35)。 5.1348。 5.14139。 5.1557。 7 5.16769。 第6章假设检验 6.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所 以原假设与备择假设应为: : 1035,。 0Hμ≤: 10351Hμ> 6.2π=“某一品种的小鸡因为同类相残而导致的死亡率”,: 0.04,。 0Hπ≥: 0.041Hπ< 6.3: 65,。 0Hμ=: 651Hμ≠ 6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验 结果却提供证据支持店方倾向于认为其重量少于60克; (2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果 却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 6.5 (1)检验统计量,在大样本情形下近似服从标准正态分布; sn zx / .μ = (2)如果0.05,就拒绝;z>z0H (3)检验统计量z=2.94>1.645,所以应该拒绝。 0H 6.6z=3.11,拒绝。 0H 6.7z=1.93,不拒绝。 0H 6.8z=7.48,拒绝。 0H 6.9χ2=206.22,拒绝。 0H 6.10z=-5.145,拒绝。 0H 6.11t=1.36,不拒绝。 0H 6.12z=-4.05,拒绝。 0H 6.13F=8.28,拒绝。 0H 6.14 (1)检验结果如下: t-检验: 双样本等方差假设 变量1变量2 平均100.7109.9 方差24.1157894733.35789474 观测值2020 合并方差28.73684211 假设平均差0 df38 tStat-5.427106029 P(T<=t)单尾1.73712E-06 t单尾临界1.685953066 P(T<=t)双尾3.47424E-06 t双尾临界2.024394234 t-检验: 双样本异方差假设 8 (2)方差检验结果如下: 第7章方差分析与试验设计 7.14.65748.0215(或),不能拒绝原假设。 0.01F= 7.217.06843.8853(或),拒绝原假设。 0.05F=>F=P.value=0.0003<α=0.05 x.x=44.4.30=14.4>LSD=5.85,拒绝原假设;AB x.x=44.4.42.6=1.8 x.x=30.42.6=12.6>LSD=5.85,拒绝原假设。 BC 7.3方差分析表中所缺的数值如下表: 1.4783.554131(或),不能拒绝原假设。 0.05F= 7.4有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用5种 种子和4种施肥方案搭配进行试验,取得的收获量数据如下表: 7.23973.2592(或),拒绝原假设。 0.05F=>F=种子P.value=0.0033<α=0.05 9.20473.4903(或),拒绝原假设。 0.05F= 7.50.07276.9443(或),不能拒绝原假设。 0.05F= 变量1变量2 平均100.7109.9 方差24.1157894733.35789474 观测值2020 假设平均差0 df37 tStat-5.427106029 P(T<=t)单尾1.87355E-06 t单尾临界1.687094482 P(T<=t)双尾3.74709E-06 t双尾临界2.026190487 F-检验双样本方差分析 变量1变量2 平均100.7109.9 方差24.1157894733.35789474 观测值2020 df1919 F0.722940991 P(F<=f)单尾0.243109655 F单尾临界0.395811384 差异源SSdfMSFP-valueFcrit 组间42022101.4780.2459463.354131 组内383627142.07——— 总计425629———— 9 3.12736.9443(或),不能拒绝原假0.05F= 设。 7.610.755.1432(或),拒绝原假设。 0.05F=>F=广告方案P.value=0.0104<α=0.05 35.9874(或),不能拒绝原假设。 0.05F= 1.755.1432(或),不能拒绝原假设。 0.05F= 第8章相关与回归分析 8.1 (1)利用Excel计算结果可知,相关系数为0.948138,说明相关程度较高。 XYr= (2)计算t统计量 22 20.9481381022.6817398.436851 11.9481380.317859 trn ro .×. ==== .. 给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值2为2.306,tα 显然2,表明相关系数r在统计上是显著的。 ttα> 8.2利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数为: - 0.34239,这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二 者负相关程度并不大。 相关系数检验: 在总体相关系数ρ=0的原假设下,计算t统计量: 22 20.342393121.9624 11(0.34239) trn r ..×. ===. ... 查t分布表,自由度为31-2=29,当显著性水平取α=0.05时,=2.045;当显著性水平α2t 取α=0.1时,=1.699。 α2t 由于计算的t统计量的绝对值1.9624小于α2=2.045,所以在的显著性水平下,tα=0.05 不能拒绝相关系数ρ=0的原假设。 即是说,在α=0.05的显著性水平下不能认为人均GDP与 第一产业中就业比例有显著的线性相关性。 但是计算的t统计量的绝对值1.9624大于α2=1.699,所以在的显著性水平下,可tα=0.1 以拒绝相关系数ρ=0的原假设。 即在α=0.1的显著性水平下,可以认为人均GDP与第一产业 中就业比例有一定的线性相关性。 8.3设当年红利为Y,每股帐面价值为X 建立回归方程i12iiY=β+βX+u 估计参数为 ^ 0.4797750.072876iiY=+X 参数的经济意义是每股帐面价值增加1元时,当年红利将平均增加0.072876元。 序号6的公司每股帐面价值为19.25元,增加1元后为20.25元,当年红利可能为: (元) ^ 0.4797750.07287620.251.955514i Y=+×= 8.4 (1)数据散点图如下: 10 0 0.2 0.4 0.6 0.8 1 1.2 1.4 6570758085 航班正点率(%) 投诉率(次/10万名乘客) (2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间 存在着一定的负相关关系。 (3)设投诉率为Y,航班正点率为X 建立回归方程i12iiY=β+βX+u 估计参数为 ^ i6.01780.07iY=.X (4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客) 下降0.07。 (5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为: .
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 答案