统计学基础课后练习答案贾俊平编著Word下载.docx
- 文档编号:18947046
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:48
- 大小:31.58KB
统计学基础课后练习答案贾俊平编著Word下载.docx
《统计学基础课后练习答案贾俊平编著Word下载.docx》由会员分享,可在线阅读,更多相关《统计学基础课后练习答案贾俊平编著Word下载.docx(48页珍藏版)》请在冰豆网上搜索。
按使用寿命分组(小时)灯泡个数(只)频率(%)
650~66022
660~67055
670~68066
680~6901414
690~7002626
700~7101818
710~7201313
720~7301010
730~74033
740~75033
合计100100
(2)直方图如下:
从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
4
茎叶图与直方图所反映的数据分布是一致的,不同的是茎叶图中保留了原始数据。
2.5
(2)食品重量的频数分布的直方图如下:
(3)从直方图可以看出,食品重量的分布基本上是对称分布。
5
2.6
从直方图可以看出,零件重量误差的分布基本上是对称的。
2.7
(1)属于数值型数据。
(2)为绘制直方图,首先对数据进行分组,将数据用5作为组距进行分组,得到
6
(3)根据分组数据绘制的直方图如下:
从直方图可以看出,该城市1~2月份气温的分布基本上是对称的,温度在-10~-5度之间的天数最多。
2.8
(1)成人自学考试年龄分布的直方图如下:
(2)从直方图可以清楚地看出,成人自学考试人员年龄的分布为右偏,也就是年龄在21岁~24岁的人占绝大比例,而年龄在40岁以上的人所占的比例很小。
7
(2)中茎叶图可以看出,A班考试成绩的分布比较集中,且平均分数较高;
B班考试成绩的分布比A班分散,且平均成绩较A班低。
2.10散点图如下:
2.11
(1)对比条形图如下:
8
环形图如下(内环为甲班的成绩):
(2)从对比条形图可以看出,甲班考试成绩在中等水平的人数较多,而优秀和良好的人数则较少,不及格的人数也比乙班要多。
乙班则不同,考试成绩为优秀和良好的人数较多,而中等以下的人数则较少。
这说明乙班学生的平均成绩比甲班要好。
从环形图的百分比中也可以清楚地看出这一点。
(3)两个班考试成绩的雷达图如下:
9
从雷达图的形状可以看出,两个班考试成绩没有相似性。
2.12
(1)国产车和进口车销售量的对比条形图如下:
(2)国产车和进口车销售量的环形图如下:
10
2.13
(1)国内生产总值的线图如下:
2)第一、二、三产业国内生产总值的线图如下:
11
(
20XX年国各城市各月份的平均相对湿度的箱线图如下:
12
从箱线图可以看出,各城市的月平均相对湿度有较大差异。
离散程度较大的城市主要是北京和长春(箱子较大);
离散程度较小的是成都、广州和武汉(箱子较小);
相对湿度最大的城市主要有成都、广州、南京和武汉(中位数较大);
相对湿度最小的城市是兰州(中位数较小);
相对湿度分布比较对称的城市主要是北京、武汉、广州和兰州等(中位数大体上在箱子中间,最大值和最小值与箱子的距离大体相等);
相对湿度不对称的城市主要有南京、郑州等。
相对湿度存在极值的城市主要是长春和西安。
第3章数据的概括性度量
3.1
(1)众数:
M
中位数:
中位数位置
n010。
n1210125.5,Me1010210。
平均数:
i1xi
2414151042.5,QL
7.5nn496109.6。
(2)QL位置QU位置3n41047225.5。
12。
310
4,QU1212
(3)13
n
(x
s
i1
i
)
n1.49
4.2
(29.6)(49.6)(149.6)(159.6)
101
2222
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
3.2
(1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众
数,即
19
和
23
。
n12
2512
13
将原始数据排序后,计算的中位数的位置为:
中位数位置13个位置上的数值为23,所以中位数M
(2)QL位置
QU位置
n4254
6.25
e
,第
23。
,QL190.25(1919)19。
3254
18.75,QU250.75(27-25)26.5。
(3)平均数
xi
19151723
25
60025
24。
n11062251
6.65
(1924)(1524)(1724)(2324)
251
22
(4)偏态系数:
SK
25xi24
3
34
(251)(252)6.65
1.08。
峰态系数:
K
25(251)(xi24)3
(x
24)
24
(251)
(251)(252)(253)6.65
0.77。
(5)分析:
从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为
14
右偏,由于偏态系数大于1,所以偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
226397。
22
(2)
s5.56.67.87.8(5.57)(6.67)(7.87)(7.87)
91
1.97
7.20.71474.0880.714。
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:
v10.274;
v20.102。
由于v1v2,表明
第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
3.4
(1)
中位数位置i1xi822330n2274.1。
2722732272.5。
30115.5,Me
(2)QL位置
QU位置3047.5,QL25826122842912259.5。
287.5。
330
n22.5,QU
2(x
(3)s
i1i)n113002.730121.17。
15
3.5
(1)甲企业的平均成本
总成本总产量
210030001500210015
300020
150030
6600340
19.41。
乙企业的平均成本
325515001500325515
150020
6255342
18.29.
原因:
尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6
(1)平均数计算过程见下表:
按利润额分组200~300300~400400~500500~600600以上合计
k
组中值Mi250350450550650—
企业数fi1930421811120
Mifi
475010500189009900715051200
Mifin
51200120
426.67。
16
.4
(M
偏态系数:
ki1
)fi
ns
38534964
120116.485108744164
0.203。
3
8.4
120116.48
30.688。
3.7
(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本
上不受样本大小的影响。
(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8
(1)要比较男女学生体重的离散程度应该采用离散系数。
女生体重的离散系
数为v女
550
0.1,男生体重的离散系数为v男
560
0.08,所以女生的体
重差异大。
(2)男生:
602.2132(磅),s52.211(磅);
女生:
502.2110(磅),s52.211(磅);
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。
因此,男生中大约有68%的人体重在55kg到65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。
因此,女生中大约有95%的人体重在40kg到60kg之间。
17
3.9通过计算标准分数来判断:
zA
xAA
sA
115100
1;
zB
xBB
sB
425400
50
0.5。
该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以A项测试比较理想。
3.10通过标准分数来判断,各天的标准分数如下表:
日期周一周二
标准分数Z3-0.6
3.11
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影
响。
(2)成年组身高的离散系数:
vs幼儿组身高的离散系数:
vs
4.2172.1
0.024;
周三-0.2
周四0.4
周五周六周日-1.8
-2.2
周一和周六两天失去了控制。
2.571.3
0.035;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
3.12
(1)应该从平均数和标准差两个方面进行评价。
在对各种方法的离散程度进
行比较时,应该采用离散系数。
(2
18
从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。
从离散程度来看,三种方法的离散系数分别为:
vA2.13165.60.013,vB1.75128.730.014,vC2.77125.530.022。
方法A的离散程度最小。
因此应选择方法A。
3.13
(1)用方差或标准差来评价投资的风险。
(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。
(3)从投资风险角度看,应该选择风险较小的商业类股票。
当然,选择哪类股票还与投资者的主观判断有很大关系。
第4章抽样与参数估计
4.1
(1)已知:
5,n40,25,0.05,z0.05
样本均值的抽样标准差
(2)估计误差Ez21.96。
n54050.79。
1.55
21.96。
n40
4.2
(1)已知:
15,n49,120,0.05,z0.05
(2)估计误差Ez1.96。
n1549152.14。
4.20
n49
(3)由于总体标准差已知,所以总体均值的95%的置信区间为:
z1201.9615491204.20,即(115.8,124.2)。
n
4.3已知:
n100,85414,104560,0.05,z0.05由于总体标准差已知,所以总体均值的95%的置信区间为:
21.96。
19
z1045601.968541410456016741.144,即(87818.856,n
121301.144)。
4.4
(1)已知:
n100,81,s12,0.1,z0.121.645。
由于n100为大样本,所以总体均值的90%的置信区间为:
zs811.645122811.974,即(79.026,82.974)。
n
(2)已知:
0.05,z0.05
s
1.96。
由于n100为大样本,所以总体均值的95%的置信区间为:
z811.9612
812.352,即(78.648,83.352)。
(3)已知:
0.01,z0.012.58。
由于n100为大样本,所以总体均值的99%的置信区间为:
zs812.5812813.096,即(77.940,84.096)。
4.5
(1)已知:
25,3.5,n60,0.05,z0.05由于总体标准差已知,所以总体均值的95%的置信区间为:
z21.96。
2251.963.560250.89,即(24.11,25.89)。
2n
(2)已知:
119.6,s23.89,n75,0.02,z0.02
由于n75为大样本,所以总体均值的98%的置信区间为:
zs2.33。
119.62.3323.8975119.66.43,即(113.17,126.03)。
3.419,s0.974,n32,0.1,z0.121.645。
由于n32为大样本,所以总体均值的90%的置信区间为:
zs3.4191.6450.974323.4190.283,即(3.136,3.702)。
4.6
(1)已知:
总体服从正态分布,500,n15,8900,0.05,20
z0.0521.96。
由于总体服从正态分布,所以总体均值的95%的置信区间为:
z89001.965008900253.03,即(8646.97,9153.03)。
(2)已知:
总体不服从正态分布,500,n35,8900,0.05,z0.0521.96。
虽然总体不服从正态分布,但由于n35为大样本,所以总体均值的95%的置信区间为:
z89001.96500358900165.65,即(8734.35,9065.65)。
未知,n358900,s500,0.1,(3)已知:
总体不服从正态分布,
z0.121.645。
虽然总体不服从正态分布,但由于n35为大样本,所以总体均值的90%的置信区间为:
zs289001.645500358900139.03,即(8760.97,9039.03)。
n358900,s500,0.01,未知,(4)已知:
z0.012.58。
虽然总体不服从正态分布,但由于n35为大样本,所以总体均值的99%的置信区间为:
zs89002.58500358900218.05,即(8681.95,9118.05)。
4.7已知:
n36,当为0.1、0.05、0.01时,相应的z0.121.645、
z0.0521.96、z0.012.58。
根据样本数据计算得:
3.32,s1.61。
由于n36为大样本,所以平均上网时间的90%的置信区间为:
zs3.321.6451.61363.320.44,即(2.88,3.76)。
平均上网时间的95%的置信区间为:
21
zs3.321.961.6136
1.61
363.320.53,即(2.79,3.85)。
ns平均上网时间的99%的置信区间为:
z3.322.583.320.69,即(2.63,4.01)。
4.8已知:
总体服从正态分布,但未知,n8为小样本,0.05,
t0.052(81)2.365。
10,s3.46。
总体均值的95%的置信区间为:
ts2102.3653.468102.89,即(7.11,12.89)。
4.9已知:
总体服从正态分布,但未知,n16为小样本,0.05,
t0.052(161)2.131。
9.375,s4.113。
从家里到单位平均距离的95%的置信区间为:
ts29.3752.1314.1139.3752.191,即(7.18,11.57)。
4.10
(1)已知:
n36,149.5,0.05,z0.05
21.96。
由于n36为大样本,所以零件平均长度的95%的置信区间为:
z149.51.961.93
36149.50.63,即(148.87,150.13)。
2
(2)在上面的估计中,使用了统计中的中心极限定理。
该定理表明:
从均值为、方差为的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为、方差为2n的正态分布。
4.11
(1)已知:
总体服从正态分布,但未知,n50为大样本,0.05,
101.32,s1.63。
该种食品平均重量的95%的置信区间为:
zs101.321.961.6350101.320.45,即(100.87,101.77)。
45
500.9。
该种食品合格率的95%的n
(2)根据样本数据可知,样本合格率为p
置信区间为:
pzp(1p)2n0.91.960.9(10.9)
500.90.08,即(0.82,0.98)。
4.12已知:
总体服从正态分布,但未知,n25为小样本,0.01,
t0.012(251)2.797。
16.128,s0.871。
总体均值的99%的置信区间为:
ts216.1282.7970.8712516.1280.487,即(15.64,16.62)。
4.13已知:
总体服从正态分布,但未知,n18为小样本,0.1,
t0.12(181)1.740。
13.56,s7.80。
网络公司员工平均每周加班时间的90%的置信区间为:
ts213.561.7407.8013.563.20,即(10.36,16.76)。
4.14
(1)已知:
n44,p0.51,0.01,z0.0122.58。
总体总比例的99%的置信区间为:
pzp(1p)2n0.512.580.51(10.51)
440.510.19,即(0.32,0.70);
2
(2)已知:
n300,p0.82,0.05,z0.05
总体总比例的95%的置信区间为:
pzp(1p)21.96。
n0.821.960.82(10.82)
3000.820.04,即(0.78,0.86);
n1150,p0.48,0.1,z0.121.645。
总体总比例的90%的置信区间为:
23
pz
p(1p)
0.481.645
0.48(10.48)
1150
0.480.02,即(0.46,
0.50)。
4.15已知:
n200,p0.23,为0.1和0.05时,相应的z0.121.645,
z0.05
总体总比例的90%的置信区间为:
0.231.645
0.23(10.23)
200
0.230.05,即(0.18,
0.28)。
0.231.96
0.230.06,即(0.17,0.29)。
4.16已知:
1000,估计误差E200,0.01,z0.0122.58。
应抽取的样本量为:
n
4.17
(1)已知:
E0.02,0.40,0.04,z0.04应抽取的样本量为:
(z
)
2.58
1000
167。
2.05。
)
(1)E
2.05
0.40(10.40)0.02
2522。
E0.04,未知,0.05,z0.05由于未知,可用使用0.5。
1.96
0.50(10.50)0.04
601。
E0.05,0.55,0.1,z0.121.645。
1.645
0.55(10.55)0.05
268。
4.18
(1)已知:
n50,p32
500.64,0.05,z0.051.96。
总体中赞成该项改革的户数比例的95%的置信区间为:
pzp(1p)2n0.64
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 基础 课后 练习 答案 贾俊平 编著