统计学复习题1.docx
- 文档编号:2283080
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:16
- 大小:183.79KB
统计学复习题1.docx
《统计学复习题1.docx》由会员分享,可在线阅读,更多相关《统计学复习题1.docx(16页珍藏版)》请在冰豆网上搜索。
统计学复习题1
第一章绪论
一、填空
1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。
2、由一组频数2,5,6,7得到的一组频率依次是0。
1、0。
25、0。
3和0。
35,如果这组频数各增加20%,则所得到的频率不变。
3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620。
4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___205351525___。
5、中位数可反映总体的集中趋势,四分位差可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是5.5,众数为5。
6、假如各组变量值都扩大2倍,而频数都减少为原来的1/3,那么算术平均数扩大为原来的2倍。
四、计算题
1、某班的经济学成绩如下表所示:
43
55
56
56
59
60
67
69
73
75
77
77
78
79
80
81
82
83
83
83
84
86
87
88
88
89
90
90
95
97
(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数
(2)计算该班经济学成绩的众数、四分位差和离散系数.
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?
(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?
(3)上四分位数和下四分位数所在区间?
4、对成年组和青少年组共500人身高资料分组,分组资料列表如下:
成年组
青少年组
按身高分组(cm)
人数(人)
按身高分组(cm)
人数(人)
150~155
155~160
160~165
165~170
170以上
22
108
95
43
32
70~75
75~80
80~85
85~90
90以上
26
83
39
28
24
合计
300
合计
200
要求:
(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数.
(2)说明成年组和青少年组平均身高的代表性哪个大?
为什么?
6、设甲、乙两单位职工的工资资料如下:
甲单位
乙单位
月工资(元)
职工人数(人)
月工资(元)
职工人数(人)
600以下
600-700
700-800
800-900
900-1000
1000-1100
2
4
10
7
6
4
600以下
600-700
700-800
800-900
900-1000
1000-1100
1
2
4
12
6
5
合计
30
合计
30
要求:
试比较哪个单位的职工工资差异程度小。
8、一家公司在招收职员时,首先要通过两项能力测试.在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?
KEY:
1、
(1)77,80。
5,68.5,87。
25
(2)83,18.75,0。
173
(3)中位数,是数据分布明显左偏又是顺序数据。
(4)左偏
身高(cm)
频数
组中值x
y
yf
y^2
(y^2)f
150~155
22
152.5
-2
—44
4
88
155~160
108
157.5
-1
-108
1
108
160~165
95
162.5
0
0
0
0
165~170
43
167。
5
1
43
1
43
170以上
32
172。
5
2
64
4
128
合计
300
—45
367
令
标准差:
标准差变异系数:
成人组的平均身高为161.75cm,标准差为5。
4784cm,标准差系数为0。
03387。
青少年组
身高(cm)
频率
组中值
y
yf
y^2
(y^2)f
70~75
26
72.5
-2
—52
4
104
75~80
83
77.5
-1
-83
1
83
80~85
39
82.5
0
0
0
0
85~90
28
87.5
1
28
1
28
90以上
24
92.5
2
48
4
96
合计
200
-59
311
令
标准差:
标准差变异系数:
成人组的平均身高为81。
025cm,标准差为6。
058cm,标准差系数为0。
074767.
(2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。
6、解:
第二章统计量及其分布习题
一、填空题
1、简单随机抽样样本均值的方差取决于样本量和总体方差_,要使的标准差降低到原来的50%,则样本容量需要扩大到原来的4倍.
2、设是总体的样本,是样本方差,若,则__32。
(注:
,,)
3、若,则服从_F(1,5)______分布。
4、已知,则等于____0.21_______。
5、中心极限定理是说:
如果总体存在有限的方差,那么,随着样本量的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于正态分布.
四、计算题
1、从正态总体中随机抽取容量为36的样本,要求:
(1)求样本均值的分布;
(2)求落在区间(50.8,53。
8)内的概率;
(3)若要以99%的概率保证,试问样本量至少应取多少?
这个简答题,我到时候发照片给你们吧!
第三章参数估计习题
一、填空题
1、无偏性、有效性和一致性是对估计量最基本的要求.
2、总体,是来自X的一个容量为3的样本,三个的无偏估计量中,最有效的一个是。
3、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为(0。
088,0.232)。
4、若总体X的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为0.5,总体方差的矩估计值为0。
25.
5、小样本,方差未知,总体均值的区间估计为。
四、计算题
1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8。
2厘米。
请确定该苗圃中树苗平均高度的置信区间,置信水平95%。
1、解:
该苗圃中树苗平均高度的置信水平为95%的置信区间为(59.99,64。
01)厘米。
第四章假设检验
填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章)
一、填空
1、在做假设检验时容易犯的两类错误是拒真错误和纳伪错误
2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 双侧检验 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 单侧检验
3、假设检验有两类错误,分别是拒真错误也叫第一类错误,它是指原假设H0是真实的,却由于样本缘故做出了拒绝H0的错误;和纳伪错误叫第二类错误,它是指原假设H0是假的,却由于样本缘故做出接受H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为显著性水平。
5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为小概率原理。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,在显著性水平α下,否定域为
下面有答案
7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为H0:
t≥1000H1:
t<1000(用H0,H1表示)
8、一般在样本的容量被确定后,犯第一类错误的概率为,犯第二类错误的概率为,若减少,则增大
9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率有(有,没有)达到该标准。
6、1。
25>
二、计算
1、下面是某个随机选取20只部件的装配时间(单位:
分)
9.810.410.69。
69.79。
910。
911.19。
610。
2
10.39.69。
911。
210.69。
810.510.110。
59.7
设装配时间的总体服从正态分布,参数均未知,可否认为装配时间的均值为10?
2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。
一直这种原件的寿命服从正态分布,标准差为100小时。
试求在显著性水平为0。
05下,确定厂家的声明是否可信?
4、在一批产品中抽40件进行调查,发现次品有6件,试按显著水平为0.05来判断该批产品的次品率是否高于10%.
KEY:
1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。
由题设知总体,均未知,要求在水平下检验假设
(1)因未知,采用t检验,取检验统计量为:
(2)由于n=20,=10。
2,s=0.51,,
(3)绝对域为:
(4)经计算即检验统计量不落在拒绝域内,故在水平下接受原假设H0,即认为装配时间均值可认为是10。
2、解:
HO:
1000cm
H1:
:
〈1000cm
代入数值,得到z==-2。
5
在显著性水平=0.05时,Z=1.96
〉Z,拒绝原假设HO。
结论:
该厂家的声称不可信。
4、解:
提出假设:
H0:
p≤10%
H1:
p〉10%
建立检验统计量:
P=6/40=0。
15
n=40
∴Z=1.05
对于显著性水平0.05,查正态分布表得1。
65,故接受原假设,可以认为该批产品的次品率不高于18%
一、填空
1、现象之间普遍存在的相互关系可以概括为两类:
一类是函数关系,另一类是相关关系。
2、在简单回归分析中,因变量y的总离差可以分解为回归平方和和残差平方和。
3、若相关系数为r=0。
92,表示两变量之间呈强正关系。
4、线性回归方程中,截矩的意义是当x=0时,y的期望值为10。
5、线性回归方程中,斜率的意义是X每增加一个单位,y平均下降0.8个单位
四、计算
1、下表是一小卖部某6天卖出热珍珠奶茶的杯数与当天气温的对比表.
气温(℃)
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
现在的问题是:
如果某天的气温是-5℃,这天小卖部大概要准备多少杯热珍珠奶茶比较好一些?
2、某种商品的需求量y(斤)和商品价格x(元)有关,现取得10对观测数据经计算得如下数据:
,
要求:
(1)计算相关系数;
(2)求y对x的线性回归方程(3)解释的意义.
3、某地区某企业近8年产品产量与生产费用的相关情况如下表所示:
年份
产品产量
(千吨)
生产费用
(万元)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 复习题