统计学习题.docx
- 文档编号:30200739
- 上传时间:2023-08-07
- 格式:DOCX
- 页数:18
- 大小:131.66KB
统计学习题.docx
《统计学习题.docx》由会员分享,可在线阅读,更多相关《统计学习题.docx(18页珍藏版)》请在冰豆网上搜索。
统计学习题
第五章参数估计
一、单项选择题
1.区间
±2.58
的含义是()。
A.99%的总体均数在此范围内B.样本均数的99%可信区间
C.99%的样本均数在此范围内D.总体均数的99%可信区间
答案:
D
2.以下关于参数估计的说法正确的是()。
A.区间估计优于点估计
B.样本含量越大,参数估计准确的可能性越大
C.样本含量越大,参数估计越精确
D.对于一个参数只能有一个估计值
答案:
B
3.以下关于参数点估计的说法正确的是()。
A.CV越小,表示用该样本估计总体均数越可靠
B.
越小,表示用该样本估计总体均数越准确
C.
越大,表示用该样本估计总体均数的可靠性越差
D.S越小,表示用该样本估计总体均数越可靠
答案:
C
4.假定抽样单位数为400,抽样平均数为300和30,相应的变异系数为50%和20%,试以0.9545的概率来确定估计精度为()。
A.15和0.6B.5%和2%
C.95%和98%D.2.5%和1
答案:
C
5.根据10%抽样调查资料,甲企业工人生产定额完成百分比方差为25,乙企业为49。
乙企业工人数四倍于甲企业,工人总体生产定额平均完成率的区间()。
A.甲企业较大B.乙企业较大
C.两企业一样D.无法预期两者的差别
答案:
A
6.对某轻工企业抽样调查的资料,优质品比重40%,抽样误差为4%,用多大的概率才能确信全及总体的这个指标不小于32%()。
A.0.6827B.0.9545
C.0.9973D.2.00
答案:
B
7.根据抽样调查的资料,某城市人均日摄入热量2500千卡,抽样平均误差150千卡,该市人均摄入热量在2350千卡至2650千卡之间的置信度为()。
A.0.9545B.0.6827
C.1D.0.90
答案:
B
8.对进口的一批服装取25件作抽样检验,发现有一件不合格。
概率为0.9545时计算服装不合格率的抽样误差为7.3%。
要使抽样误差减少一半,必须抽()件服装做检验。
A.50B.100
C.625D.25
答案:
B
9.根据以往调查的资料,某城市职工平均每户拥有国库券和国债的方差为1600,为使极限抽样误差在概率保证程度为0.9545时不超过4元,应抽取()户来进行调查。
A.I600B.400
C.10D.200
答案:
B
10.一般情况下,总体平均数的无偏、有效、一致的估计量是()。
A.样本平均数B.样本中位数
C.样本众数D.不存在
答案:
A
11.参数估计的置信度为1-α的置信区间表示()。
A.以1-α的可能性包含了未知总体参数真值的区间
B.以α的可能性包含了未知总体参数真值的区间
C.总体参数取值的变动范围
D.抽样误差的最大可能范围
答案:
A
12.无偏性是指()。
A.抽样指标等于总体指标B.样本平均数的平均数等于总体平均数
C.样本平均数等于总体平均数D.样本成数等于总体成数
答案:
B
13.一致性是指当样本的单位数充分大时,抽样指标()。
A.小于总体指标B.等于总体指标
C.大于总体指标D.充分靠近总体指标
答案:
D
14.有效性是指作为优良估计量的方差与其他估计量的方差相比,有()。
A.前者小于后者B.前者大于后者
C.两者相等D.两者不等
答案:
A
15.在进行纯随机重复抽样时,为使抽样平均误差减少25%,则抽样单位数应()。
A.增加25%B.增加78%
C.增加1.78%D.减少25%
答案:
B
16.某地订奶居民户均牛奶消费量为120公斤,抽样平均误差为2公斤。
据此可算得户均牛奶消费量在114-126公斤之间的概率为()。
A.0.9545B.0.9973
C.0.683D.0.900
答案:
B
17.根据抽样调查的资料,某企业生产定额平均完成百分比为165%,抽样平均误差为1%。
概率0.9545时,可据以确定生产定额平均完成百分比为()。
A.不大于167%B.不小于163%和不大于167%
C.不小于167%D.不大于163%和不小于167%
答案:
B
18.对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%。
概率为0.9545,优等生比重的极限抽样误差为()。
A.4.0%B.4.13%
C.9.18%D.8.26%
答案:
D
19.设μp为标准正态分布的上侧p分位数,则不正确的有()。
答案:
B
20.设X~N(μ,σ2)σ为未知,从中抽取n=16的样本,其样本均值为
,样本标准差为s,则总体均值的置信度为95%的置信区间为()。
答案:
C
21.已知σ2的1-α置信区间为,该区间也可表示为()。
(D)以上答案都不正确
答案:
B
二、多项选择题
1.在区间估计中,如果其他条件保持不变,置信度与精确度之间存在下列关系()。
A.前者愈低,后者也愈低B.前者愈高,后者也愈高
C.前者愈低,后者愈高D.前者愈高,后者愈低
E.两者呈相反方向变化
答案:
CDE
2.下面哪些是影响必要样本容量的因素()。
A.总体各单位标志变异程度B.允许的极限误差大小
C.推断的可靠程度D.抽样方法和抽样组织方式
E.样本均值和样本统计量
答案:
ABCD
3.评价估计量是否优良的常用标准有()。
A.无偏性B.有效性
C.准确性D.一致性
E.随机性
答案:
ABC
4.点估计()。
A.考虑了抽样误差大小B.没有考虑抽样误差大小
C.能说明估计结果的把握程度D.是抽样估计的主要方法
E.不能说明估计结果的把握程度
答案:
BE
5.在其它条件不变时,抽样推断的置信度1-α越大,则()。
A.允许误差范围越大B.允许误差范围越小
C.抽样推断的精确度越高D.抽样推断的精确度越低
E.抽样推断的可靠性越高
答案:
BE
6.要增大抽样推断的可信程度,可采用的方法有()。
A.增加样本数目B.增大显著性水平α
C.增大抽样误差范围D.缩小抽样误差范围
E.减小显著性水平α
答案:
ACE
7.在简单重复随机抽条件下,欲使误差范围缩小1/2,其他要求保持不变,则样本容量必须()。
A.增加2倍B.增加3倍
C.增加到4倍D.减少2倍
E.减少3倍
答案:
BC
8.根据抽样调查,某地区10户居民家庭月消费(元)与月收人的资料,配合了反映家庭消费收入关系的回归方程。
当置信度为95%、月收入为1500元时,y0的置信区间为1275—1725,这表示()。
A.月收入1500元的10户家庭月消费介于1275—1725之间
B.该地区所有家庭月消费在1275—1725元之间
C.该地区有95%的家庭月消费在1275—1725元之间
D.有95%的把握判断该地区月收人为1500元的家庭月消费介于1275—1725元之间
E.该地区月收入为1500元的家庭月消费不在1275—1725元之间的概率为5%
答案:
DE
9.设
是一个样本,则样本标准差的计算公式正确的有()。
答案:
ACD
10.抽样平均误差是()。
A.反映样本指标与总体指标的平均误差程度
B.样本指标的标准差
C.样本指标的平均差
D.计算抽样极限误差的衡量尺度
E.样本指标的平均数
答案:
ABD
11.影响样本容量大小的因素是()。
A.抽样的组织形式B.样本的抽取方法
C.总体标准差大小D.抽样估计的可靠程度
E.允许误差的大小
答案:
ABCDE
12.正态标准差σ的1-α置信区间依赖于()。
A.样品均值B.样本方差
C.样本标准差D.t分布的分位数
E.χ2分布的分位数
答案:
BCE
三、名词解释
1.统计推断2.置信区间3.参数估计4.抽样分布5.充分估计量
[参考答案]
1.统计推断:
通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statisticalinference)。
2.置信区间:
按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的置信区间(confidenceinterval,CI)。
它的确切含义是:
置信区间包含总体参数的可能性是1-
,而不是总体参数落在该范围的可能性为1-
。
3.参数估计:
指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:
点估计和区间估计。
4.样本统计量的分布称作抽样分布。
5.如果一个估计量能够利用样本所提供的关于被估计参数的全部信息,就称这个估计量是充分估计量。
四、简答题
1.点估计与区间估计有什么区别?
2.什么是抽样误差?
影响抽样误差大小的因素有哪些?
3.什么是样本统计量,它和总体参数有什么样区别和联系?
4.简述极大似然估计和点估计的基本思想?
5.影响必要样本容量的主要因素有哪些?
分别说明如何影响?
[参考答案]
1.点估计指从总体中抽取一个样本,根据该样本的统计量对总体的未知参数做出一个数值点的估计。
用一个置信区间去估计总体参数的方法,称为区间估计。
2.抽样误差指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
抽样误差之所以不同于登记误差和系统误差是因为登记误差和系统误差都属于思想、作风、技术问题,可以防止或避免;而抽样误差则是不可避免的,只能加以控制。
影响抽样误差大小的因素有:
总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。
3.在进行参数估计时,我们并不是直接用一个个的具体样本之来估计、推断总体参数,而是根据样本构造出一些特定的量,用这些特定量来估计总体参数,这些根据样本构造的特定量就称为样本统计量。
在估计过程中,我们把用来推估总体参数的样本统计量称为估计量。
4.我们把用样本的矩作为相应(同类、同阶)总体矩的估计的方法称为矩估计法。
具体来说矩估计法可以通过原点矩法和中心矩法来实现对矩估计量的求解。
假设总体的分布形式已知,只是不知总体分布的某个(或某些)参数
,抽样后,可以得到一组样本值,根据样本与总体的关系,找出使样本值出现的可能性最大的那个参数估计值
,则该估计值就是待估参数的极大似然估计值。
5.主要因素有:
总体的变异程度、最大绝对误差
的大小、置信度
的高低在其它条件相同的情况下,具有较大方差(即变异程度大)的总体需要较大容量的样本,具有较小方差的总体可以选择较小容量的样本。
如果要求的精确度高,即最大允许抽样误差小,那么样本容量就要大些;如果要求估计的精确度不高,即最大允许抽样误差大,则样本容量就可以小些。
在其他条件不变的情况下,如果要求估计的结果具有较高的可信程度,即较高的置信度,则需要较大的样本容量;反之,则可相应减少样本容量。
五、计算题
1.已知在文学家肖伯纳的
设
今自该书中随机的抽取20个句子。
这些句子的单词数分别为52,24,15,67,15,22,63,26,16,32,7,33,28,14,7,29,10,6,59,30。
问这本书中一个句子字数的均值的极大似然估计值等于多少?
[参考答案]
28.306
2.现有一大批种子,为了估计其发芽率,随机抽取400粒进行发芽试验。
结果有15粒每发芽。
试以90%的置信度估计这批种子的发芽率。
[参考答案]
[0.95,0.97]
3.设总体X服从参数
的泊松分布,其概率分布率为
,
x=0,1,2,……试求参数
的极大似然估计量及矩估计量。
[参考答案]
极大似然估计和矩估计均为
4.美国人每晚的睡眠时间变化不大,总体中12%的人睡眠少于六小时,3%的人睡眠时间超过八小时,(TheMacmillanVisualAlmanac,1996)。
由25名美国人组成的样本中每晚睡眠时间的数据如下:
6.97.66.56.25.37.87.05.57.66.77.36.67.16.96.06.86.57.25.88.67.67.16.07.27.7
A.求每晚睡眠时间总体均值的点估计。
B.假定总体是正态分布,求总体均值的点估计的95%置信区间。
[参考答案]
A.6.86,B.[6.54,7.18]
5.在某地方选举进行以前展开的民意测验表明,在随机抽取的121名居民中有65名支持某候选人,试求该候选人支持率的信赖区间。
(
=5%)
[参考答案]
0.54-0.089=0.451
0.54+0.089=0.629
所以该候选人支持率的置信区间为[0.451,0.629].
6.从某系一年级学生中随机抽取的10名学生所提供的年龄资料是:
18,19,18,18,20,17,18,19,18,19。
求该系一年级学生平均年龄95%的置信区间。
[参考答案]
所以该系一年级学生平均年龄95%的置信区间[17.79,19.01]
7.在对一种新生产方法进行测试过程中,随机选出9名员工,由他们尝试新方法。
结果这9名员工使用新生产方法的平均生产率是每小时60个零件,而抽样总体标准差为每小时8个零件。
试求这一新生产方法的平均生产率的置信区间(
)。
[参考答案]
当
=5%时,
8.某医院欲估计一名医生花在每个病人身上的平均时间。
假如要求置信度为95%,允许的误差范围在
2分钟。
且依以前的经验看病时间的标准差为6分钟。
试问需要多大的样本?
[参考答案]
9.某公司新推出一种营养型豆奶,为做好促销工作随机地抽取顾客作为样本,并问他们是否喜欢此豆奶,如果要使置信度为95%,抽样误差不超过0.05,则在下列情况下,你建议样本的容量为多大?
A.假如初步估计,约有60%的顾客喜欢此豆奶。
B.假如没有任何资料可用来估计大约有多少比率的顾客会喜欢此豆奶。
[参考答案]
10.在某乡2万亩水稻中按重复抽样方法抽取400亩,得知平均亩产量为609斤,样本标准差为80斤。
要求以95.45%(t=2)的概率保证程度估计该乡水稻的平均亩产量和总产量的区间范围.
[参考答案]
已知:
N=40000,n=400,
=609斤,б=80,t=2
样本平均误差
(斤)
允许误差Δx=tμx=2×4=8(斤)
平均亩产范围
=
±Δx609-8≤
≤609+8即601—617(斤)
总产量范围:
601×20000--617×20000即1202—1234(万斤)
六、综合应用题
1.某生化实验室测定了几组人的血清甘油三酯含量(mg%)见表4-9,试分析比较工人与干部,男与女的该项血酯水平。
表4-9正常成人按不同职业、性别分类的的血清甘油三酯含量(mg%)
人数
平均数
标准差
工人
112
106.49
29.09
干部
106
95.93
26.63
男
116
103.91
27.96
女
102
97.93
28.71
[参考答案]
本题可通过计算两均数差值的95%或99%可信区间来判断两总体均数的差别。
工人与干部均数差值的95%和99%可信区间分别为:
(3.10,18.02),(0.73,20.39),均不包含0在内,故可认为工人与干部血清甘油三酯含量的总体均属有差别。
男性与女性均数差值的95%和99%可信区间分别为:
(-1.60,13.56),(-4.01,15.97),均包含0在内,故尚不能认为男性与女性血清甘油三酯含量的总体均属有差别。
2.某单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下:
68898884868775737268
75829958815479769576
71609165767276858992
64578381787772617087
要求:
(1)根据上述资料按成绩分成以下几组:
60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列;
(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?
[参考答案]
(1)根据抽样结果和要求整理成如下分布数列:
考试成绩(分)
职工人数(人)
频率(%)
60及以下
60-70
70-80
80-90
90-100
3
6
15
12
4
7.5
15.0
37.5
30.00
10.00
合计
40
100.00
(2)根据次数分配数列计算样本平均数和标准差
=55×7.5%+65×15%+75×37.5%+85×30%+95.5×10%=77(分)
全体职工考试成绩区间范围是:
下限=
;上限=
即全体职工考试成绩区间范围在73.66分—80.3分之间。
(3)若其它条件不变,将允许误差范围缩小一半,应抽取的职工数为:
(人)
3.某电子产品使用寿命在3000小时以下为次品,现在用简单随机抽样方法,从5000个产品中抽取100个对其使用寿命进行测试。
其结果如下:
电子产品使用寿命表
使用寿命(小时)
产品个数
3000以下
3000—4000
4000—5000
5000以上
2
30
50
18
合计
100
根据以上资料,要求:
(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。
(2)按重复抽样和不重复抽样计算该产品次吕率的抽样平均误差。
(3)以68.27%的概率保证程度,对该产品的平均使用寿命和次品率进行区间估计。
[参考答案]
(1)重复抽样73.1,不重复抽样72.4
(2)重复抽样1.4%,不重复抽样1.39%
(3)按重复抽样计算,平均使用寿命4266.9,4413.1
次品率为0.6%,3.4%
4.某进出口公司出口一种名茶,为检查其每包规格的质量,抽取样本100包,检验结果如下:
每包重量(克)
包数(包)
148-149
10
149-150
20
150-151
50
151-152
20
合计
100
按规定这种茶叶每包规格重量应不低于150克。
试以99.73%的概率保证程度(t=3):
(1)确定每包平均重量的极限误差;
(2)估计这批茶叶每包重量的范围,确定是否达到规格要求。
[参考答案]
(1)极限误差为0.26
(2)重量估计区间:
(150.04,150.56),达到要求。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 习题