抽样复习的题目下2.docx
- 文档编号:5425990
- 上传时间:2022-12-16
- 格式:DOCX
- 页数:9
- 大小:36.76KB
抽样复习的题目下2.docx
《抽样复习的题目下2.docx》由会员分享,可在线阅读,更多相关《抽样复习的题目下2.docx(9页珍藏版)》请在冰豆网上搜索。
抽样复习的题目下2
《抽样调查》复习题
概述
1.1结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由;
1.研究居住在某城市所有居民的食品消费结构;抽样调查
2.调查一个县各村的粮食播种面积和全县生猪的存栏头数;全面调查
3.为进行治疗,调查一地区小学生中患沙眼的人数;全面调查
4.估计一个水库中草鱼的数量;抽样调查
5.某企业想了解其产品在市场的占有率;抽样调查
6.调查一个县中小学教师月平均工资。
全面调查
1.2结合习题1.1的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。
答:
全面调查:
是一种有策划、有方法、有程序的活动,调查的结果一般表现为搜集的数据。
抽样调查:
为某一特定目的而对部分考查对象进行的调查
1.3某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。
试问这是不是一项抽样调查?
样本抽取是不是属于概率抽样?
为什么?
答:
属于抽样调查,属于概率抽样,每一个样本单元被选中入样的概率是已知的。
1.5结合习题1.3的讨论,根据你的理解什么是概率抽样?
什么是非概率抽样?
它们各有什么优点?
答:
非概率抽样:
优点:
操作简单,调查数据的处理较容易,省时,省费用。
概率抽样:
根据随机原则,按照事先设计的程序,从总体抽取部分单元的抽样方法(要
求每一个样本单元被选中入样的概率是已知的)
优点:
1.6抽样调查的特点。
答:
1、节约费用2、时效性强3、完成全面调查不能胜任的项目4、有助于提高数据
抽样调查基本原理
2.1试说明以下术语或概念之间的关系与区别;
1.总体、样本与个体;总体:
是指所要研究对象的全体,它由研究对象中所有性质相同的
个体组成,组成总体的各个个体称为总体单元或单位。
抽样总体:
是指从中抽取样本的总体。
2.总体与抽样框;
总体与抽样框应保持一致
抽样框:
是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。
抽样总体的具体表现是抽样框。
3.个体、抽样单元与抽样框。
抽样单元是构成抽样框的基本要素,抽样单元可以只包含一个个体,也可以包含若干个个体,抽样单元还可以分级。
22试说明以下术语或概念之间的关系与区别;
1.均方误差、方差与偏倚;
方差:
V(?
)E?
E(?
)
偏倚:
B(?
)【E(?
)]
均方误差:
mrOv(?
)
2.方差、标准差与标准误;
S2
vy^^s2方差:
Nn
3.无偏估计、祥和估计量与可用估计量;
4.绝对误差限、置信限(置信区间)与置信度。
2.3从某个总体抽取一个n=50的独立同分布样本,样本数据如下:
567601665732366937462619279287
690520502312452562557574350875
834203593980172287753259276876
69237188764139944292744291811
17841640521058797746153644476
1.计算样本均值y与样本方差s2;
2.若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;
3.根据上述样本数据,如何估计v(y)?
4•假定y的分布是近似正态的,试分别给出总体均值卩的置信度为90%,95%,的(近似)
置信区间。
2.4样本可能数目及其意义;
答:
绝对误差
r
相对误差
均值估计时样本量n的确定
t2S2
no—T-
(1)
按绝对误差d决定样本nd
比例估计时样本量n的确定
(2)按相对误差r决定样本n
2.5影响抽样误差的因素;
答:
抽样误差:
抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异。
估计量方差及估计量标准差都为抽样误差的表现形式。
2.6抽样分布及其意义;
简单随机抽样
3.1设总体N=5,其指标值为{3,5,6,7,9}
1.从中抽取n=2的随机样本,分别计算不放回抽样的方差V®);
3.按不放回抽样的分别列出所有可能的样本并计算y,验证E(y)=Y;
4.按不放回抽样的所有可能的样本,计算其方差v(y),并与公式计算的结果进行比较;
5.对所有的可能样本计算样本方差s2,并验证在不放回的情况下:
E(s2)=S2。
3.2在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06
公顷的方形样地,测得这50块样地的平均储蓄量为9m3,标准差为1.63m3,试以95%的置信度估计该林场的木材储蓄量。
3.3某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。
采用简单随
机抽样抽选了100户,得y=12.5,s2=1252。
估计该居民区的总用水量95%的置信区间。
若要求估计的相对误差不超过20%,试问应抽多少户做样本?
3.4某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:
分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修
正系数可忽略)。
3.5从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,
试以95%的置信度估计这批单据中有错误的比例。
若已知这批单据共1000张,你
的结论有何变化?
若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样
本?
3.6欲调查二种疾病的发病率,疾病A的发病率较高,预期为50%;
疾病B的发病率预期为1%。
若要得到相同的标准差0.5%,采用简单随机抽样各需要多
大的样本量?
试对上述不同的结果加以适当的说明。
3.7简单随机抽样中样本量确定的原则及主要考虑因素;
3.8总体方差的预先确定思路。
分层抽样
4.1一公司希望估计某一个月内由于事故引起的工时损失。
因工人、技术人员及行政管
理人员的事故率不同,因而采用分层抽样。
已知下列资料:
工人
技术人员
行政管理人员
N1=132
N2=92
N3=27
Si2=36
S22=25
S32=9
若样本量n=30,试用奈曼分配确定各层的样本量。
nh
nWhSh
nWSh
nk
nk
WhSh
NhSh
h1
h1
(h
1,2丄丄)
4.2
上题中若实际调查了18
个工人,10个技术人员,2个行政人员,其中损失的工时
数如下:
工人
技术人员
行政管理人员
8,24,0,0,16,32,
4,5,0,24,8,12,3,
1,8
6,0,16,7,4,4,9,5,
2,1,8
8,18,2,0
试估计总的工时损失数并给出它的置信度为95%的置信区间。
4.3调查某个地区的养牛头数,以村作为抽样单元。
根据村的海拔高度和人口密度划分成
四层,每层取10个村作为样本单元,经过调查获得下列数据
层
村总数
样本村养牛头数
1
23
4
5
6789
10
1
1411
43
8498
0
10
440124
130
2
4705
50
14762
87
84
158170104
56160
3
2558
228262110
232
1391783340
63220
4
14997
17
3425
34
36
0257
1531
要求:
(1)估计该地区养牛总头数丫及其估计量的相对标准误差s(Y?
)Y?
(2)讨论分层抽样与不分层抽样比较效率有否提高。
(3)若样本量不变采用乃曼分配可以减少方差多少?
4.5用下面的工厂分组资料
按工人人数分组
工厂数目
每工厂产值(万元)
标准差
1—49
50—99
100—249
250—999
1000人以上
18260
4315
2233
1057
567
100
250
500
1760
2250
80
200
600
1900
2500
若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率
(1)按工厂数多少分配样本;
4.6设费用函数具有形式Ct
L
Co5Jnh,其中Co,5(h=1,…丄)均为已知数。
试
h1
证明当总的费用固定时,为了使
V(yst)达到最小,
22nh必与"
)23成比例。
(2)按奈曼分配。
4.7怎样分层能提高精度?
4.8总样本量在各层间分配的方法有哪些?
答:
按比例分配、按最优分配、按奈曼分配
4.9分层的原则及其意义。
答:
若分层的目的为了便于组织或估计子总体的参数,则分层按自然或单元的类型来划分。
若分层的目的为了提高抽样效率,则分层的主要原则为:
层内方差尽量小,而层间方差尽量大。
比估计与回归估计
5.1对以下假设总体(N=6)
U1U2U3U4U5U6
Xi
Yi
0135810
1311182946
(1)用简单随机抽样抽取n=2的样本,列出所有可能的样本计算每个样本的R。
R是不是
无偏的?
若有偏,偏倚多大?
(2)若用n=2的简单样本去估计总体总量Y,试比较比估计与简单估计的方差。
5.2欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机
抽样抽取14户为样本,经调查每户的食品支出yi与总收入Xi的数据如下表:
样本户
总收入Xi
食品支出yi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
25100
32200
29600
35000
34400
26500
28700
28200
34600
32700
31500
30600
27700
28500
3800
5100
4200
6200
5800
4100
3900
3600
3800
4100
4500
5100
4200
4000
要求估计食品支出占收入比重的95%置信度的置信区间。
5.3某乡欲估计今年的小麦总产量,全县共有123个村,按简单随机抽样抽取13个村作
为样本,取得资料如下:
样本村
去年的小麦产量(百斤)
今年的小麦产量(百斤)
1
2
550
720
610
780
3
1500
1600
4
1020
1030
5
620
600
6
980
1050
7
928
977
8
1200
1440
9
1350
1570
10
1750
2210
11
670
980
12
729
865
13
1530
1710
(1)若已知去年的小麦总产量为128200(百斤),采用比估计法估计今年的小麦总产
量和置信度为95%的置信区间。
(2)估计每个村的平均小麦产量及估计的相对标准差。
5.6回归估计、比估计与简单估计间的区别;
5.7辅助变量的选择原则;
5.8分别比估计与联合比估计间的区别;
5.9分别回归估计与联合回归估计间的区别;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 复习 题目