统计抽样PPT资料.ppt
- 文档编号:15487126
- 上传时间:2022-11-01
- 格式:PPT
- 页数:56
- 大小:314KB
统计抽样PPT资料.ppt
《统计抽样PPT资料.ppt》由会员分享,可在线阅读,更多相关《统计抽样PPT资料.ppt(56页珍藏版)》请在冰豆网上搜索。
1称为置信度,为与之对应的临界值。
例如,若置信度为95,则。
7.4.1总体均值,9/56,当从一个容量为N的有限总体中,抽取一个容量为n的简单随机样本时,均值的标准差的估计值为此时总体均值的区间估计为在抽样调查中,当构造置信区间时,通常取=2。
因此,在使用简单随机样本时,总体均值的近似95的置信区间的表达式为:
7.4.1总体均值,10/56,例7.1摄影是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有8000个订户。
根据一个484个订户的简单随机样本,得出订户的年平均收入为30500元,标准差为7040元。
因此,所有订户的年平均收入的无偏估计为元。
因此,这本杂志订户的年平均收入的近似95的置信区间为即(29880,31120)。
7.4.1总体均值,11/56,上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。
对点估计的抽样分布近似服从正态概率分布的所有情形,其近似95的置信区间为例如,在摄影的抽样调查中,点估计量的标准误差的估计值为,允许误差为2310元620元。
7.4.1总体均值,12/56,总体比率p是总体中具有某些感兴趣特征的个体的比重。
例7.2在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。
样本比率是总体比率的无偏点估计。
总体比率的标准差的估计值为因此,总体比率的近似95的置信区间的表达式如下:
7.4.2总体比率,13/56,例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的500所学校中,使用天然气作为取暖燃料的学校比率。
如果在抽出的50所学校中,有35所学校使用天然气作为取暖燃料,则总体500所学校中使用天然气比率的点估计值。
比率的标准差的估计值为因此,总体比率的近似95置信区间为即(0.5758,0.8242)。
7.4.2总体比率,14/56,回忆前面提到的允许误差为“点估计的标准差估计值的2倍”,因此:
均值的标准差的估计值:
7.4.3样本容量的确定,15/56,两步抽样,用试点调查或事先检验的结果估计s2,估计s2的方法,根据以往的资料估计s2,由第一步抽取的部分单位,得到的s2的估计值,将此值代入上式,确定出全部样本容量n;
然后对第一步确定的全部样本容量,再抽取第二步所需要的其余单位数。
7.4.3样本容量的确定,16/56,例7.3某大学有5000名毕业生,我们想构造宽度在1000元之内的近似95的置信区间。
对这样规定的置信区间,B500。
在确定n之前,需要估计。
假设根据去年所做的同样研究,得知s3000元。
我们可以用这个值来估计。
根据B=500、s3000及N5000,则样本容量为,7.4.3样本容量的确定,17/56,在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。
我们只需要将估计总体均值的公式中替换为,即使用上式时,我们必须规定允许误差B和给出的一个估计值。
如果没有合适的估计值,我们可以使用代替,这样将保证近似置信区间的允许误差比希望的要小的多。
7.4.3样本容量的确定,18/56,将总体划分H组,从第h层中抽取一个容量为nh的简单随机样本,由这H个简单随机样本的联合资料,可得出诸如总体均值、总体总量及总体比率等各种总体参数的估计。
分层简单随机抽样的步骤:
也称为层,7.5分层简单随机抽样,19/56,如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将更窄)。
各层的划分应依据样本设计者的判断。
总体可按部门、地区、年龄、产品类型、销售水平等分层。
7.5分层简单随机抽样,20/56,例7.4某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。
7.5分层简单随机抽样,21/56,在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比重。
用表示总体均值的点估计,其定义如下:
式中:
H-层数;
-第h层的样本均值;
Nh-第h层的单位数;
N-总体单位数;
对分层简单随机样本,计算平均值的标准差的估计公式为,7.5.1总体均值,22/56,某大学管理学院的180名毕业生的样本调查结果,7.5.1总体均值,23/56,各专业(层)的样本均值分别为:
因此,总体均值的点估计为,7.5.1总体均值,24/56,抽样调查中估计均值的标准差所需要的部分计算结果,7.5.1总体均值,25/56,上表中因此,总体的近似95的置信区间为即(29074,29626)。
7.5.1总体均值,26/56,对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权平均数,所用权数为总体在各层的比重。
总体比率的点估计定义如下:
-第h层的样本比率;
Nh第h层的单位数;
N总体单位数;
7.5.2总体比率,27/56,的标准差的估计值为总体比率的近似95的置信区间的表达式为,7.5.2总体比率,28/56,例7.5在某大学的调查中,大学想了解毕业生开始工作时的年薪不低于36000元的比率。
180名毕业生的抽样调查结果显示,有20名毕业生开始工作时的年薪不低于36000元,其中会计专业4名,金融专业2名,信息系统专业7名,市场营销专业1名,经营管理专业6名。
7.5.2总体比率,29/56,根据总体比率的近似95的置信区间的公式,开始工作时的年薪不低于36000元的比率的点估计为:
故毕业生开始时的年薪不低于36000元的比率近似95%置信区间为(0.0575,0.1387),7.5.2总体比率,30/56,对分层简单随机抽样,我们可用两阶段过程来选择样本容量。
既然人们想估计各层的均值、总量及比率,这两种组合方法都经常使用。
7.5.3样本容量的确定,31/56,确定总样本容量n及其分配,可对所有要研究的总体参数提供必要的精度。
分配工作就是决定总样本被分配到各层的部分,这些部分将确定各层的简单随机样本的容量。
7.5.3样本容量的确定,32/56,一般地,单位数较多的层和方差较大的层应分配较多的样本数目。
相反地,对于给定的费用,为了获得更多的信息,则抽样单位成本较大的层应分配较少的样本数目。
7.5.3样本容量的确定,33/56,整群抽样需要将总体各个个体分为N组(也称作群),使总体中每个个体只属于一群。
7.6整群抽样,34/56,例如,我们想调查某省的登记选民。
则有两种方法:
调查某省的登记选民。
有两种方法:
第一种方法是建立包含该省所有登记选民的抽样框,然后根据抽样框,选择选民的一个简单随机样本。
第二种方法是整群抽样,我们选择用该省各县的清单作抽样框。
在这个方法中,每个县(或群)包含一组登记选民,而该省的每个登记选民只属于一群。
7.6整群抽样,35/56,分层抽样和整群抽样都将总体划分为组,因此这两种抽样过程感觉上是相似的。
选择整群抽样与分层抽样的原因是不同的。
当群内的个体存在差异时,整群抽样可提供较好的结果。
理想情形是每一群是整个总体的一个缩影,这时,抽取很少的群就可以提供关于整个总体特征的信息。
整群抽样与分层抽样的比较,7.6整群抽样,36/56,整群抽样的优缺点整群抽样的优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
整群抽样与分层抽样的匹别整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大,37/56,例7.6某省拥有12000名执业注册会计师的注册会计师协会进行了一项调查。
作为调查的一部分,注册会计师协会收集与收入、性别和与注册会计师生活方式有关的因素的信息。
因为用个人采访法去搜集所需要的信息,因此注册会计师协会采用整群抽样,以使总的差旅费和采访费用达到最小。
抽样框中包含所有在该省登记注册的执业会计师事务所。
7.6整群抽样,38/56,假设有1000群,即在该省登记注册的从事会计活动的会计师事务所有1000个,选择10个会计师事务所为一个简单随机样本。
例7.6(续),7.6整群抽样,39/56,为了介绍在整群抽样中,构造总体均值、总体总量和总体比率的近似95置信区间需要的公式,我们使用如下的记号:
N总体的群数;
n样本中选出的群数;
Mii群的单位数;
M总体单位数;
MM1M2十MN;
每一群的平均单位数。
Xi第i群所有观察值的总量;
ai第i群具有某特征的观察值的数量;
7.6整群抽样,40/56,对注册会计师协会的抽样调查,我们有如下资料:
N1000n10M12000,下表7-4为每个中选群的Mi和xi的值,以及中选事务所中女注册会计师的数量(ai)的资料。
例7.6(续),7.6整群抽样,41/56,7.6整群抽样,42/56,由整群抽样得到的总体均值的点估计的公式如下:
(7-25),7.6.1总体均值,43/56,该点估计量的标准差的估计为:
(7-26),总体均值的近似95的置信区间为:
7.6.1总体均值,44/56,根据表7-4的资料,我们可以得到执业注册会计师平均年薪的点估计为,例7.6(续),7.6.1总体均值,45/56,由于表74中的年薪资料是以千元计量的,因此,执业注册会计师的平均年薪的估计值为42531元。
而:
因此:
例7.6(续),7.6.1总体均值,46/56,因此标准差为1.730。
我们得到平均年薪的近似95置信区间:
即(39.071,45.991)。
例7.6(续),7.6.1总体均值,47/56,整群抽样的总体比率的点估计如下:
(7-30),式中ai第i群中具有某种感兴趣特征的个体的数量。
7.6.2总体比率,48/56,该点估计量的标准误差的估计为:
(7-31),总体比率的近似95的置信区间,(7-32),7.6.2总体比率,49/56,对注册会计师抽样调查,可以得到女性执业注册会计师的比率的估计为:
例7.6(续),7.6.2总体比率,50/56,并且:
因此:
例7.6(续),7.6.2总体比率,51/56,因此,女性执业注册会计师比率的近似95%置信区间为,即(0.2052,0.3416)。
例7.6(续),7.6.2总体比率,52/56,先通过选择(即允许误差)的值,规定可接受的精度水平,建立满足所需要的精度的n值的计算公式,每群平均个体的数量和群间方差是决定样本中包含群数多少的关键因素。
如果各群相似,则群间方差小,因此中选群数就比较少。
如果每群平均个体数量较大,则中选群数也会比较少。
整群抽样的过程同其他抽样方法整体上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样