抽样技术-第5章.pptx
- 文档编号:30809492
- 上传时间:2024-01-30
- 格式:PPTX
- 页数:51
- 大小:1.04MB
抽样技术-第5章.pptx
《抽样技术-第5章.pptx》由会员分享,可在线阅读,更多相关《抽样技术-第5章.pptx(51页珍藏版)》请在冰豆网上搜索。
第五章不等概抽样,第一节不等概抽样,例OBrienetal.(1995)对Philadelphia地区的病人进行抽样,目的是了解病人对于医疗服务的偏好。
目标总体是这一区域的所有注册的医院的病人。
总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。
等概率的抽取样本医院的缺点?
首先,可能医院中愿意接受CPR治疗的病人数量会正比与医院床位的数量,采用等概简单估计量可能会有大的方差。
其次,自加权的等概率样本可能难于管理。
可能仅仅为了调查一两个病人就需要去一家医院,并且合理分配调查人员的工作负担也是比较困难的。
第三,调查成本在调查开始的时候是未知的-一个40个医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。
其他办法?
调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。
如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率?
而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。
而且,总体总量的方差可能更小,第一节不等概抽样,分层抽样:
抽样选择概率小的单位会有较高的权数。
采用不等概率抽样来减少抽样方差而不采用清晰的分层。
采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。
抽样的关键是每个样本的选择概率是已知的。
场合:
总体单元差异比较大时;抽样审计;多阶段的PSU.,入样概率不同是否导致估计偏差?
例如“水野法”抽样使得比估计为无偏估计量,不等概的必要性1、提高估计精度2、方回的PPS抽样简化方差计算应用条件:
通常需要知道一个辅助变量,用以确定其入样概率,第一节不等概抽样,1.放回不等概抽样每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元放回总体,然后进行下一步抽烟。
这样,每次抽样过程都是从同一个总体独立进行的,这种不等概抽样称为(有)放回不等概抽样,第一节不等概抽样,第一节不等概抽样,这种不等概抽样称作放回的与规模大小成比例的概率抽样(probabilityproportional),简称PPS抽样。
实际问题中总体单元大小的度量往往不止一个,比如企业员工数量、产值、销售量、利润等都可以度量企业规模的大小。
PPS的实施主要有两种方法:
代码法与拉希里(Lahiri)法,第一节不等概抽样,2拉希里方法不需要累计,两次随机数决定抽中的单位。
第一次:
1-N之间的随机数i第二次:
1-maxM之间的随机数m如果Mim,第i个单位被抽中,第一节不等概抽样,2.不放回不等概抽样对于不放回抽样,对总体参数的估计及其方差估计比较简单,但样本单元中可能有单元被抽中多次,直观上看,没有必要对同一单元调查多次,因此可以考虑放回不等概抽样,即每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元不再放回总体,对总体中剩下的单元进行下一次抽样。
第一节不等概抽样,对于不放回不等概抽样,样本的抽取可以有以下几种方法
(1)逐个抽取
(2)重抽法(3)全样本抽取;样本量随机(4)系统抽样法,第二节放回不等概抽样,一只抽取一个样本单元(n=1)的不等概抽样为了演示不等概抽样的思想,先看一个例子。
一个城市有4个超市,营业面积从100平米到1000平米。
我们的目标是通过抽取一家超市来估计4个超市上个月的总销售量因为我们只抽取一个超市,所以超市第一次被抽中的概率等于超市进入样本(入样)的概率。
这个例子中,入样概率正比于超市营业面积,第一节不等概抽样,因为超市A占四个超市营业面积的1/16,所以它的入样概率为1/16。
假设我们知道所有超市的销售额,第二节放回不等概抽样,在估计中,可以使用选择概率来弥补不等概率抽样。
如果超市的营业面积近似正比于超市的销售额,那么超市A的销售额就占所有超市销售额的1/16,因此超市A的销售额乘16可以近似的估计所有超市的销售额。
因此,样本量为1的不等概率抽样的总体总量估计量为,第二节放回不等概抽样,四个n=1的可能的不等概抽样,第二节放回不等概抽样,第二节放回不等概抽样,例如,第二节放回不等概抽样,二有放回不等概抽样对于放回不等概抽样,对总体总量的估计是汉森-赫维茨(Hansen-hurwitz)估计,例如:
估计超市销售额,m:
员工人数解释公式意义,第二节放回不等概抽样,可以证明,例5.2,某部门要了解所属8500家生产企业当月完成的利润,该部门手头已有一份去年各企业完成产量的报告,将其汇总得到所属企业去年完成的产量为3676万吨。
考虑到时间紧,准备采用抽样调查来推算当月完成的利润。
根据经验,企业的产量和利润相关性比较强,且企业的特点是规模和管理水平差异比较大,通常大企业的管理水平较高些,因此采用以与去年产量成比例的PPS抽样,从所属企业中抽出一个样本量为30的样本,,第二节放回不等概抽样,第二节放回不等概抽样,765404,174454,=45%,相对误差达到20时所需样本量对误差达到20时所需样本量nnnnnnn,n=150,第二节放回不等概抽样,第二节放回不等概抽样,第三节多阶段有放回不等概抽样,第三节多阶段有放回不等概抽样,第三节多阶段有放回不等概抽样,第三节多阶段有放回不等概抽样,第三节多阶段有放回不等概抽样,二多阶段有放回不等概抽样以三阶段抽样为例,第三节多阶段有放回不等概抽样,实际工作中,通常做法是前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶段样本量对不同单元都等于常数,则所得样本是自加权的。
此时有:
第三节多阶段有放回不等概抽样,第三节多阶段有放回不等概抽样,例【5-5】某调查公司接受了一项关于全国城市成年居民人均奶制品消费支出及每天至少喝一杯鲜奶的人数的比例情况的调查。
第三节多阶段有放回不等概抽样,确定抽样范围为全国地级及以上城市中的成年居民。
成年居民指年满18周岁以上的居民。
第一步:
确定抽样方法调查公司决定采用多阶段抽样方法进行方案设计,调查的最小单元为成年居民。
确定调查的各个阶段为城市、街道、居委会、居民户,在居民户中利用二维随机表(Kish随机表的简化)抽取成年居民。
第三节多阶段有放回不等概抽样,第二步:
确定样本量及各阶段样本量的配置,第三节多阶段有放回不等概抽样,初级单元:
20个城市;二级单元:
80个街道,每个样本行政区内抽4个街道;三级单元:
160个居委会,每个样本街道内抽2个居委会;四级单元:
1600个居民户,每个样本居委会内抽10户居民户。
在样本居民户内,利用二维随机表抽1名成年居民。
第三步:
抽样方法,第一阶段,在全国城市中按与人口数成比例的放回的不等概抽样,即PPS抽样。
第二和第三阶段分别按与人口数成比例的不等概系统抽样。
以第二阶段为例,在某个被抽中的样本城市中,将其所属的街道编号,搜集各街道的人口数,赋予每个街道与其人口相同的代码数;根据该市总人口数除以样本量4,确定抽样间距;然后对代码进行随机起点的等距抽样,则被抽中代码所在的街道为样本街道。
第四阶段,分别在每个样本居委会中,按等距抽样抽出10个居民户。
即根据居委会拥有的居民户数除以样本量10得到抽样间距,然后随机起点的等距抽样。
第四步:
推算方法,第四节不放回不等概抽样,第四节不放回不等概抽样,第四节不放回不等概抽样,第四节不放回不等概抽样,3.不同情况下的PS抽样n=2条件下严格的PS抽样布鲁尔方法德宾方法n2条件下严格的PS抽样水野方法n2条件下非严格的PS抽样莫蒂方法,布鲁尔方法,条件:
所有Zi0.5逐个抽取:
第一个与成比例的概率抽取第二个与成比例的概率在N-1个单元内抽取,水野方法,总体差异不要太大逐个抽取:
关键:
第一个单元与成比例的概率抽取剩余的N-1个单位不放回等概抽取,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 技术