抽样设计和样本抽选MICsUnicef.docx
- 文档编号:28899806
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:74
- 大小:132.93KB
抽样设计和样本抽选MICsUnicef.docx
《抽样设计和样本抽选MICsUnicef.docx》由会员分享,可在线阅读,更多相关《抽样设计和样本抽选MICsUnicef.docx(74页珍藏版)》请在冰豆网上搜索。
抽样设计和样本抽选MICsUnicef
抽样设计和样本抽选
抽样设计和样本抽选
本章专业性较强,主要针对抽样人员,但同时也可供调查协调员和其他技术专家使用。
本章内容将帮助您:
Ø确定样本量
Ø判断现有的样本是否可用,或者为新样本确定合适的抽样框
Ø为新样本进行抽样设计
Ø在以下方面有所认知:
如果要求分地区的估计值以及水和厕所的估计值
有代表性,其中所涉及到的样本量、估计值可靠性和调查成本
Ø进一步熟悉加权、估计和抽样误差
Ø了解pps(与规模成比例)抽样和潜在分层
Ø了解两个不同国家的抽样设计
多指标类集调查(MICS)是一个抽样调查,而不是对整个目标总体来采集数据。
调查中会涉及到多种调查对象:
住户、15-49岁妇女、5岁以下儿童,或其他年龄段的人群。
但是,被访者通常是调查户中孩子的母亲或者看护人。
需要注意的是,第四轮多指标类集调查(MICS4)是一个全国性调查,需要从全国所有住户中进行抽样,而不仅仅是抽取有低龄儿童或育龄妇女的住户。
确定样本量
样本量是样本设计中最重要的因素,因为相对于其他因素,它对调查精度、成本和调查时长的影响更大。
样本量取决于可用的资金以及对精度的要求。
而后者,也就是对精度的要求,还需要考虑到估计值是只需要具有全国代表性,还是也要有分地区代表性。
并且,总的样本量也与样本区域(初级抽样单位PSU)的数量以及最终集群的规模有关。
因此,虽然可以借助数学公式来计算样本量,但是在确定样本量时也需考虑上述各种因素。
获取帮助
虽然本章内容比较详尽,但是并不是将读者只定位于专门的抽样统计学家。
样本设计中很多方面都可能需要从国家统计部门内部或是统计部门以外来获取帮助。
这些方面可能包括:
测算样本量、构造抽样框、对多个可选的样本设计方案进行评估、运用pps抽样方法、权数计算,以及估计抽样误差。
无论如何,我们都强烈建议您在样本设计阶段能得到国家统计部门的建议。
在确定初级抽样单位(PSU)个数和集群规模时有两条一般性的经验规则:
PSU个数越多越好,因为这样有助于提高地域代表性亦即覆盖面,也有助于提高可靠性;集群规模则是越小越好,这样估计值将更加可靠。
例子:
在一个全国性调查中,一个600个PSU、集群规模为10户的样本和一个400个PSU、集群规模为15户的样本虽然样本量都是6,000户,但是前者可以得到更为可靠的估计结果。
并且,集群规模为10户优于集群规模为15户,因为集群规模越小,调查的可靠性越高。
总之,在其他因素相同的前提下,我们应该尽量增加PSU个数,同时减少集群规模。
一般来说,抽取的PSU越多,调查效果越好。
但是,PSU个数的确定在很大程度上会受制于成本考虑、以及是否需要估计值分地区具有代表性(估计值的分地区代表性将在后面的章节中介绍)。
交通成本是一个重要因素。
如果PSU之间相距较远,且同一个调查队需要从一个地方到另一个地方开展调查(假设不是在每个PSU都聘用当地访问员),那么减少PSU个数将会显著降低整体调查成本。
相反地,如果调查要求估计值具有分地区代表性,则往往不得不增加而非减少PSU个数。
集群规模是在确定样本量时需要考虑的另一个因素。
它的影响可以通过样本设计效应即deff来度量。
样本设计效应deff是在样本量相同的情况下,实际的分层集群调查样本(在此例中为第四轮多指标类集调查)的抽样方差和简单随机样本的抽样方差的比值。
比如,如果调查中某个指标的deff计算值为2.0,就说明当样本量相同时,该调查估计值的抽样方差是简单随机抽样的两倍。
之所以说小集群比大集群更为可靠,是因为deff值会随着集群中住户数的增加而增加。
本章节末尾讲到样本量时,会给出几个确定PSU个数和集群规模的具体例子。
简单随机取样由于成本较高,通常不在第四轮多指标类集调查(MICS4)以及其他住户调查中采用,这也是为什么会采用集群抽样的原因。
影响到抽样设计效应的因素有分层、集群规模和集群的同质性,即集群中两个个人(或住户)拥有相同特征的程度。
比如,与居住地为随机抽选的两个儿童相比,邻近居住的两个儿童在接种某种疫苗的情况上要更为相似,这就是集群同质性的例子。
分层通常会降低抽样方差,而集群内的相似性和集群规模会增加抽样方差。
因此,在进行样本设计时,就需要确定恰当的集群规模,以便在同质性和成本考虑之间进行权衡,因为集群越小在统计上越有效,但是集群越大,从成本的角度考虑就越节省。
在计算调查的样本量时,计算公式中一定要体现设计效应。
但是这里有两个问题。
首先,虽然deff值在调查结束之后容易计算,这个值在调查之前却往往是未知的,除非此前曾调查过相同的变量。
第二,deff值对于每个调查指标和每个目标群体都是不同的,这是因为对于不同特征,群内同质性是不一样的。
当然,就算我们知道每个特征的deff值是多少,据此为不同的特征采用不同的样本量也是不现实的。
调查指标的deff值通常不会在调查之前为人所知,但是我们知道,对于很多基于稀少群体(比如12-23月龄儿童)估计的指标会比较小。
如果之前的住户调查采集过与MICS相似的数据,并且使用了相似的样本设计,我们可以使用之前调查的deff值来估计第四轮多指标类集调查(MICS4)的设计效应。
很少有住户调查会去计算设计效应,但是人口和健康调查(DHS)是得到deff值的一个较好的来源。
但同时我们也要注意到,DHS报告的抽样误差表中所列出的设计效应是deft,它等于相同样本量下实际样本的标准误和简单随机抽样标准误的比值;也就是说它的数值是deff的平方根。
换言之,在参照DHS报告做为一个信息来源时,我们一定要记住将deft值进行平方后再作为deff使用。
在接下来介绍样本量的计算公式和表格时,我们将假定设计效应为1.5(这个数值对于一些指标来说可能有点偏高,因此会得出比较保守或偏大的样本量)。
我们希望通过选择一个保守的deff值,来确保样本量足够大到可以测量所有的主要指标。
然而,确定集群规模,同时也就确定了集群的个数的一个经验原则是,在考虑了PSU数量、现场工作成本(相关讨论见上文)、以及基层访问员合理工作量等诸多因素下,要确保得集群规模可以有效地兼顾现场调查工作的组织。
当选取的集群较大时(如每个集群超过20户),我们在测算样本量时就有必要假设一个更大的deff值。
计算样本量
要使用恰当的数学公式来计算样本量,需要确定几个因素,同时根据以前或类似的调查来假定或取得其他参数的值。
这些因素如下:
∙要求的精度水平,用抽样误差来测量
∙要求的置信水平
∙特定目标群体在总体中的估计(或已知)比例
∙所预测或估计的特定指标的值、比例或发生率
∙样本的deff值
∙平均的住户规模
∙针对住户无回答所造成的样本损失而进行的调整
样本量的计算之所以复杂,是由于这些因素中的一些因素随指标的不同而有所不同。
我们已经提到过,deff随不同类型的特征而有所不同。
甚至对于每一个指标,我们可容忍的误差幅度也不太可能是相同的(实际上也不可能相同)。
这表明,为了达到所需的精度,针对不同的指标需要不同的样本量。
但是显然,我们只能为调查设定一个样本量。
样本量的计算仅适用于分人的变量,即使表达式显示的是我们为了访问个人而必须访问的住户数。
这是因为第四轮多指标类集调查(MICS4)的大部分重要指标都是基于个人的。
在样本量的计算中不应该使用住户层级的变量,因为这需要一个不同的公式和非常不同的设计效应值deff,在有些情况下deff高达10或者更大,例如针对饮用水来源或厕所类型等变量。
计算公式如下:
其中:
∙n是估计核心指标(关于核心指标的确定可参见下一部分)所需的样本量,用住户数来表示
∙4是用于获得95%的置信水平所需的因子
∙r是指标的预测值或估计值
∙1.1是为了解决住户无回答所需的因子,即样本量增加10%
∙deff是设计效应
∙0.12r是在95%的置信水平上所能容忍的误差幅度,被定义为r的12%(在这种情况下r的相对标准误差约是6%)
∙p是指标r所针对的目标人群在总人口中的比例(也就是目标子群体在总体中的比例)
∙ñ是平均的住户规模(也就是平均每户的人口数)
如果根据目标群体在总人口中的比例,使用基于最小的目标群体的核心指标来计算调查的样本量,则大部分的其他主要指标的调查估计值的精度都会更好。
细心的用户会注意到,与第二轮多指标类集调查(MICS2)的手册相比,公式的不同点在于使用了相对允许估计误差(值为0.12),而不是绝对允许误差(在以前的版本中,高比例估计值指标和低比例估计值指标的允许误差绝对值分别为0.05和0.03);在这种情况下0.12r=e。
在第二轮多指标类集调查(MICS2)的手册中,调查的估计值的可靠性的设定根据的高比例值或者低比例值指标而有所不同。
对于指标的估计值,我们曾建议,对于比例相对较高,即高于25%的(例如免疫接种),允许误差或精度设定在5%;而对于比例相对较低,即等于或低于25%的比例估计量,允许误差设定在3%。
虽然按照这种方式给出两个允许误差幅度看似合理,但是用户很难选择调查到底要使用哪一个,特别是所计算的样本量差别很大的情况下。
通过使用相对允许误差,可以避免这个问题,因为在样本量确定中不论是使用高比例估计值指标还是低比例估计值指标来作为核心指标,允许误差的幅度是一致的。
但是需要注意,对于低比例估计值指标,所需的样本量要更大,这也是为什么选择哪一个指标作为最核心的调查指标非常重要的原因。
界定和选择用以计算样本量的核心指标
计算样本量的推荐策略是选择一个会产生最大样本量的重关键指标。
这意味着要首先选择在总人口中比例较小的目标群体(在上述公式中表示为p)。
在第四轮多指标类集调查(MICS4)中,即为12-23个月的儿童,在许多进行第四轮多指标类集调查(MICS4)的国家中,这个比例大约是占到总人口的2.5%。
除非您的国家有可利用的更好估计值,通常我们推荐使用2.5%。
如果您的数字更大(3.5%、4%或者5%),则您所需的样本量将会比表3中的小很多,因此使用针对目标群体的p的最好估计值是非常重要的。
第二,对于同一目标群体的特定指标也必须选择。
我们将其标识为核心指标(但是这仅针对计算样本量这一目的)。
表1
基于比例估计值的水平来选择核心指标的标准
以下指标的比例估计值越高越好
∙使用改善的水源或厕所
∙在校率
∙产前保健和住院分娩率
∙母乳喂养率
∙疫苗接种率
以下指标的比例估计值较低越好
∙死亡率
∙低体重、生长迟缓或消瘦的患病率
∙童工的比例
在决定核心指标时,需要选择低比例估计值指标。
不过,一些低比例估计值指标可以排除在考虑范围之外。
在表1所列出的指标中,给出了一些比例估计值越高越好的指标的例子,与之相关的目标应该是提高其比例(例如百白破,即百日咳、白喉和破伤风的疫苗接种率)。
表1所列出的第二套指标提供了比例估计值越低越好的指标的例子,与之相关的目标应该是降低其比例(例如生长迟缓的患病率)。
基于那些目标就是低比例并且比例估计值目前已经很低的指标来计算样本量是没有意义的;在选择核心指标时,这类指标应该被排除之外。
表2提供了选择目标人群和核心指标的建议,以直接计算样本量或者根据表3来查找样本量。
注意,没有将婴儿死亡率(IMR)或孕产妇死亡率(MMR)作为备选的核心指标。
这是因为要测量这些指标所需要的样本量太大了,通常要上万个,要考虑它们是不现实的。
这并不必然意味着,这些指标在调查中不需要进行测量,而是说调查的样本量不应该基于这些指标进行计算。
因此,这些指标相比于其他指标来说,调查结果会有较大的抽样误差和更大的置信区间。
表2
确定目标群体和指标的考虑因素
选择适当的目标人群和指标以确定样本量:
1.选择在总人口所占比例较小的两到三个目标群体。
通常,这些目标群体所跨的年龄段不应该少于1岁或者大于5岁。
在第四轮多指标类集调查(MICS4)中,通常选择12-23个月大的儿童组或者5岁以下儿童组,在许多国家中这两个年龄组在总人口中的比例分别为2-4%和10-20%。
2.基于这个目标群体来检查重要指标,不考虑比例很低(低于5%)或者很高(高于50%)的指标。
从占人群比例较小的的年龄组开始计算,如果基于这个组的指标已有较高的覆盖率,则再对年龄组较宽但覆盖率降低的指标进行计算。
3.通常,针对占总人口10-15%的目标群体,挑选覆盖率较低的指标,例如比例在15-20%。
对于占人口5%以下的目标群体,挑选其覆盖率要略高的指标,通常在20%以上,但是低于50%。
4.不要挑选值越低越好而且覆盖率已经低到可接受水平的指标。
在进行选择时,还必须考虑本国各个指标的相对重要性。
例如,您不会愿意选择一个需要很大样本量同时重要性相对较低的指标。
使用样本量表格
表3显示了根据第四轮多指标类集调查(MICS4)的要求和一些特定的假设而计算出的样本量。
如果符合您的情况,您可以使用表格中给出的样本量。
或者,抽样人员也可以直接使用下面给出的公式来直接计算样本量。
如果表3中的参数符合您国家的情况,您可以不必根据公式来计算样本量,而是直接查找样本量。
在表3中,估计值精度的置信水平被预设为95%,平均住户规模的变化范围为4.0至6.0,覆盖率r的变化范围为0.25至0.40。
deff假设为1.5,精度水平(允许估计误差)为的12%,也就是说,12%的相对抽样误差。
该表还将样本量上调了10%,以弥补调查中可能的无回答情况。
至关重要的是,需要注意该表还假设您的核心指标的目标人群在总人口中的比例为2.5%。
如果是不同的值,则不能使用该表来找到所需的样本量。
一般来说,当公式中的参数的假设值不符合您的情况时,就不能使用该表。
在该章节的后面将介绍这种情况下还需要做些什么。
表3
用于估计最小目标群体的指标所需的样本量(住户数)
(在95%的置信水平下,相对抽样误差为估计比例值的12%)
平均住户规模(人数)
指标值(r)
r=0.25
r=0.30
r=0.35
r=0.40
4.0
13,750
10,694
8,512
6,875
4.5
12,222
9,506
7,566
6,111
5.0
11,000
8,556
6,810
5,500
5.5
10,000
7,778
6,191
5,000
6.0
9,167
7,130
5,675
4,583
在以下情况下使用该表:
∙目标群体在总人口中的比例为2.5%;通常选择12-23个月大的儿童组
∙样本设计效应deff假设为1.5,并且无回答的情况预计占到10%
∙相对抽样误差被设定为指标估计值(覆盖率)r的12%
如果公式的参数值的所有假设都适合您的国家,则在表3中应该可以查到一个相应的样本量。
在一些情况下,参数值可能是适用的,但是您选择的指标值是介于表格中的数值之间。
例如,如果您的覆盖率是介于30%到35%之间,则样本量就是介于表格第三列和第四列中间的一个值。
具体举一个例子,在最后一行中,如果覆盖率是32.5%,则样本量就在7,130与5,675中间,即大约为6403户。
表3的具体使用步骤如下:
●首先,确定表3中使用的参数值是否适用于您的情况
●其次,根据表3来选择覆盖率最低的指标,其中要排除覆盖率已经低得可以接受的指标。
假设指标为估计值为35%的麻疹接种率。
●然后,在表3中查找平均住户规模最接近您国家的情况的数值(假设您的国家的平均住户规模在所示的范围之内)。
假设平均住户规模为5.5人。
●最后,在表3中查找与住户规模为5.5人并且覆盖率为35%相对应的样本量,表中数值为6,191。
不过,表中的样本量数值并不是非常精确,而只是一个近似的样本量。
要记住在计算样本量时所进行的几个假设。
这使得您可以根据您的预算约束来对样本量进行微调。
在本例中,在您考虑了初级抽样单位之间的交通费、集群规模和访问员负担之后,您可能会发现6100或6200才是合适的样本量。
使用样本量计算公式
如果参数值的假设都适用,但是12-23个月大的儿童组的比例在您的国家中不是2.5%,而是接近2%,那样本量是多少呢?
在这种情况下,只需要将表3中的所有数字简单乘以2.5/2或者1.25,则可以获得样本量。
这是很重要的,因为样本量要明显更大,即增加了25%。
不过,还有一些情况下,您最好不要使用表3,而是直接根据以下公式来计算样本量。
当您的国家的任何一个参数值与表3中的假设有所不同时,都必须使用公式。
表4简要列出了应该使用公式的条件。
如果我们假设,根据一般经验,当集群规模为20户时,在公式中应该使用的deff值为1.5,则当您使用的集群规模为10户或30户时,您就需要将deff的值调低或调高。
我们已经讨论过,如果p小于0.025,为什么样本量必须要更大。
如果上述例子不符合您的国家的情况,则应该使用以下公式来计算样本量。
需要重复的是,如果任何一个其他参数符合表4中所列的标准,则必须使用以下公式。
表4
使用样本量公式的适用条件
确定样本量的公式如下:
如果以下任一项或多项适用于您的国家,则可以使用该公式:
∙1岁儿童组的比例(p)不是0.025
∙平均住户规模(ñ)小于4.0或者大于6.0
∙核心指标的覆盖率(r)小于25%
∙根据其他调查所认可的估计,您的核心指标的样本设计效应(deff)不是1.5
∙预测的无回答率大于或小于10%(相应的调整因子为1.1)
不要改变公式中的置信水平,而是将其值保持为4。
公式的使用非常简单,因为一旦确定了参数值,只需要进行基本的运算即可。
例如,当r=0.25,deff=1.6,无回答调整因子=1.05,p=0.035且ñ=6时,则:
n
=
[4(0.25)(1-0.25)(1.6)(1.05)]
=
1.26
=
6,667
[(0.12×0.25)2(0.035)(6)]
0.000189
在之前的几轮多指标类集调查MICS中,通常样本量在4,000户到8,000户之间。
考虑到信度要求和预算约束,在计算样本量时,这个范围是一个看似合理的目标样本量。
如我们已经提过的,第四轮多指标类集调查需要生成许多指标的估计值,每一个指标都有自己的精度水平。
因此对于一个特定的样本量,检查各指标的近似信度水平,即标准误和置信度是有用的。
表5显示了样本量为6,000户时信度水平。
对于第四轮多指标类集调查(MICS4)中的大部分指标,6,000户的样本量通常被认为是可以产生比较可靠的估计值。
表5
当样本量为6,000户时,各种人口特征下的期望信度水平(标准误和置信区间)
平均住户规模
指标值
r
子群体的比例
p
子群体中的样本
人数
具有指标特征的样本人数
标准误
置信区间(95%)
下限
上限
4
0.10
.025
540
54
.016
.068
.132
.05
1,080
108
.011
.078
.122
.125
2,700
270
.007
.086
.114
.20
4,320
432
.006
.089
.111
0.20
.025
540
108
.021
.158
.242
.05
1,080
216
.015
.170
.230
.125
2,700
540
.009
.181
.219
.20
4,320
864
.007
.185
.215
0.30
.025
540
162
.024
.252
.348
.05
1,080
324
.017
.266
.334
.125
2,700
810
.011
.278
.322
.20
4,320
1,296
.009
.283
.317
0.50
.025
540
270
.026
.447
.553
.05
1,080
540
.019
.463
.537
.125
2,700
1,350
.012
.476
.524
.20
4,320
2,160
.009
.481
.519
5
0.10
.025
675
68
.014
.072
.128
.05
1,350
135
.010
.080
.120
.125
3,375
338
.006
.087
.113
.20
5,400
540
.005
.090
.110
0.20
.025
675
135
.019
.162
.238
.05
1,350
270
.013
.173
.227
.125
3,375
675
.008
.183
.217
.20
5,400
1,080
.007
.187
.213
0.30
.025
675
203
.022
.257
.343
.05
1,350
405
.015
.269
.331
.125
3,375
1,013
.010
.281
.319
.20
5,400
1,620
.008
.285
.315
0.50
.025
675
338
.024
.453
.547
.05
1,350
675
.017
.467
.533
.125
3,375
1,688
.011
.479
.521
.20
5,400
2,700
.008
.483
.517
6
0.10
.025
810
81
.013
.074
.126
.05
1,620
162
.009
.082
.118
.125
4,050
405
.006
.088
.112
.20
6,480
648
.005
.091
.109
0.20
.025
810
162
.017
.166
.234
.05
1,620
324
.012
.176
.224
.125
4,050
810
.008
.185
.215
.20
6,480
1,296
.006
.188
.212
0.30
.025
810
243
.020
.261
.339
.05
1,620
486
.014
.272
.328
.125
4,050
1,215
.009
.282
.318
.20
6,480
1,944
.007
.286
.314
0.50
.025
810
405
.022
.457
.543
.05
1,620
810
.015
.470
.530
.125
4,050
2,025
.010
.481
.519
.20
6,480
3,240
.008
.485
.515
表5的第4列显示了假设无回答率为10%在6,000户的样本中需要访问的人数。
例如,在平均住户规模为4人的国家中,在占总人口为2.5%的子群体(假设为12-23个月大的儿童组)中,考虑到无回答的情况之后,样本人数约为540人,而不是600人。
其中,第5列显示了具有某种特征r的样本人数。
如果r为10%,则具有该特征的样本人数为54人;如果r为20%,则具有该特征的样本人数为108人;如果r为30%,则具有该特征的样本人数为162人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 设计 样本 抽选 MICsUnicef