抽样方案设计1Word下载.docx
- 文档编号:20251405
- 上传时间:2023-01-21
- 格式:DOCX
- 页数:11
- 大小:26.33KB
抽样方案设计1Word下载.docx
《抽样方案设计1Word下载.docx》由会员分享,可在线阅读,更多相关《抽样方案设计1Word下载.docx(11页珍藏版)》请在冰豆网上搜索。
道路地块法"
,即以道路、河流、铁路等明显的线状标志物为界限划定各个抽样单位。
这种区划法的优点在于可以较合理地划定地图块的大小,如按该地图块内的人口密度确定地图块面积的大小等等,从而使各地图块内的居民户数达到基本相同,使样本单位之间具有可比性。
据统计,在实际中采用道路地块法抽样时,由于拒访、行业限制、拆迁、界限不清等原因,约有1/3的居民户不能访问,故在实际确定每地块居民户数时,应考虑以上因素。
2.居委会块
居委会块是指以居委会所辖地域作为抽样的基本单位,其总体即构成抽样框。
3•居民户
居民户是指以某区域住户名单为抽样的基本单位,其总体即构成抽样框。
这里所指的名单不一定是居住户的姓名,而有可能是居住户的门牌号、室号。
这一形式的抽样框往往缺乏现成的资料,需要连续地进行资料积累和完善,并且不断地进行修订。
(三)抽样调查的组织形式和抽样方法的选择为了控制抽样误差,提高抽样效果,需要根据调查任务及调查对象的具体情况,从各种抽样调查的组织形式及抽样方式中有针对性地进行选择,以便使样本能充分地反映总体,并便于组织实施,节约人力、物力和时间。
传统的抽样调查的组织形式分为两大类:
随机抽样与非随机抽样。
随机抽样并不是指随便乱抽样,随机抽样时样本会依据总体出现的几率高低而被多抽到或少抽到;
非随机抽样是指不按照几率抽取样本,而由抽样者主观抽取。
抽样方法的种类见表1—5。
表1—5抽样方法的种类
随机抽样非随机抽样
简单随机抽样便利抽样
系统抽样判断抽样分层随机抽样配额抽样
整群抽样雪球抽样多阶段随机抽样
1•随机抽样随机抽样是按随机原则从调研总体中抽取一定数目的样本单位进行调查,以其结果推断总体的一种调研方式。
它对调研总体中每一个样本单位都给予平等的抽取机会(即等概率抽取),完全排除了人为的主观因素的选择,这也是它与非随机抽样调研方式的根本区别。
目前,我国市场调研的某些方面采用了随机抽样调研的方式,如居民家庭生活调研、粮食及重要经济作物的产量调研等,但总的来讲,其应用面还不太广。
其实,随机抽样这种调研方式在我国市场调研中有着广泛的应用前景,如城乡居民收支状况与购买力的调研、消费者商品需求量与耐用消费品市场普及率的调研、消费结构与消费倾向的调研、农副产品产量与资源的调研、市场价格与需求弹性的调查分析等专题市场调研均可运用随机抽样的方式进行。
1)简单随机抽样
简单随机抽样也称纯随机抽样,就是在总体单位中不进行任何有目的的选择,完全按随机原则抽取样本单位。
纯随机抽样是随机抽样中最简单的一种。
由于市场调研的总体范围较广,总体内部各单位之间的差异程度较大,一般不直接使用这种方法抽样,而是与其他抽样方法结合使用。
实际使用时,可先利用计算机产生随机数,然后依次于总体中抽取样本单位,直到n个元素被抽取而构成样本。
简单随机抽样的优点:
总体名册完整时,样本抽取方便,方法简单。
简单随机抽样的缺点:
1完整总体名册不易取得,或取得成本很大时实行困难。
2当总体样本单位过多时,抽样作业相对不便
(如总体名册几万户)。
3样本分配较分散,增加调查行政作业困难(如某地区住户580万户要抽18000户)。
4当样本单位差异大时,样本代表性恐有不足
(如估计所得,抽到高所得或偏低所得)简单随机抽样的使用时机:
①总体内样本单位不多且有完备名册可以编号。
②总体内样本单位差异不太大。
2)系统抽样
系统抽样又称等距抽样或机械抽样,是将总体各单位按一定标志顺序排列,然后依固定的顺序和间隔抽取样本单位。
排列顺序可以与调研项目无关的标志为依据,即按无关标志排队,如按户口册、姓氏笔画、地理位置等排列;
也可以与调研项目直接或间接相关的标志为依据,即按有关标志排队,如在职工家庭收入调查中,先按总收入或平均工资由低到高排队,然后再抽取调研单位。
显然,按有关标志排队法要比按无关标志排队法效果好。
系统抽样的步骤包括:
(1)将总体单位排列。
(2)决定抽样区间(总体单位数/样本数)。
(3)在第一个区间采用简单随机抽样法抽出一个单位作为起始点。
(4)取得一个元素后,每隔一个抽样间距抽取一个元素,直到样本数足够为止。
[例]欲自10000的总体中抽取500个元素,贝V抽样区间为20(10000-500),假设我们以7为第一个元素,则被抽中的单位分别为7、27、47、
67……
3)分层抽样
分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。
分层抽样必须注意以下问题:
第一,必须有清楚的分层界限,在划分时不致发生混淆;
第二,必须知道各层中的单位数目和比例;
第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。
分层抽样的步骤包括:
(1)确认目标总体。
(2)决定样本数。
(3)决定分层标志。
(4)将总体按照分层标志分成若干类,其中每一类称为一层。
(5)在每一层中随机抽取出足够的样本。
分层抽样的具体做法有以下两种:
其一,等比例分层抽样。
这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分
配各层的样本数量
[例]某教授对甲大学的学生消费倾向产生了兴
趣,想对全校学生做抽样调查,总体有5000人,
欲抽样500人,则:
总体样本
一年级200人
二年级150人
三年级100人
四年级50人
一年级2000人
二年级1500人
三年级1000人
四年级500人其二,不等比例分层抽样,又称分层最佳抽样。
这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。
该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。
[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因此单位数为20000户,已确定调研样本数为200户。
家庭收入分高、中、低三层,其中高档收入
家庭为2000户,占总体单位数的比重为10%;
中等收入家庭为6000户,占总体单位数的30%;
低等收入家庭为12000户,占总体单位数的
60%。
现又假定各层样本标准差为:
高档收入家庭是300元,中等收入家庭是200元,低等收入家庭是50元。
现要求根据分层最佳抽样法,确定各收入层家庭应抽取的户数各为多少?
为了便于观察,列表1—6如下。
表1—6调研单位数与样本标准差乘积
计算表
家庭收入分层各层调研单位数
(潜在用户数)各层的样本标准差乘积样本
单位数
高2000300600000200X600000-2400000=50
中60002001200000200X1200000-2400000=100
低1200050600000200X600000-2400000=50
合计20000—2400000—
如果根据等比例分层抽样的话,那么,高档收入家庭的分层样本数为20户(200X10%);
中等收入家庭的分层样本数为60户(200X
30%);
低等收入家庭的分层样本数为120户(200X60%)。
将前后两种方法抽取的各层样本数做个对比,不难看出,相比于等比例分层抽样法,根据分层最佳抽样法抽取样本,则高档收入家庭的分层样本数增加了30户,中等收入家庭的分层样本数增加了40户;
低等收入家庭的分层样本数则减少了70户。
由于购买家用电器同家庭收入水平是成正比例变动的,所以,增加高、中档层的样本数,相应减少低档层的样本数,将有利于提高抽样的准确性。
4)整群抽样
整群抽样又称分群抽样,是指将市场调研的总体按一定的标准(如地区、单位)分为若干群,再以随机方式抽取部分群,并对这些抽取出来的群中的单位做全部访问,然后在其中随机抽取部分群体单位进行普查的方法。
分群抽样一般采取两段式抽样法,即先采取纯随机抽样法抽取若干群体,然后对选定的有关群体进行全面调研。
[例]调查某城市居民户的情况拟抽取1000个样本。
假定该市共有500个居委会,每一个居委会平均有100户居民。
这样,就可以居委会为单位,采用纯随机抽样法抽出10个居委会,共1000户,然后把这10个居委会的1000户视为样本进行普查。
[例]欲调查宁波大学大四学生升学或就业的意愿,假设大四有35个班,从中随机抽取5个班,然后就这5个班的成员做全部访问,此法即为整群抽样法。
在以下两种情况下,研究者可能会采取整群抽样:
需要更经济、更有效率时,尤其是总体相当大时;
抽样框中,每个单位的资料不是很完整或是不易得到,或使用其他随机抽样法不是那么方便时。
整群抽样的优点包括:
1节省成本和时间。
2抽样架构中每个元素的资料不易得到或不完整时,使用此法会较方便。
整群抽样的缺点包括:
1选样不只一次,依调研目的可能要选两次或三次。
2群体内的元素值通常类似,因此估计量的精确度通常较低。
3分群的大小差异会影响抽样的正确性。
5)多阶段随机抽样多阶段随机抽样是指分两个及两个以上的阶段从总体中抽取样本的一种抽样调查方法,即先粗分,再细分,然后再微分。
此方法在面对大规模抽样时,常结合分层抽样法实施,首先将总体分层后,按比例抽出初步样本;
其次再以类聚式方法将样本归类,然后从归类组中随机抽取样本,就是最后进行调查的样本。
[例]欲实施全省性的防治犯罪相关问题之民意调查,就可以采取多阶段随机抽样方法进行:
(1)分层一一拟针对的人口为全省居民,按犯罪率程度从各市、县、区依一定比例随机抽出100个单位(各市、县、区均有)。
(2)粗分在这100个单位中,以镇、街道为类,在同一单位中抽出3个村(居委会)。
(3)细分一一这一阶段以户为单位,随机抽出
5户作为样本,所以最后样本数为1500(100X3X5)。
2•非随机抽样从调研对象总体中按调研者个人经历、方便性及主观判断设定的某个标准抽取样本单位的调研方式,称为非随机抽样调研。
这种抽样方式虽然在样本的抽取方法上带有主观性,会对总体推断的可靠程度产生影响,但由于它简便易行,可及时取得所需的信息资料,因此,在市场调研中也常被采用。
非随机抽样的方法主要有便利抽样法、判断抽样法和配额抽样法三种。
1)便利抽样
便利抽样又称为偶遇抽样。
顾名思义,即以选样的便利为基础的一种抽样方法。
其所得的样本称为便利样本。
[例]调研者在路上或其他地方如快餐店或便利店等,拦下行人进行访问就是一种便利抽样。
[例]一些大城市想做流动人口消费品购买力调研,往往无法采取随机抽样法,而是在车站、码头、机场、旅馆或大商场等处,碰到外地旅客就随便进行询问调查。
[例]宁波市调研人员想了解宁波市民对于规划的万达商圈的停车位的满意程度,所以去访问在商圈附近逛街的市民。
便利抽样的优点是简便易行,能及时获得所需要的信息数据,省时省力,节省调研经费,效率很高,并能为非正式的探索性研究提供很好的数据源。
其缺点是取得的样本偶然性很大,存在着选择偏差,如调查者的自我选择偏差、抽样的主观性偏差等,因而样本的代表性较差,调查结果的可信度较低。
只有当目标总体各单位间差异不大,即个体同质时,采用便利抽样获取的样本才具有较高的代表性。
所以这种抽样方法一般不能用来推断总体,即便利样本不适合于描述性研究和因果关系研究,而比较适合于探索性研究。
它可以通过调研发现问题,产生想法和假设,对问卷进行测试。
实际操作中,便利抽样多用于探索性调查或正式调查前的预调查。
2)判断抽样判断抽样也叫目的抽样,是按照调研者的主观经验、判断选定调研单位的一种抽样方法。
判断抽样有两种做法:
一种是由专家判断决定所选样本,即选择最能代表普遍情况的群体作为样本,一般选取“多数型”或“平均型”的样本为调研单位。
“多数型”的样本是在调研总体占多数的单位中挑选出来的样本;
“平均型”的样本是在调研总体中挑选出来的代表平均水平的样本。
也就是说,通过构成
“平均型”典型样本,可以实现把握目标总体平均水平大体位置的调研目的;
通过组成"
多数型”
(也称众数型)判断样本,可以实现掌握目标总体中多数单位所处现状的调研目的。
[例]某企业要调查其自身产品与竞争对手产品的销售情况,根据主观判断选择了一些同时对销售双方产品有影响的、非常有代表性的零售商店作为判定样本。
[例]调查中国钢铁行业的管理机制、运营机制及改革等状况,所挑选的样本单位一定得避开鞍钢、宝钢和首钢等几家国有特大型钢铁企业,其原因是尽管它们的钢铁产量占全国钢铁产量的大半,但是它们的管理水平、运营能力等不能代表众多钢铁企业的现状。
另一种是利用统计判断选取样本,即利用调研对象(总体)的全面统计资料,按照主观设定的某一标准选取样本。
[例]调查中国钢铁行业的产品和产量现状,只要对鞍钢、宝钢和首钢等几家国有特大型钢铁企业进行调查,就足以大致掌握我国钢铁工业的产品和产量情况了,因为这几家钢铁企业的钢铁产量占全国的大半,把握了它们的生产情况就可以把握总体的生产情况。
特别是当调查目的是了解、探索某一现象及事物产生异常的原因时,便需要选择“极端型”的总体单位,来查找问题的根源所在。
[例]在问卷设计阶段,为检验问卷设计得是否得当,调研者会有意地选择一些观点差异悬殊的人作为判断样本,即调研者专找那些偏离总体平均水平者进行调查,以确定问题答案的选项。
可见,我们通常所说的重点调查和典型调查都是判断抽样的特例。
判断抽样的样本代表性如何,完全凭调研者本身的知识、经验和判断能力而定。
正是由于判断抽样是“有目的”地主观选取一些可以代表总体的个体组成判定样本,所以使得调研人员对目标总体有关特征的较深入的了解成为应用这种抽样组织形式的前提。
此种抽样比较适合总体组成单位同质性很低且样本数较少的情形。
[例]国家每年实行的进出口物价调查即采用判断抽样法。
其做法是先选取基期年各类进口及出口值较大的商品,再根据这些大宗商品的进出口厂商调查其进出口的物价。
判断抽样具有挑选样本简便、及时的优点,在精确度要求不是很高的情况下,企业为了迅速获得解决日常经营决策问题的客观依据资料,常常使用判断抽样的方法。
3)配额抽样
配额抽样又称定额抽样,是按照总体特征予以配置样本的非随机抽样组织形式,是先将总体所有单位按一定的标志分成若干类(组),然后在各个类(组)用便利抽样或判断抽样方法选取样本单位,也即根据总体的结构特征给调研人员分派定额,以取得一个与总体结构特征大体相似的样本。
配额抽样是一种类似分层随机抽样的非随机抽样,通常使用此法来改善样本的代表性。
[例]总体中男性的比例有多少?
在不同的教育水准下男女的比率如何?
配额抽样分类依据的标准通常是总体单位的某些属性、特征,我们称这些属性、特征为“控制特征”,如被调查者的年龄、性别、地区、职业、文化程度等。
为此,在设定、抽取样本时,应按照各个控制特征来完成各类中的配额。
配额抽样按分配样本数额时的做法不同分为独立控制和相互控制两种方式(类型)。
(1)独立控制配额抽样
独立控制配额抽样是根据目标总体的不同特性,对总体各单位分别规定单独分配数额,而不规定
必须同时具有两种或两种以上特性的样本单位数额。
因此,这种方法在抽样时有较大的机动性。
[例]某市欲在商业系统进行一项调研,样本的数
目定为50家,决定采用独立控制配额抽样。
现
取行业类别、企
4业规模、企业所在地区三项控制
特性作为分类标准,样本数额的分配结果列于表
1—7中:
表1—7
独立控制样本配额表
行业类别企业规模企业所在地区
商业
25
饮食业
15
服务业
10大型5
中型
10
小型
35甲10
乙
20
丙
12
丁
8
合计
50合计50
50
在表1—7中,
对行业类别、企业规模和企业所
在地区三项控制特性分别规定了样本数额,但其相互之间的交叉关系没有在数额上做出限定。
如从商业单位抽取25个样本时,在规模和所在地区上没有明确要求;
又如,5个大型单位的样本既可较多或全部从商业中抽选,也可较少或不从商业中抽选,这完全由抽样者机动掌握。
当然,最终选定的50个样本,应满足表1—7中的数额要求。
(2)相互控制配额抽样
相互控制配额抽样,即在按各类控制特性分配样本数额时,要考虑到各类型之间的交叉关系,采用交叉分配的办法。
表1—8即以表1—7为例,采用相互控制配额抽样方法所得的样本配额情况。
从表中不难看出,相互控制配额抽样在分配样本数目时,是将各分类控制特性综合在一起安排的,抽样者必须按照规定从总体中抽取样本。
表1—8相互控制样本配额表
规模
行业地区大型中型小型
甲乙丙丁甲乙丙丁甲乙丙丁商业饮食业
服务业0110
1
12
11
2
02
85
3
4
050
小
计1
124
3171576
合
计5
35
4)滚雪球抽样
滚雪球抽样又称链式抽样、网络抽样、辐射抽样或连带抽样。
它是指利用随机方法或社会调查名义选出起始受访者,然后从起始受访者所提供的信息中取得新的具有某一特征的样本(被调查者)。
它是以“滚雪球”的方式,通过少量的样本单位逐步获取更多样本单位的信息。
其基本步骤为:
先选取少数样本单位,访问这些个体得到所需信息后,再请他们提供另外一些属于所调研目标总体的个体的信息,然后根据所提供的线索,选择此后的样本单位,依此类推,如同滚雪球一样,使样本容量逐步扩大,使调查结果越来越接近总体。
当调查对象为某一特殊群体时,所调查的个体往往不容易取得,只能先取得个别样本单位,然后通过他们去联络其他样本单位,这时滚雪球抽样是最适合采用的方式。
滚雪球抽样的运用前提是总体各单位之间具有一定的联系。
它通常适用于对总体缺乏了解、没有现成的抽样框的情形,一般在产业调研中运用较多。
因为这样的目标总体一般为具有某一特征的群体,即使单位数目少,要调查的样本也往往不容易取得,若让调查者直接去找这些少量的样本个体,也肯定得花费较大的代价,只能借助先找到的个别调查对象,再由他们去联络其他人。
[例]某调研部门如果想了解某市外来农村务工人员的状况,要获得一份完整的名单是极困难的,调查者只能借助已接受调查的农民工去接触新的农民工,即调查者开始只同几个在该市务工的农民进行面谈,了解情况后再请他们提供所知的其他在该市的农民工名单,逐步扩大到所需的外来农民工数目,以通过对这些农民工的调查研究,来全面掌握该市外来农民工的籍贯、所从事工作的性质、经济收入等状况。
(四)规定精度
由于抽样调查是根据样本的数量特征来推断总体的数量特征的,所以它必然存在抽样误差,故抽样的结果常常具有某种不确定性。
如果抽取较大的样本或运用精密仪器和工具,这种不确定性可以大大降低,但往往要花费很多的费用和时间。
因此,抽样调查前要根据所采取的抽样组织形式、经费和对调查指标准确性程度的要求,规定抽样调查所要达到的精度。
(五)确定样本容量样本规模的大小涉及人力、物力、财力的消耗问题,在抽样调查前要审慎地加以考虑,要根据既定的经费、工作时间及规定的精度,依据抽样理论估计样本容量,使得调查工作既符合调查质量的要求,又不浪费人力、物力和财力。
确定样本容量的方法有如下几种:
1•教条式方法——按照"
经验"
来确定样本。
如“凭经验,为保证精确,样本至少应该是总体的5%”。
2.约定式方法一一按某一约定(MR的提供方和使用方都接受的)来确定样本容量。
3.成本基础法按预算控制所要求的调查成本来反推算可接受的样本容量。
当估计精度要求不高时,可采用此法。
总成本包括固定成本(包括设计费用、宣传费用等)和可变成本(包括调查人员的差旅费用、礼品费用等)。
4.统计分析法多目标抽样估计时或针对不
同样本子集进行调研时,通过统计分析计算,获得满足这些子集研究所需要的最小样本量。
进行大规模市场调研时,可考虑采用此法。
5•置信区间法一一按照抽样理论科学地计算能够确保抽样估计精度的样本容量。
大多数具有较高估计精度要求及调查费用预算明确的市场调查都可采用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方案设计