抽样设计.docx
- 文档编号:3844793
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:13
- 大小:47.92KB
抽样设计.docx
《抽样设计.docx》由会员分享,可在线阅读,更多相关《抽样设计.docx(13页珍藏版)》请在冰豆网上搜索。
抽样设计
什么是抽样设计?
开元研究根据多年市场研究经验的积累,总是能够为客户选择出最有效和最经济的抽样方法,并保证抽样的科学性与操作可行性最大限度的结合。
开元研究采用严格的抽样程序,在充分研究客户调研需求、确定访问技术个圈定调查对象的基础上,制定科学的抽样方法。
根据抽样理论,开元研究通常采用的抽样方法包括概率抽样方法和非概率抽样方法。
概率抽样技术方法
-简单随机抽样 -等距抽样 -分层抽样 -整群抽样
定量调查技术方法
-方便抽样 -方便抽样 -判别抽样 -配额抽样 -滚雪球抽样
常用的抽样调查都有哪几种?
国内著名市场研究机构(开元研究)通过10余年的发展,在媒体和广告效果的评估研究中树立了良好的口碑。
在市场研究中常用的抽样调查有:
调超系统误差、定量测量技术、抽样概念、抽样步骤、样本量确定、概率抽样方法、非调超系统误差。
开元研究一贯秉承以专业数据为科学依据,坚持以最真实数据为主导,运用国际通用的科学分析模式,去伪存真,直接真实的反映出问题的真实所在。
什么是调查系统误差?
首先,任何调查所获信息(调查数据)质量都存在误差,而这种误差在评估调查质量时都是必须的,作为调查管理者必须判断这些结果的精度范围。
因此,这就需要仔细研究所使用的调研方法可能导致的误差类型。
综合市场调查理论和实践经验,开元研究对调查中出现的误差做如下的概况(见下图)。
什么是定量测量技术?
(1)测量概念
市场调查测量是指在定量测量中将按特定的规则将数字或者符号合理分配给被调查的目标(包括人、态度、状态或者事件),将其特征量化的过程。
开元研究的量化概念强调的是:
测量的不是被测量者本身,而是被测量者(通常是消费者)的态度、收入、品牌忠诚度以及相关因素等。
测量另一方面的关键是制定和理解规则,它指示被调查者该怎么做。
如,“您对咖啡的喜好程度做出评价,非常喜欢为5分,不喜欢为1分,并按相应的标准分配2、3、4分”。
(2)测量程序
开元研究测量技术的运用采用如下程序:
(3)测量标称
开元研究在调查问卷中所采用的测量标称一般包括四种主要技术类型,详见下表:
标称类型
描述
实践操作
一般运用
统计性描述
类别
用数字来识别对象、个体、事件等
判断相等/不等
简单归类
频数
顺序
提供一种事件或者对象拥有的特点或对应数量信息
判断更大或更小
排序/打分(多用于态度与偏好度研究)
中位数(均值与方差)
等距
拥有类别与顺序量表所有的性质,加上相邻点间的间距是等距的
判断间距的相等性
复杂概念测试及架构偏好度测量
均值/方差
等比
综合上述三种所有性质,加上绝对零点
判断等比的相等性
利用精确工具可获得测量
几何平均数/加权平均数
(4)测量可靠性
测量的可靠性是指测量中可以避免随机误差,从而提供前后一致的数据的程度。
随机误差越小,测量的客观性就越强,调查的结果就越可靠。
通常,开元研究采用如下三种方法评估测量的可靠性。
二次测试法:
为了评估测量的可靠性,开元研究会采用在尽可能相同的条件下使用相同的测量工具进行重复测量,以确定测量的可靠性。
等价测试法:
在同一时间内,使用尽可能类似的两种工具对同一目标进行测量,然后评估其
可靠性。
比较测试法:
在同一时间内,对测量的同一现象的不同样本进行比较。
什么是抽样概念?
抽样是市场调查执行中重要的环节,抽样方法选择的正确与否直接决定着调查数据的可靠程度,同时也就决定了调查的成败。
因此,开元研究总是把抽样作为调查中十分重要的环节对待,力争最大限度保证抽样的合理性和科学性。
正确的抽样必须来自对抽样概念的正确理解,下面简单介绍与抽样相关的基本术语,同时也便于我们尊敬客户的理解。
(1)总体与全域
总体或全域,是指在市场调查中能提供所需信息的个人或者群体的全体。
通常,在调查之前分析人员的首要任务是定义同质总体,并常常涉及到与之密切相关的产品和服务目标市场的界定。
举例来说,一个研究人员正在为一种新型非处方感冒药进行产品创意测试。
他也许会认为被调查的总体包括每个人,因为每个人都会有患感冒的可能性。
但是即便如此,并非每个患者都会选择这种非处方药。
在这种情况下,调查过程中的重要任务是确定哪些人是目标主体,这就要看感冒时他们是否选购或使用这种或多种品牌的药。
只有那些购买或使用的人们,才应包括在总体内。
为总体下定义是抽样调查中关键的一步,为达到市场研究目的,我们在定义调查“总体”时常常基于已有的和潜在的顾客特征。
(2)抽样与普查
普查这一概念用于描述获取总体中每个成员的信息。
市场调研中并不经常用到普查,因为其同质总体一般情况下包括成千上万的个体,这样大规模地进行普查在成本和时间上的耗费都是巨大的,以致在通常情况下是不可行的。
统计学理论证明:
一个相对较小、但精心选择的样本群能准确地反映出被抽查总体的特征,一个样本是总体所有成员的一个子集,从子集获得的有关信息,可以用来估测总体特征,这种方法就是抽样调查。
尽管市场调查中很少用到普查,但是有时它们也适用于某些案例。
譬如,在某著名石油公司、麦当劳、中国电信等神秘顾客访问中,由于总体不大,因此采用的是普查的方式。
另外,在工业品营销中,一个企业只向少量客户销售极为特殊的产品时,普查也是适当和可行的。
什么是抽样概念?
抽样是市场调查执行中重要的环节,抽样方法选择的正确与否直接决定着调查数据的可靠程度,同时也就决定了调查的成败。
因此,开元研究总是把抽样作为调查中十分重要的环节对待,力争最大限度保证抽样的合理性和科学性。
正确的抽样必须来自对抽样概念的正确理解,下面简单介绍与抽样相关的基本术语,同时也便于我们尊敬客户的理解。
(1)总体与全域
总体或全域,是指在市场调查中能提供所需信息的个人或者群体的全体。
通常,在调查之前分析人员的首要任务是定义同质总体,并常常涉及到与之密切相关的产品和服务目标市场的界定。
举例来说,一个研究人员正在为一种新型非处方感冒药进行产品创意测试。
他也许会认为被调查的总体包括每个人,因为每个人都会有患感冒的可能性。
但是即便如此,并非每个患者都会选择这种非处方药。
在这种情况下,调查过程中的重要任务是确定哪些人是目标主体,这就要看感冒时他们是否选购或使用这种或多种品牌的药。
只有那些购买或使用的人们,才应包括在总体内。
为总体下定义是抽样调查中关键的一步,为达到市场研究目的,我们在定义调查“总体”时常常基于已有的和潜在的顾客特征。
(2)抽样与普查
普查这一概念用于描述获取总体中每个成员的信息。
市场调研中并不经常用到普查,因为其同质总体一般情况下包括成千上万的个体,这样大规模地进行普查在成本和时间上的耗费都是巨大的,以致于在通常情况下是不可行的。
统计学理论证明:
一个相对较小、但精心选择的样本群能准确地反映出被抽查总体的特征,一个样本是总体所有成员的一个子集,从子集获得的有关信息,可以用来估测总体特征,这种方法就是抽样调查。
尽管市场调查中很少用到普查,但是有时它们也适用于某些案例。
譬如,在某著名石油公司、麦当劳、中国电信等神秘顾客访问中,由于总体不大,因此采用的是普查的方式。
另外,在工业品营销中,一个企业只向少量客户销售极为特殊的产品时,普查也是适当和可行的。
什么是抽样步骤?
开元研究如果需要完成一个具有可操作性的抽样计划大致需要下列步骤,如下所示:
(1)定义总体(全域)
为了满足市场研究目标,确定可提供信息或与所需信息有关的个体或实体(所具有的特性是十分重要的。
抽样总体可以从以下几方面特征进行描述:
地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。
在调查中,从调查问卷开始部分的过滤性问题,可以看出某个体是否属于总体。
在实际应用中,即使有总体和样本清单,但仍有必要使用过滤性问题识别合格的被访问者。
另外,开元研究为了确定总体,通常情况下,还需要确定那些应排除在外的被访问者的特征。
例如,大部分商业市场调查就因为一些所谓的安全性问题而排除某些个体。
通常,调查问卷上的第一个问题就是询问采访对象或其家庭成员是否从事市场调查、广告或生产与调查内容有关产品的工作,如果采访对象指出他们从事其中某项工作,那么就不必要去采访他了,这就是所说的安全性问题,因为这样的采访对象不保险。
他们也许是竞争对手或为竞争对手服务的。
(2)选择调查方法
如调查方法部分所描述的那样,资料收集方式对抽样过程有重要影响。
例如,电话采访有一种内在优势,购物中心拦截顾客有着自身的劣势。
(3)选择抽样框
开元研究把抽样框定义为被调查总体的数据清单(数据库或者数据仓),从抽样框中可以抽出适合访问的样本单位。
开元研究经过多年的积累,已经拥有了适合不同调查领域的抽样框,这些抽样框,可以部分地满足一些常规性调查的需要。
众所周知,一些抽样框原来根本是不存在的,因此,在调查的初期还要建立符合需要的抽样框。
例如,在一项调查中,调查的总体是那些在近30天内打三轮或三轮以上十八洞高尔夫球的人。
但是,根本就没有一种计算方法可以完全提供这份名单。
在不存在传统意义上的抽样框的情况下,我们需要依据能够产生具有希望特征的样本个体的程序来建立新样本框。
(4)选择抽样方法
制定抽样计划的第四步是选择抽样方法。
选择哪种抽样方法取决于研究目的、研究经费、时间限制、欲调查问题性质等。
可供选择的重要抽样方法可以分为两大类:
概率抽样与非概率抽样,每大类中又有许多可供选择的具体方法。
(5)确定样本量
一旦选定抽样方法,下一步就要确定合适的样本量。
样本量的确定方法将在样本量确定单元中给出。
(6)制定抽样计划
无论使用概率或非概率抽样,在一个研究项目的资料收集阶段必须指定和明确选择样本单位的操作程序。
对于成功的概率抽样的来说,这个程序更为重要,必须详细、清晰。
若不能知道合适的选择样本单位的操作程序,则整个抽样程序会陷入困境。
(7)抽样计划的实施
在实施适于操作的抽样计划前,应先对其进行讨论研究。
这一步很重要,它包括检查、确定是否要根据拟好的详细程序来实施计划。
什么是样本量确定?
确定样本的数量是抽样调查中的重要环节,在充分满足调查内容要求情况下合理的确定样本量不能不说是摆在每个调查公司面前的重要课题,过多的样本量设计只会给客户增加经济负担,对开元研究来讲,我们确定样本量的原则是:
一是达到调查目的,二是给客户省钱。
概率抽样的基本原则是:
样本量越大,抽样误差就越小,而样本量越大,则成本就越高。
根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。
因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
通常,在概率抽样的情况下,开元研究在确定样本量时会遇到如下情况:
预算:
预算的多少直接影响着调查样本量的设计,通常某一项调查为满足调查要求必须有一
个最低的预算指标。
如果低于这个指标的预算,不能满足调查最低精度的话,开元研究建议
要放弃这项调查任务。
经验:
一些客户会经常要求调查公司完成200、300、400等特定的样本量。
这种样本量确定的方法一方面可能考虑了调查误差,另一方面也可能是凭着以前的调查经验。
在这种情况下,如果开元研究认为样本量的设计不能满足精度要求的时候,我们的项目经理会建议所需要增加的样本量,否则调查的结果会出现偏差。
子群分析:
在任何样本量确定的过程中,都必须考虑被调查样本的子群数。
也就是说,当被调查样本群子群数比较多的时候,样本量就必须相应扩大。
如:
某一项调查400个样本量是基本满足要求的,但如果将这些样本量划分为男和女各占50%的话,那么,每个子群只有200个样本。
如果进一步按年龄组细分的话,假设是两个年龄组,那每一个子群只有100个样本,这样的样本量就不能满足最初设计的要求了,因此必须按照子群要求设计样本量则是最合理的。
统计分析:
开元研究在确定样本量时通常在考虑上述具体情况下,会考虑如下统计方面的因素,即:
总体调查标准差;抽样允许的误差和预期置信度。
样本量确定公式:
在充分考虑所有统计因素基础上,开元研究通常采用的简单随机抽样(特别是估计平均值时)的公式为:
N=Z2σ2/E2
其中,N为适合的样本量;Z为调查置信度;σ为总体标准差;E为抽样误差范围。
在解决“比例”方面的调查问题时,友邦顾问所采用的抽样公式为:
N=Z2[P(1-P)]/E2
其中,N为适合的样本量;Z为调查置信度;P为样本的离散程度;E为抽样误差范围。
什么是概率抽样方法?
(1)概率抽样概念
定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。
在实际应用中,概率抽样方法是开元研究最常用的方法之一。
概率抽样包括以下几个方面的优点:
1.调查者可获得被抽取的不同年龄、不同层次的人们的信息;
2.能估算出抽样误差;
3.调查结果可以用来推断总体。
例如,在一项使用概率抽样法的调查中,如果有5%的被
访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体
情况。
另一方面,概率抽样也有一些弊病:
1.在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;
2.概率抽样比非概率抽样需要更多时间策划和实施;
3.必须遵守的抽样计划执行程序会大量增加收集资料的时间。
下面,我们将介绍几种开元研究最常采用的概率抽样技术。
(2)简单随机抽样(Simplesampling)
简单随机抽样是一种广为使用的概率抽样方法。
是最完全的概率抽样。
如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。
在简单随机抽样条件下,抽样概率公式为:
抽样概率=样本单位数∕总体单位数
例如,如果总体单位数为10000,样本单位数为400,那么抽样概率为4%。
简单随机抽样的优点在于,它看起来简单,并且满足概率抽样的一切必要的要求,保证每个总体单位在抽选时都有相等的被抽中的机会。
简单随机抽样可以通过电话随机拨号功能完成这个步骤,可以从电脑档案中挑选调查对象。
同样,简单随机抽样会遇到“样本可能分布不均匀”以及“没有好的抽样框”等问题。
开元研究在简单随机抽样过程中常使用的技巧为“抽签法”和“随机表”法。
(3)等距抽样(Systematicsampling)
在定量抽样调查中,等距抽样常常代替简单随机抽样。
由于该抽样方法简单实用,所以应用普遍。
等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。
样本距离可通过下面公式确定:
样本距离=总体单位数∕样本单位数
例如,假设你使用本地电话本并确定样本距离为100,那么100个中取1个组成样本。
这个公式保证了整个列表的完整性。
等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。
假设从第5页开始,在该页上再另选一个数决定从该行开始。
假定选择从第3行开始,这就决定了实际开始的位置。
等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。
等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。
使用等距抽样方式最大的缺陷在于总体单位的排列上。
一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。
(4)分层抽样(Stratifiedrandomsampling)
定量调查中的分层抽样是一种卓越的概率抽样方式,在开元研究以往的调查中经常被使用。
分层抽样的具体程序是:
把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。
总体各单位按主要标志加以分组,分组的标志与我们关心的总体特征相关。
例如,我们正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志。
如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。
分层抽样与简单随机抽样相比,我们往往选择分层抽样,因为它有显著的潜在统计效果。
也就是说,如果我们从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。
另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
在调查实践中,为提高分层样本的精确度实际上要付出一些代价。
通常,我们现实正确的分层抽样一般有三个步骤:
首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。
例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。
为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。
用这种方式可识别出各种不同的显著特征。
调查表明,一般来说,识别出6个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。
第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?
)。
利用这个比例,可计算出样本中每组(层)应调查的人数。
最后,调查者必须从每层中抽取独立简单随机样本。
(5)整群抽样(Clustersampling)
以上各种抽样类型全部是按单位抽取的,即按样本单位数,分别一个单位一个单位地抽取。
在整群抽样中,样本是一组单位一组单位地抽取。
整群抽样有两个关键步骤:
1.同质总体被分为相互独立的完全的较小子集。
2.随机抽选子集构成样本。
如果调查者在抽中的子集中观察全部单位,我们就有了一级整群样本。
如果在抽中的子集中再以概率方式抽取部分单位观察,我们就有了二级整群样本。
分层和整群抽样都要将总体分为相互独立的完全子集。
它们的区别是,分层抽样的样本是从每个子集中抽取,而整群抽样则是抽取部分子集。
地理区域抽样是整群抽样的典型方式。
挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域,较集中地访查一些群体,大量减少访问时间和经费。
整群抽样被认为是概率抽样技术,因为它随机抽出群和随机抽出单位。
值得注意的是,在整群抽样下,我们假定群中单位与总体一样存在异质性。
如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。
一般来说,要解决这个问题可以扩大群数,然后从各群中抽取少量单位数,以保证样本的代表性。
什么是非概率抽样方法?
(1)非概率抽样的概念
非概率抽样也是市场调查中比较常采用的手段之一,如配额抽样等。
非概率抽样是指从总体中非随机地选择特定地要素(单位)。
有目的的非随机抽样可能会系统地排除或过分强调总体的某些部分特征。
非概率抽样的缺点恰是概率抽样的优势:
A.不能估计出抽样误差;
B.不知道抽中的单位所具有代表性的程度;
C.非概率抽样的结果不能也不应该推算总体。
在实际操作过程中,非概率抽样经常被市场调研人员使用,其原因与本身固有的优势有关:
非概率抽样比概率抽样费用低。
非概率抽样的这一特点对那些精确性要求补不严格的调查有相当大的吸引力。
试探性调查就是其中的一例。
一般来讲,非概率抽样实施起来要比概率抽样用的时间少。
正是由于非概率抽样具有上述的不足,因此,如果合理运用非概率抽样,它能产生极具代表性得合理的抽样结果,是我们开元研究经常思考并试图解决的一个重要问题。
在实际应用过程中,非概率抽样的结果不能计算其抽样误差,这意味着评估非概率抽样的总体质量有很大的困难,因为我们清楚地知道它们不满足概率抽样所必需的标准,但问题是它们脱离标准有多远?
调查设计者事先必须对非概率抽样进行评估,评估应该建立在对非概率抽样方法论仔细评价的基础上。
评估需要注意的是,使用的抽样方法是否能够覆盖目标总体的各个部分?
或者样本是否无目的地倾向于一些特殊群体?
这些都是开元研究调查人员在调查设计与抽样评估时必须仔细考虑的问题。
在实际工作中,我们经常使用的非概率抽样方法包括四类:
方便抽样、判断抽样、配额抽样和滚雪球抽样。
(2)方便抽样(Conveniencesampling)
方便抽样是根据调查者的方便性,以无目标、随意的方式进行的抽样调查活动。
例如,常见的无限制的街头拦访和随意的入户访问就是方便抽样的常见形式。
在某些调查测试中,方便抽样会取得快速有效的结果。
在进行探索性调研时,即缺乏经验而又急需真实数据的近似值时,这种方法也很实用。
(3)判断抽样(Judgmentsampling)
判断抽样适用于调查员或者调查专家基于选择标准或者条件抽取典型样本的情况。
一般商业机构进行的市场或产品测试调查基本上都属于判断抽样的范围。
在进行探索性调研时,如抽取深度访谈样本的情况下,就可以采用这种方法。
(4)配额抽样(Quotasampling)
配额抽样是根据一定标志对总体分层或分类后,从各层或各类中主观地选取一定比例的调查单位的方法。
所谓“配额”是指对划分出的总体各类型都分配给一定的数量而组成调查样本。
因而,配额抽样较之判断抽样加强了对样本结构与总体结构在“量”的方面的质量控制,能够保证样本有较高的代表性。
配额抽样类似于随机抽样中的分层抽样。
不过,有两点重要的区别:
首先,配额抽样的被调查者不是按随机原则抽出来的,而分层抽样必须遵守随机原则。
其次,在分层抽样中,用于分类的标志,应联系研究目标来选择,而配额抽样无此要求。
(5)滚雪球抽样(Snowballsampling)
滚雪球抽样是指先对随机选择的一些被调查者实施访问,然后再请他们推荐属于研究目标总体特征的调查对象。
这种方法用于低发生率或少见的总体中进行抽样,因为要找到这些少见的个体,代价是很大的,使得调查人员因为费用的原因不得不使用类似滚雪球这样的抽样技巧。
滚雪球抽样调查的优点是调查费用大大减少,然而这种成本的节约是以调查质量的降低为代价的。
整个样本很可能出现偏差,因为那些个体的名单来源于那些最初调查过的人,而他们之间可能十分相似,因此,样本可能不能很好地代表整个总体。
另外,如果被调查者不愿意提供人员来接受调查,那么这种方法就会受阻。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 设计