选择研究对象的方法10页精选文档Word文档格式.docx
- 文档编号:22338649
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:20
- 大小:52.48KB
选择研究对象的方法10页精选文档Word文档格式.docx
《选择研究对象的方法10页精选文档Word文档格式.docx》由会员分享,可在线阅读,更多相关《选择研究对象的方法10页精选文档Word文档格式.docx(20页珍藏版)》请在冰豆网上搜索。
又如,我们要了解上海市小学三年级学生的识字量是多少?
由于全市小学三年级学生数量巨大,不可能给每个学生都测量一下,研究只能在上海市小学三年级学生总体中抽取部分个体对他们进行识字量测验,然后从得出的研究结果推断全市小学生的识字量。
假设上海市小学三年级学生总体为100000人,从中随机抽取样本1000人,并对这1000人进行识字量测试,获得结果为平均识字量1600字,然后根据测试结果推断上海市小学三年级学生平均识字量为1600字左右。
抽样的基本原理见下图:
随机抽样
研究结果
推断
图7-1抽样基本原理关系图
抽样是以概率论为理论基础。
抽样的作用是为了合理地减少研究对象,既可以节约人力、物力、时间,又可使研究力量相对集中,使研究工作深入、细致,从而提高研究的准确性和可靠性。
一般来说,定性研究中抽取的样本很小,样本有时仅仅是一个案例或一个个体,研究目的是为了对所研究对象进行更深入的了解。
而定量研究的样本数较大,样本可以是一群个体,并要考虑样本能否准确代表总体,能否对总体作出推断。
二、抽样的基本要求
抽样是有一定规则的,抽样的基本要求是:
1.总体范围的确定
抽样,首先要明确规定抽样的总体范围,一般来说,研究课题和研究目的决定了总体的范围。
如,“上海市区初中学生身体素质的调查”这个课题的总体就是上海市区全体初一至初三的中学生,不包括郊县的初中生。
如果总体范围不很清楚,在抽样前应对总体做出明确的规定。
否则,会对抽取样本和研究结果的推断造成麻烦。
通常研究课题的确立就已基本框定了总体范围,研究者要考虑的是为什么要确定该总体的理由,以及研究的预期效果和可行性问题。
2.抽样的随机化
抽样要尽可能做到随机化(random)。
随机化是指总体中的每个个体被选入样本的概率(probability)不为零。
也就是说,总体中的每一个个体入选的机会均等。
随机是科学研究的基本原则。
抽样的随机化是一种精确而科学的过程,是科学研究结果可靠性的保证,可以避免研究者自觉或不自觉的偏见。
抽签、摇奖就是根据抽样的随机化原理设计的。
严格的抽样必须是随机的,这样可避免研究者的主观倾向或人为因素造成的抽样偏差(samplingbias)。
3.样本的代表性
样本的代表性指样本应具备总体的性质或特征,样本能在较大程度上代表总体。
样本研究的关键在于抽样和推论,抽样是推论的先决条件,样本的代表性会影响研究结论的可靠性和研究结论的推断程度。
代表性越高的样本,其研究结果的普遍性就越大;
反之,如果样本没有代表性往往会导致研究的失败。
常为人引用的一个例子是:
1936年美国的总统大选,当时美国的《文学文摘》杂志曾做了一次关于总统大选的民意调查,调查结果预测兰登将在总统选举中获胜,罗斯福落选。
但事实正好相反,选举结果是罗斯福当选总统。
虽然《文学文摘》杂志的民意调查样本数很大,但调查者的样本是从电话号簿和汽车登记册中抽取的。
1936年正是美国经济大萧条过后,有汽车有电话的人仅代表了美国选民中的某个特定阶层,对于选民总体来说不具备代表性。
这次民意调查的失败主要在于抽样偏差,样本没有代表性,抽取的样本在质上与总体特征不相吻合。
与此同时,盖洛普民意调查所也作了总统大选的调查,只发了2000份问卷,结果预测成功,罗斯福当选总统。
后来盖洛普嘲笑《文学文摘》杂志说:
“用两匹马来拉的车,用50匹马来拉是无用的。
”
4.合理的样本容量
样本容量又称样本大小,是指抽取样本的具体数量。
样本数量的多少是研究无法回避的问题,是研究设计中重要的一环,也是比较困难的一件事。
它既要符合研究目的、内容,满足教育统计的要求,又要考虑抽样的可能性,并使误差减少到最低限度。
一般来说,样本数越多,代表性越好,但是增大样本,势必增加研究的人力、物力、财力,增加研究的难度,造成不必要的浪费。
如果样本数太小,则抽样误差较大,样本不能代表总体,不利于统计分析,影响研究效果。
样本数量究竟多少为宜,这是一个复杂的问题。
我们很难说出一个确定的数字,样本数量要从多个方面综合起来考虑。
一般来说,样本容量大小取决于以下一些因素:
(1)研究的类型、范围
当研究是定量研究,研究范围较广,样本数量可适当大一些;
反之,当研究是定性研究,研究范围较狭窄,样本数量可适当少一些。
(2)研究分析的精确程度
当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可多些;
反之,则可少些。
(3)允许误差的大小
当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;
反之,则可小些。
表7-1表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样本数量。
表7-1允许误差和可信程度与样本容量关系表
可信程度
允许误差95%99%
1%960416587
2%24014147
3%10671843
4%6001037
5%384663
6%267461
7%196339
(4)总体的同质性
当总体的变异性比较大,变量的相关程度比较低,研究的条件控制不严格,样本数量可适当增加些;
反之,当总体同质性比较好,变量的相关程度较高,研究条件控制严格,则可少些。
如,人的血液同质性比较好,医院化验只需抽取一点点血。
学生的智力、能力变异性比较大,因此抽取样本相对比较大。
(5)测量工具的可靠程度
当测量工具的可靠程度即测定指标信度比较低时,测量的误差就比较大,这时需要增大样本数量;
反之,则可减少样本数量。
一般说来,有关学习能力和成就的测量工具可靠性程度好些,有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。
(6)研究的成本
研究的成本包括经费、时间、人力、物力,抽样数量总是要控制在研究成本允许的范围内。
因此,确定样本容量时,必须仔细分析研究的条件,量体裁衣。
(7)分析的类别
当研究的关系复杂,分析的项目较多,那么样本数量可多些;
一般应保证每一分析小类的样本数量不少于10。
以上七个方面都是原则性的意见,可作为决定样本容量大小的参考依据。
下面根据实际经验提供一些可参照的数据:
教育研究中的调查或描述现状的研究,样本数量最好不要少于100;
相关性研究中,样本数量最好不少于30;
实验研究中,每组样本数量最好不少于30;
全国性的调查,样本数量控制在1500—2500之间;
地区性的调查,样本数量控制在500—1000之间。
当然,以上给出的数字仅仅供参考,在研究中具体样本数为多少,还需根据实际情况作出决定。
对于初学者,不妨先查看有关文献中的同类研究,别人的样本数量是多少以作为参照。
另外,我们还可以根据推算样本数量的公式计算出总体数量与样本数量的参照数据,见表7-2
表7-2有限总体数量与样本数量关系表
总体数(N)1020501002005001000200050001000050000100000
样本数(n)10195080133217278322357370382384
注:
可信度为95%,允许误差5%
从总体与样本数量的关系表中可以发现,样本数并不是随总体数量的增加而同步增加的。
当总体数量不断增加,样本数量的增长逐步减缓,在总体数量与样本数量曲线图上呈一条负加速的增长曲线。
见图7-2
样本数(n)
总体数(N)
图7-2有限总体数量与样本数量关系曲线示意图
由此可见,当总体大于10000,接近无限总体时,样本数量的增长微乎其微,在曲线图上几乎就是平走。
三、抽样的基本过程
抽样的基本过程从研究设计考虑抽取研究对象开始,到完成抽样获得实际样本为止,大约经历以下四个操作步骤:
1、研究对象或理论总体
总体就是研究对象的全部。
课题确立时的总体往往是虚拟的,是理论上的总体。
如,进行一项有关10岁儿童生长发育的研究,如果期望以研究结果解释全世界的10岁儿童,那么理论总体就是全世界10岁儿童;
如果期望以研究结果解释全中国的10岁儿童,那么理论总体就是全中国的10岁儿童;
如果期望以研究结果解释上海市的10岁儿童,那么理论总体就是上海市10岁儿童;
如果期望以研究结果解释某一学校的10岁儿童,那么理论总体就是某校的10岁儿童。
由此可知,总体的范围可大可小,由研究者依据研究目的自行界定。
如何界定总体可以参考以下几点:
(1)考虑并说明采用“特定群体”为总体的理由(为什么?
理由何在?
)
(2)考虑并说明不采用“其他群体”为总体的理由(为什么?
(3)考虑研究的预期效果(结果的推广程度)
(4)考虑研究的可行性(研究的必要条件)
2、可获得总体或抽样框架
理论总体往往是虚的,不是一个实在的、可操作的总体。
而可获得总体则是实在的、具体的、可操作的总体。
抽样框架是抽样单位的实际名单,样本就是从抽样框架中选取。
如果一个学生样本是从学校的学生花名册中抽选,这个花名册就是抽样框架。
比较复杂的抽样,抽样框架可以有不同的层次。
如先抽取不同类型的学校,然后再从学校花名册抽取个体。
通常确定课题基本上规定了研究的总体,根据这个总体再去寻找可能的抽样框架,然后对这个抽样框架进行检验和评估,看这个抽样框架是否符合研究要求。
3、选择样本
选择样本是指通过抽样方法得到的样本数量,是被选取参与研究的人员。
这个样本数量只是理想上的数量。
4、实际样本
实际样本是指实际参与研究的样本数量。
如果进行问卷调查的话,实际样本相当于回收问卷的数量。
例如,我们要对当前高中教师的教学理念的变化进行调查,理论总体是上海市所有高中教师,可获得总体是某个区的高中教师,抽样框架为该区的高中教师2000人,选择样本为300人,而实际样本即实际参与研究的教师为270人。
在实际社会科学研究中,总体与抽样框架的问题并未引起重视,一般来说,根据样本所得的研究成果只能代表组成抽样框架的总体,只能推断组成抽样框架的总体。
在抽样过程中,确定样本的大小是一件重要的事,也是一件相当困难的事。
样本太小,不能代表总体,也不利于统计分析;
可是一旦增大样本,势必增加收集资料所需的人力、物力、以及时间等资源,而且庞大资料的整理与分析也较困难。
研究者必须在两难中作出决断。
博格(W、R、Borg)与高尔(M、D、Gall)建议,在下列情况下要有较大的样本:
1、研究中有较多的变量未于控制时
2、预期效果可能由于研究变量的性质而较不明确时
3、当研究样本必须再细分为次项目来分析时
4、当预期会有较多被试退出研究时
5、当总体的异质性较大时
6、当测量工具的可靠程度较低时
7、当期望有较高的统计显著性或统计鉴定力时
一般来说,样本容量不如样本的准确性重要,即使样本容量很大,如果选择不当,也会得出无效结论,因此谨慎抽样比增加样本容量更重要。
哈佛大学教育研究院的莱特(R.J.Light)等人以预设的的统计鉴定力来表示进行研究时所需要的样本人数,见下表:
表7-3以统计鉴定力推估样本人数表
预期效果大小
研究类型统计检验方法统计鉴定力小中大
相关研究积差相关.90104711387
.807838528
.706166723
实验研究或t检验.90105217068
事后回溯研究.8078612852
.7062010040
统计显著性程度为5%。
(引自吴明清:
《教育研究——基本观念与方法分析》五南图书出版公司,1991年,第231页)
表中左栏是研究方法的类型;
表的第二栏是统计方法;
第三栏是统计鉴定力,分为.90、.80、.70三个层次,研究者可以自行决定一个层次,鉴定力越大表示研究者期望辨识研究效果的可能性越大;
最后一栏是预期的效果大小,包括小、中、大三个层次,研究者必须依据理论、经验、以及先前类似研究的结果来判断并决定。
例如,要比较12岁女生与18岁女生的身高差异时,我们判断其效果大小应属于“大效果”,因为经验上这两类女生的身高有相当大的差异;
如果比较15岁女生和8岁女生的身高差异,则属于“中效果”;
若比较17岁女生与18岁女生的身高差异,应属于“小效果”。
如果以相关系数表示效果大小,那么相关系数在.1左右属于“小效果”,相关系数在.3左右属“中效果”,相关系数在.5以上者属“大效果”。
从两组平均数差异来看效果大小,差异在.20个标准差者为“小效果”,在.50个标准差者为“中效果”,在.80个标准差者为“大效果”。
如果我们要进行一项两种不同教学方法的比较实验研究,看哪种教学法法效果好。
首先,我们确定这是一个比较两组平均数差异(实验组与控制组之间差异)的研究;
其次,我们设定统计鉴定力为.90(我们期望有较大的可能性确定研究效果);
并且进一步判断这类研究的效果应属于“大效果”(容易显示效果)。
根据以上判断,从表上找到样本人数为68人,即实验组要有34人,控制组要有34人。
如果将统计鉴定力降为.80,则样本人数为52人,如果将统计鉴定力再降为.70,则样本人数为40人。
为了保证研究结果能在统计分析中明显显示,在实际研究中,样本数最好不要少于表中规定的人数。
四、抽样的具体方法
教育研究一般都从总体中抽取一小部分个体作为收集资料的直接对象,这一小部分对象即为“样本”。
抽取样本进行研究,不但节省人力物力,也缩短资料取得与整理的时间,故成为教育研究的主要方式。
抽样的具体方法多种多样,抽样的方法可以分为两大类:
概率抽样和非概率抽样。
概率抽样(probabilitysampling)是以“概率”为基础的抽样方法,它的核心技术为“随机样本”。
主要抽样方法有:
简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样等。
概率抽样样本具有代表性,可以作推论,常用于正式的、量化的研究。
非概率抽样(non-probabilitysampling)是根据研究者的主观判断、或根据客观条件的方便来抽样,不涉及概率原则。
方便抽样、目的抽样等。
非概率抽样不具代表性,通常不能推断总体,常用于非正式的、质化的研究。
1.概率抽样
概率抽样就是研究总体中每个个体被抽取的概率是已知的,抽样方式是随机的。
概率抽样常用于定量研究或大规模的正式研究中。
具体的抽样方法有:
(1)简单随机抽样
简单随机抽样是概率抽样中最基本的,运用最广泛的抽样方法。
它简便易行,是其他抽样方法的基础。
简单随机抽样总体中的每一个体都有被抽到的同等机会,可通过抽签、随机数字表或摇号机摇号等来实现抽样。
抽签。
先给总体中的每个个体编上号码,每个号码做一个签,将全部的签充分混和后,随机从中抽取,被抽到签号的个体进入样本,直到取够所需样本数目为止。
例如总体共50人,要抽取样本10人。
我们先给总体编号,从1-50,然后随机抽10个号,抽中号的个体即作为样本。
简单随机抽样见下图:
可获得总体样本样本举例
12345678910随机抽取10个
111213141516171819203,22,23,29,
2122232425262728293037,39,40,41,
3132333435363738394045,50
41424344454647484950
图7-3简单随机抽样示意图
随机数字表随机数字表是由许多随机组合排列的数字组成的表(见表7-4),用它可以进行简单随机抽样。
复印表7-4随机数字表
例如要从总体800人中抽取100人的样本,先给800人从001-800编号,然后从随机数字表中任何一行,任何一列的任何数字开始,按任意方向依次取三位数(由于本例个体编号为三位数),凡是碰到001-800范围内的数字即为中选的号,直至取足100个号为止。
其中如果某号大于800或已被抽取过再次出现,则跳过不算。
例如从表7-4随机数字表第18行,第1列开始向右取三位数,803(略去,因为超过800),270,267,198,191,843(略去),429,081,349,268……直到抽足100个号为止。
这100个号的被试就构成了该研究所需的样本。
另外,功能较全的计算器都编有随机数字程序,可利用计算器的这一功能进行随机抽样。
以卡西欧(CASIO)fx-3600型计算器为例,操作过程为:
开机后,按INV键和.键,显示屏上出现三位小数,这三位小数就是随机数字,不断地重复按INV键和.键,显示屏上就会不断地出现随机数字。
用计算器随机抽取样本的基本程序与随机数字表的基本程序一样,直到取足样本为止。
(2)系统随机抽样
系统随机抽样又称等距抽样或机械抽样,是把总体中的所有个体按某一顺序排列编号,然后依固定的间隔抽取样本。
先随机确定第一个样本数后,根据样本与总体的比例,每间隔n个数抽取一个。
例如,要从800名学生中抽取100人作为被试,先将被试按序编号,再按公式计算抽样间隔的数字:
800÷
100=8,再从1-8中随机选定一个数字,假定为6,那么编号6,14,22,,30,38,46……798这100个号码的被试构成了系统随机抽样的样本。
系统随机抽样使样本分配均衡,更具代表性,抽样误差较简单随机抽样小,操作也较简单,实际应用较广。
系统随机抽样见下图:
12345678910随机开始后
11121314151617181920每5个抽13,8,13,18,
2122232425262728293023,28,33,38,
3132333435363738394043,48
图7-4系统随机抽样示意图
(3)分层随机抽样
分层随机抽样又称分类抽样或配额抽样,是将总体按某一标准分成若干层次或类别(子总体),然后以各层或各类在总体中所占比重,按比例随机抽取样本。
例如对某校800个学生进行学习态度的调查,拟抽取十分之二的学生(160人)作为样本。
首先按成绩评定标准将学生分成优、良、中、差四层,优(160人),良(320人),中(240人),差(80人)。
然后用简单随机抽样在这四层中按比例分别抽取样本,从优等中抽取160ⅹ2/10=32人;
从良等中抽取320ⅹ2/10=64人;
从中等中抽取240ⅹ2/10=48人;
从差等中抽取80ⅹ2/10=16人。
这160人组成了分层随机抽样的样本。
分层随机抽样确保每层子总体都被包容在抽样范围内,避免了某一子总体出现“超载”现象或出现意外样本。
对于总体构成比较复杂,同质性程度不高,总体数量较大,各层次标志比较明显的情况下,宜采用分层随机抽样。
分层随机抽样见下图:
12345678910随机抽取4个
111213141516171819201,7,12,13,
2122232425262728293021,22,23,30,
3132333435363738394032,35
41424344454647484950随机抽取6个
图7-5分层随机抽样示意图
(4)整群随机抽样
整群随机抽样就是以自然群体(学校、班级等)为单位,从较大的群总体中随机抽取样本,整群随机抽样与其他抽样方式的区别在于:
它抽取样本的单位是群体,不是个体。
例如要在某区初一年级进行一项研究,我们可以随机抽取几所学校,在这几所学校初一年级中再随机抽取两个班级作为样本,班中的所有个体都为被试。
采用整群随机抽样比较方便,也切实可行。
这种抽样不会因研究而打乱原有的班级,能兼顾到常规的教学秩序,不会影响师生之间的配合。
整群随机抽样可以节省取样在人力、物力上的费用,最适合于总体范围大,抽样数量多的研究。
但是整群随机抽样所获得的样本分布可能不均匀,群体间可能会存在差异,在一定程度上会影响样本的代表性。
因此,当采用整群随机抽样时,要考虑群体和群体之间是否同质。
一般来说,按常态编班的班级,彼此间有较高的同质性,按能力分班的班级,同质性较低。
2、非概率抽样
非概率抽样是指每个研究对象被抽取的概率是未知的,抽样方式不是随机的,样本通常是按研究目的而选择的。
非概率抽样常用于定性研究或小范围的非正式的研究中。
(1)目的抽样
目的抽样是在研究情境不能运用随机抽样时,为达到研究目的,研究者根据自己的判断而选择样本的抽样方法。
目的抽样与随机
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选择 研究 对象 方法 10 精选 文档