书签分享收藏举报版权申诉 / 28

立即下载加入VIP,免费下载

当前位置：首页 > 医药卫生 > 基础医学 > 第十四章实验设计.docx

第十四章实验设计.docx

文档编号：30208317
上传时间：2023-08-07
格式：DOCX
页数：28
大小：78.71KB

第十四章实验设计.docx

《第十四章实验设计.docx》由会员分享，可在线阅读，更多相关《第十四章实验设计.docx（28页珍藏版）》请在冰豆网上搜索。

第十四章实验设计.docx

第十四章实验设计

第一节实验设计概述1

第二节实验设计的一般格式与内容10

第三节单因素实验设计的类型13

第四节双因素实验设计16

本章小结18

练习与思考题18

问题

某教师准备在所任教的班级进行两种教学方法的比较实验，一研究者则欲研究不同的测验方式（如电脑测试与纸笔测试）和不同的测验顺序（如先电脑后纸笔与先纸笔后电脑）对被试测验成绩的影响。

诸如此类的问题均需要在研究之前进行相应的心理与教育实验设计。

学习目标

1．理解实验设计的意义

2．掌握实验设计的一般格式和内容

3．掌握单因素实验设计的各种类型

4．了解双因素设计的思想和方法

描述统计分析与推断统计分析必须在研究数据真实、准确、可靠的基础上，才能获得正确的统计结论。

实验设计既是实验工作的难点，也是实验工作的关键。

一切科学实验都讲究设计问题，人们常说“一个良好的实验设计，等于实验成功了一半”。

而心理与教育实验研究的对象是人，因其变异性、复杂性及众多的影响因素等特点，没有良好的设计，要获得有效、合理、具有代表性的实验结果是不可能的。

因此作为教育研究工作者，应当懂得实验设计的理论与方法。

实验设计可单独作为一门课程开设，内容丰富而复杂，本章只对实验设计的初步知识进行介绍。

第一节实验设计概述

一、实验设计的意义

（一）实验设计的定义

实验设计（designofexperiments）是为了回答研究者的某种问题，根据特定的数学模型，遵循R.A.Fisher提出的实验设计三大原则而设计的实验方案。

它有着广义与狭义之分。

广义的实验设计是指包括整个实验程序的设计，即实验程序的全部设计和安排，具体包括确定课题、选择课题、制订实验方案、提出实验方法、实施实验和处理并解释实验结果等。

狭义的实验设计则是制订关于实验进程的计划，即实验方案。

这个计划应力求使实验用最少的人力、物力和时间取得最有效的材料、数据，为因果推论提供合理的逻辑基础。

具体包括实验假设的建立、实验变量的操作与控制、反应变量的观测、无关变量的控制、研究总体的规定与被试的选择与分组、数据处理方法的确定等。

值得注意的是，实验与实验设计是两个不同的概念。

实验指具体的实施实验，实验设计则是实验的方案和计划，它是实验的组成部分。

（二）实验与实验设计的作用

实验设计是整个科学研究过程的有机组成部分。

其在科学研究中的作用如图10-1所示。

图14-1研究过程图

研究者在原假设Hi的基础上通过演绎获得Hi的某个推论。

而这种推论是否正确、全面，需要经过实验设计Dj的实验所获得的有效的、新的数据进行归纳，修改Hi为Hi+1。

而新的、有效的数据是实验设计Dj过滤了实验中的干扰因素后所获得的自然界的真实状况的反映。

之后，研究者再用新的假设Hi+1代替原假设Hi，进行新的研究过程。

可见，实验研究是一个“假设—验证—再假设—再验证”的循环往复的过程。

实验法与调查法、测验法的不同在于探索客观事物之间的因果关系。

因果关系是事物内部及事实之间相互联系的一种形式，是一种引起与被引起的关系。

“谁是因，谁是果；因在前，果在后”是确定的，不能颠倒。

二、实验与实验设计的要素与基本原则

（一）要素

实验设计的要素主要有五个方面。

一是实验单位（experimentsunit），它是实验所抽取的实验对象，即被试（subjects）。

二是实验因素（experimentsfactor）或因子，它是对实验结果可能产生影响的自变量。

因子有定量因素与定性因子之分。

例如，年龄、智商、工资等均为定量因子；性别、民族、国籍、学校等则为定性因子。

在实验中，即可以是单独的定量因子或定性因子，也可以将定量与定性因子结合起来。

三是因子水平，简称水平（level），它是给定的因子取值（定量的）或特定因子的配置（定性的）。

四是处理组合，简称处理（treatment），它是不同因子的相应水平所构成的组合。

处理可以是为了观察实验情景中的效应所施加的综合训练，也可以是为了比较各效应的大小所应用于的控制条件。

例如，某教师研究识记方法与年龄的关系，其处理组合则有四种，具体如表10-1所示。

表10-1识记方式与年龄的研究

B因素

识记方法

A：

年龄（单位：

岁）

6－12（a1）13－18（a2）

机械识记（b1）

意义识记（b2）

a1b1a2b2

a1b2a2b2

五是反应或效应（effect），它是因子的某个水平在一个实验单位上所做的测量。

（二）实验的原则

心理与教育实验是在一定的哲学思想与科学方法的指导下进行的，就教育对象的特定性而言，进行实验应遵循三个基本原则。

一是客观性原则，即实事求是的原则。

它要求研究者在研究中忠于事实，按照事物的本来面目去反映而不应有任何的主观臆造或任意揣测。

为此，研究者必须对课题及实验对象不抱任何偏见和成见，对观察和搜集的事实材料、数据作如实的记录，按照要求处理材料，作出结论。

要全面充分地反映材料，不仅要发现和记录与自己期望相符的事实，而且要发现和记录与自己预期不相符的事实。

此外，还要具有复制性，即在相同的实验条件下，使用相同的研究程序和方法，别人能得到与你基本相同的资料或结论。

当然这种复制性是相对的，这是因为实验现象是随机，实验条件是千差万别的，因此绝对相同的复制是不可能的。

二是控制性原则，一方面要严密地进行实验因子的操作，避免实验因子各水平之间或各种处理组合之间发生混淆。

另一方面则要排队无关因子的干扰。

为了不影响实验因子效应的正确观测和归因，必须保证所观测的反应变量确实是实验变量所引起的，于是必须控制那些对实验结果产生影响的无关因子进行控制。

例如进行“多媒体教学法”在扩大学生知识面和提高学业成绩的效果时，其实验变量为教学方法，反应变量是学业成绩。

除教法外，至少还有教师方面（如教师自身的专业水平、工作态度、业务能力、工作时间等）、学生方面（年龄、性别、智力水平、学习时间、原有基础、个性品质等）、教学内容（如教材内容的广度与深度）及教学环境（如教学设施与设备、关怀程度等）等因素对反应变量产生影响，若不控制这些因素，则获得的差异结果就无法断定为教学方法的效果。

三是教育性原则。

心理与教育研究与其它研究领域的不同在于我们的研究对象是人，而且是正在发育成长过程中的儿童青少年。

教育的出发点是教书育人，我们之所以开展研究正是为教好书，育好人，否则研究就失去了意义和价值。

对人的研究不能象其它自然物，在任何情况或条件下都可以拿来作样品、作被试。

实验研究应当充分考虑到实验的实施是否有利于儿童身心的健康发展，决不允许向儿童呈现有违教育目的、任务的图片、问题及作业等。

（三）实验设计的基本原则

上面我们阐述了实验的基本原则。

作为实验的前秦——实验设计也有其遵循的原则。

实验设计的基本思想是由英国统计学家R.A.Fisher在进行农业田间实验中提出的。

后来被种类实验作为设计的基本原则一直延用至今。

1．重复性原则。

要求每一因素水平或处理组合的实验次数不得少于2。

其作用在于使实验者得到实验误差的估计量，减少实验误差。

2．局部控制原则。

心理与教育研究讲究控制，但与自然科学的全面控制不同，我们采用的是局部控制。

一方面由于心理与教育研究的复杂性和可变性，无法做到控制所有影响因素；另一方面若控制了所有影响因素，实验结果与自然情景的会相关甚至远，推广应用受到限制，同时需要花费大量的人力、物力、时间。

因此，我们力求在同一重复区内，使环境条件、技术措施、实验管理方法等尽可能一致，防止因环境条件等因素的异质性干扰，从而减少实验误差。

3．随机化原则。

统计分析的前提是随机样本，凡不符合随机样本的数据是不能够采用这些统计方法来分析的。

因此，实验设计时一定要随时注意随机化的问题。

实验设计中需要随机化的因素主要有四个方面。

一是被试抽取的随机性。

要求被试样本完全是按照随机化的原则从总体中抽取出来的，这样获得的样本才为随机样本。

当总体相当庞大时，可采用随机化团体取样的方法，先得到一个随机团体样本，然后在此基础上最终获得随机样本。

例如研究某省中学生考试焦虑的问题，需要抽取1000名学生。

则先将该省所有城市编号，从中随机抽取10个城市组成随机团体；然后再对这10所城市中的每所中学编号，从中随机抽取10所中学，得到100个中学的随机样本；之后再对这100所中学编号，从中随机抽20学校；最后在这25的学校中，每校随机抽取50名学生，获得一个1000人的随机样本。

二是被试分组的随机性。

用随机化得到的随机样本只能说明它具有总体的代表性。

在实验研究中，往往需要多个组的被试参与实验，那么谁为实验组，谁为对照组等，这时被试的分配也要求按照随机化的原则进行操作。

被试的随机分配是实验分组随机化的重要条件，这种使用随机化原则和方法产生的被试组称为随机组。

三是实验顺序的随机性。

在实验实施过程中，参与实验的被试组都要接受研究者事先安排的某种实验处理条件，被试接受实验处理的方式有二：

同组被试同时接受某种处理，或者同组被试按顺序逐个先后接受同一种处理。

在采用后一种方面时，同组被试接受处理的顺序也必须要随机化。

譬如两组被试（每组5人）做某一实验顺序的随机化安排如表10-2所示。

随机组

被试接受处理的顺序

接受处理的先后顺序

12345

第一组

第二组

FBHJD

每个被试

GAICE

四是自变量呈现的随机性

因为一般研究总是多因素或多水平的实验研究，因此还需要考虑各种因素或水平的自变量在呈现时的随机化问题。

自变量的呈现随机化主要分顺序、空间和时间三个方面。

因篇幅有限不再详细讨论。

随机化是实验设计应用统计学原理的集中表现之一。

它可使实验结果尽量避免受到主客观方面的系统性因素的影响而出现的偏倚性，达到对实验误差作出正确估计的目的，并且使可能出现的无关因素的效应相应抵消。

遵循三个基本原则在正确估计和减少实验误差中的关系如图10-2所示。

图14-2实验设计原则的作用

三、实验与实验设计的种类

实验与实验设计的分类标准很多，在不同的标准下可分出不同的实验或实验设计。

这些分类结果之间并非独立的，而是相互交叉的，即同一个类别可能出现在不同的分类标准之中。

常见的分类如下。

（一）实验的分类

1．根据实验地点分，有实验室实验和自然实验。

实验室实验顾名思义是在实验室条件下，运用一定的实验仪器设备进行的实验，这是一种控制水平很高的实验，又称为真实验。

而心理与教育实验更多的是自然实验，即在日常的学习、生活、工作环境中进行的实验，其控制水平不如实验室实验，但其结果更加符合实际情况。

2．根据因素联系的进程分，有探索性实验和验证性实验。

如果研究者对课题还缺乏必要的了解，或者根据现有的知识还不能提出明确的假设，则可以通过探索性实验取得必要的事实数据，探明造成某种现象的原因究竟有哪些，或者操纵某些条件的变化可能会引起什么结果。

探索性实验的特点是实验时因子较多，常需把许多可能影响实验结果的因子组合在一起，安排在实验中进行比较、筛选、淘汰和更新，这种实验通常要求的规模比较小，重复资料较少，自然实验的精度也较低。

如果研究者对课题的现状比较明确，能够提出比较具体的假设，实验中是为了验证该假设是否成立，这时的实验则为验证性实验。

当验证性实验的结果与原假设不一致进，还可以修改原假设，或者提出新的假设，重新设计和开展实验加以验证。

验证性实验的特点是实验因子较少，每一因子的水平会分得较细；实验的规模则较大，重复次数增加，其实验精度较探索性实验高。

验证性实验往往是在比较大的范围内进行的，它能使实验结果中反映出来的规律性的东西变得更加符合实际、更具体、更科学，所以开展验证性实验是实验结果推广和应用的必要前提。

（二）实验设计的分类

1．根据控制水平分，有真实验设计、准实验设计和非实验设计。

真实验设计是指条件控制最严密的实验设计，这种实验通常是在实验室内进行的。

而准实验设计则是部分、有限地控制实验条件，属于控制不十分严密的实验设计，如自然实验、现场实验均属此类。

非实验设计是控制水平最低、最不严密的实验设计，通常我们采用观察法、调查法、测验法、个案法、问卷法、访谈法及活动产品分析法等进行的研究活动均为非实验设计。

2．根据实验组数分，有单组实验设计、等组实验设计和轮组实验设计等。

单组实验设计是对随机抽取的一组被试先后进行两种不同水平的实验处理的实验设计。

等组实验设计是在两个或两以上的等值组分别实施不同的处理的实验设计。

轮组实验设计则是在两个或两个以上等值组将不同的实验处理轮流进行的实验设计。

详细内容我们将在第二节介绍。

（三）根据实验因素个数分，有单因素实验设计和多因素实验设计。

单因素实验设计是指只有一个实验因素，即一个自变量的实验设计。

如一种教学方法，一种教材，一种学习方法的实验等。

多因素设计则指有两个或两个以上因素的设计，如上述识记方法与年龄的研究，即为二因素的实验设计。

单因素设计的最大特点是操作和分析较为简便，但由于一次涉及的因素个数少，所得结果较为粗糙。

而多因素设计因一次实验涉及的的因子较多，不但能研究单个因子的作用，而且还能研究各因子间的相互作用，因此对问题的研究较为深入，细致。

但是工作量大，计算复杂，耗时较多。

（四）根据使用的方差分析的方法分，有完全随机化设计，随机化区组设计，处理对层级设计、拉丁方设计等。

四、实验对象的抽取和配置

实验必定抽取一定的实验对象，即被试。

在心理与教育实验及其他研究方法（如调查法、测验法等）中，约大部分问题只要求从研究总体中抽取一部分个体为用研究样本，从样本的研究结果对总体特征进行推论。

这种推论的可靠性，一方面有赖于研究过程中无关变量的控制和数据处理的准确性，另一方面则有赖于样本的代表性。

而样本代表性直接关系着实验结果的准确性和精确性。

许多没有专门学过实验设计而进行实验研究的人，往往一开始在抽取实验对象时就犯了错误，以至影响实验的代表性和广泛性。

在实验对象的抽取过程中，设计时应注意三个问题，一是总体范围的界定，二是抽样方法，三是样本容量的确定。

（一）总体的界定

界定总体是指确定说明谁应该包括在总体之内，或者谁应该排除在总体之外的界限。

在确定实验对象时，首先应根据研究课题的目的、内容规定研究所涉及的总体范围。

总体范围影响着抽样的范围和样本的代表性。

如果总体所限的范围过大过宽，外部效度或者泛化的可能性会加倍扩大，导致获得代表性样本发生困难并且要求较大的样本容量。

相反，总体范围限的过小过窄，虽有助于选择一个适宜的样本，但会使结论和概括性局限于所用的特定总体，往往造成与研究目的的自相矛盾。

当研究中的控制变量涉及总体特征时，研究者必须在给总体下定义时，系统地说明包括或排除某个或某些特征。

譬如，若要研究普通高中与职业高中学生的素质发展水平，并限定所比较的学生要在任何一所学校连续呆三年，那么在总体定义中就应排除所有从一所学校向另一所学校转学的学生。

可见总体一经确定，不仅规定了抽样的范围，而且也规定了实验结果的推论范围和对象。

（二）抽样方法

统计分析要求随机样本，从总体中随机抽取样本的方法有许多，常用方法主要有四种，即纯随机抽样、系统抽样、分层抽样和整群抽样。

1．简单随机抽样

简单随机抽样（simplerandomsampling）是按随机原则直接从总体中抽取实验单位作为样本的方法，又称纯随机抽样，是最基本的抽样方法。

具体操作上有抽签法和随机数字法。

抽签法的操作方法是首先将总体的全部对象编号做成签，再充分地混合这些签，最后每次随机地从中抽取一个签，直至抽到所需的样本容量，而与这些签对应的个体即为所抽取的样本。

譬如，总体

，现抽取一个容量为

的样本，则需先将总体从1至50编号和做签并充分混合，然后从中每次随机地抽取一个签，直至抽取5个签。

假设抽取的签分别为8，13，22，28，45，则这5个签对应的个体即为抽取样本。

抽签法又分有放回抽样和无放回抽样。

有放回抽样（samplingwithreplacement）是将每次抽出的编号记录后再放回总体，使总体数量保持不变。

若每次抽取的编号不再放回总体，使总体数量在每次抽取时都递减1，即总体容量为

，则为无放回抽（samplingwithoutreplacement）样。

抽签法的优势在于操作简单，但是若总体容量较大时，操作比较繁琐，不容易做到。

如果我们以以随机数字法来替代抽签法，那么这个抽样程序会更简单一些，并且更容易操作。

随机数字法即可以利用随机数字表，也可以使用计算机软件来进行。

利用随机数字表，也需先将总体的每个个体编号。

假设从300名初三学生中，随机抽取50名学生，需先将300名学生依次编号为001，002，003，……，300；然后在“随机数字表”的任意一个地方开始，按三位数一组进行数字分割，凡所得号码为所编号码者均为被抽中的对象，直至抽满50为止。

例如，“随机数字表”的数字为08027343231818074562……，则分割为080，273，432，318，180，745，62……；其中，080，273，180等则为抽中的个体，而432，318，745等超出编号不予考虑。

又如，某研究者想了解小学的发展规模，打算从173所小学中随机抽取12所学校作样本。

首先把学校从1到1737进行编号，然后用“随机数字表”或计算机输出结果来抽样，结果抽取到的数字分别是159，98，63，68，8，85，34，71，141，129，48，116，这些编号对应的学校即组成研究样本。

这种随机抽样的方法要求我们对总体有一个N个元素的清单，这样就能将每个元素从1到N进行编号。

这个清单称为一个抽样框。

有了这个抽样框，再运用计算机或随机数字表抽样，就会使随机样本的抽取简单化了。

简单随机抽样从理论上讲能够确保总体中每一个体的机会均等，并且在操作上简便易行。

但是这种方法也有其局限性。

一是若在较分散的总体中抽取样本，而样本分布也呈现分散的情形，会使某些研究难以进行。

二是当总体中每个个体之间的差异较大时，要求抽取的样本容量要相当大，而大样本采取这种抽样方法则非常困难。

三是当样本容量较小时，又会样本分布的不均匀，从而影响样本的代表性。

2．系统抽样

有时我们对抽样框每隔10个抽取一所学校，或每隔20个抽取一个个体，这种抽样方法称系统抽样。

系统抽样（systematicsampling）是以某个随机数字为起点，间隔一定单位抽取的样本。

系统抽样的间隔值（

）可由总体容量与样本容量的比值来确定，即

例如，某研究者从1000个被试中抽取50人作样本。

他将被试从0001到1000进行编号，然后计算

，再随机地选定一个常数

，如

，则抽取号码为6，26，46，66，……，直到满50为止。

实际上，在某些情况下系统抽样会比简单随机抽样更好。

因为系统抽样的样本会比简单随机抽样的样本在整个总体中分布更均匀，而且抽样抽样误差也较小。

不过，系统抽样会受抽样间隔及总体本身周期性排列的影响，容易产生系统误差，随机性较差。

为此，在实际应用中可以将系统抽样和简单随机抽样结合起来。

例如，先将1000名被试近编号顺序平均分成10个一组，共100组，然后再在每组中采用简单随机抽样的方法。

这样既保持了分布的均匀性，又扩大了随机组合的可能性。

另外，当总体容量很大时，编号会太麻烦。

3．分层抽样

如果我们对某个总体的组成情况（即结构）有所了解时则可以采用分层抽样法进行随机抽样。

分层抽样（stratifiedsampling）是指先按照有关标志把单晶体划分为若干层次，再根据样本与总体的比率，在每一层进行抽样的方法。

设

为总容量，

为每一层的总容量，

为样本容量，

为每一层的样本容量，则有

例如，要用50名学生的数学推理的平均成绩去估计500名学生平均成绩，假设在数学成就测验中有100人为优秀，320人为中等，80人较差，则每一层的抽取的容量分别为

如果在每层中又以简单随机抽样法抽取个体，其整个抽样程序则为先分层再随机抽样的过程，称为分层（简单）随机抽样。

分层抽样时层与层之间异质性越高越好，而层内的同质性越高越好。

在分层时，研究者不仅只依据某一个特征或变量来分层，而且也可以依据几种特征进行分层。

例如，某研究者调查小学4～6年级多重成就测验成绩情况，在进行分层取样时，他不仅要考虑学校学校类型（如城市、农村），还要考虑学生的班级地位，甚至性别等，这种抽样方法称为交叉分层抽样。

在某种程度上，交叉分层抽样法可以提高估计和推论的精确性。

分层抽样法可以将总体中与研究有关的某些因素比较接近的个体归为一组或一层，使各层的分布比较均匀，从而保证了各层都有被抽取的机会，使抽样误差更小，特别是在总体分布不均匀的情况下，采用分层抽样法效果更好。

4．整群抽样

假设一研究者想调查大学生的心理健康状况，发现若用简单随机抽样根本无法实施。

因为对大学生的数量极大，情况不明，而且大学的分布很广。

这时则需要采用整群抽样（clustersampling）的方法。

所谓整群抽样是指以群为抽样单位进行抽样，譬如，以班级、学校等为单位进行抽样。

在整群抽样中，我们往往先将整个感兴趣的总体划分为几个相对较小的子总体，然后再随机抽取某些子总体来组成最终的样本。

在上例中，若这些群集按地理位置来划分则称区域抽样，如总体划分为华东地区、华中地区、华北地区、中南地区、西南地区、西北地区、东北地区等。

在同一个研究中，我们可以使用多种抽样方法进行抽样。

例如，某研究者想中小学教师对新的课程标准和多种实验教材的看法，他可能首先会将国家分为省市自治区的地理上的小区域，再利用整群抽样法将每个层次划分为一些更小的地区（如学校所在地），最后再使用简单随机抽样或系统抽样法，从每个群集中抽取小学老师来组成样本。

整群抽样的组织形式简便易行，它不会打乱学校或单位的正常秩序。

不足的是样本在总体中的分布不太均匀，抽样误差相对较大。

所以，具体使用时一要适当扩大样本容量，减小抽样误差；二要与分层抽样法或其他方法配合使用。

（三）样本容量的确定

虽然按照统计的数学分布特征，以30为界对样本容量进行大小的区分。

但是这只是一个基础水平，也就是说在实际操作过程中并非只要抽取30个被试满足了样本的要求就可进行研究了。

因为被试总体的差异状况，各种抽样方法自身的局限性，对实际的样本容量的要求有所不同。

通常是以总体或样本的标准误大小来计算样本容量。

第二节实验设计的一般格式与内容

虽然不同的研究设计有其个性，但也有其共性。

就一般实验设计的基本格式与内容而言主要有以下五个方面。

一、一、问题的提出

这一部分主要用于说明课题的设想从何而来，实验研究的目的与意义所在。

具体包括

选题论证，即课题的来源与选题意义；文献综述，即对所选课题在国内外的研究历史与现状进行文献综述，对前人在解决类似问题时涉及的理论、方法和具体实践进行回顾与评价，在此基础上发现不足，以明确自己的研究在理论、方法和具体实践的新颖性和创造性；明确课题的研究范围，如研究问题的内容范围、角度范围及子课题与总课题的关系等进行阐述。

二、二、实验的方法

（一）提出研究假设，确立研究的所要达到的目的。

客观真理的认识是一个渐进的过程。

在科学研究中，研究者需要根据不多的事实材料，运用已有的科学原理，充分发挥思维的想象力和创造力，对所研究问题的本质和规律提出一种研究者所期望的初步设想。

这种初步设想就是通常所说的研究假设。

在科学史上无数重大的科学发出和科学理论都曾经经过了一个假设阶段，如达尔文的“进化论”，门捷列夫的“元素周期表”，哥白尼的“太阳中心说”等。

假设应当设想出两个或多个变量之间的，并以陈述句的形式明