心理与教育测量重点全部.docx
- 文档编号:8190951
- 上传时间:2023-01-29
- 格式:DOCX
- 页数:11
- 大小:25.12KB
心理与教育测量重点全部.docx
《心理与教育测量重点全部.docx》由会员分享,可在线阅读,更多相关《心理与教育测量重点全部.docx(11页珍藏版)》请在冰豆网上搜索。
心理与教育测量重点全部
第一章心理与教育测量概论
1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
所谓一定的法则,是指任何测量都要建立在科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
所谓事物的特征,是指所要测量的事物的特定属性。
所谓量具,是指测量中所使用的工具。
所谓定量描述,是指任何测量的结果总是对事物特征的量的确定。
2、任何测量都必须具备两个基本要素,即测量的参照点和测量的单位。
参照点有两种,一种是绝对参照点,即以绝对的零点作为测量的起点。
另一种是相对参照点,即以人为确定的零点为测量的起点。
理想的测量单位应当具备两个条件:
一是要有确定的意义,二是要有相等的价值。
3、测量量表分为4种:
1)命名量表,是最低水平的量表,它只是用数字代表事物或对事物进行分类;
2)顺序量表,如第1名,第2名;
3)等距量表,不仅能代表事物的类别,等级,而且具有相等的单位,等距量表没有绝对的零点;
4)比率量表,是最高水平的测量量表,有绝对的零点。
心理与教育测量的量表属于顺序量表。
心理与教育测量属于顺序量表。
★4、心理测验实质上是对行为样本的客观的和标准化的测量。
编制一个测验应当具备下列4个基本条件:
1)行为样本。
从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。
这一组被抽取出来的,作为直接的测量对象的行为就是行为样本。
2)标准化
标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。
测验的标准化要具备下列条件:
a、测验内容的标准化;b、施测条件的标准化;c、评分规则的标准化;d、测验常模的标准化。
3)难度或应答率
4)信度和效度
5、心理与教育测验的种类:
按测量对象:
智力测验、能力倾向测验、成就测验、人格测验。
按测量方式:
个别测验,团体测验。
按测验内容的形式:
文字测验,非文字测验
按测验功能:
成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
按评价所参照的标准:
常模参照测验,目标参照测验,潜力参照测验。
第二章心理与教育测量的产生与发展
董仲舒“一手画方,一手画圆”。
高尔顿出版了《遗传的天才》,提出人的能力是由遗传而来的,他在伦敦国际博览会上成立了一个人类测量实验室,参观者可得到身高、体重等信息,这可以视为第一个大规模系统测量人的个别差异的尝试,人发明了许多测量仪器,他还是应用评定量表、问卷法及自由联想法的先驱。
卡特尔致力于心理实验室的建立与测量思想的传播,他发表《心理测验与测量》一文,首次提出了“心理测验”这个术语。
比内在索那建立法国第一个心理实验室,发表了修订后的比内-西蒙智力量表,测验成绩用“智力水平”表示。
第三章经典测验理论的基本假设
1、心理特质:
表现在一个人身上所特有的相对稳定的行为方式。
可从几个方面来理解:
1)特质是一组具有内部相关的行为的概括,具有一定的抽象性。
2)特质是一种一般的神经心理系统,它可以综合不同的刺激,使人对这些刺激作出相同的反应。
3)特质是一个人身上比较稳定的特点。
4)一个人的精神面貌是由多种特质分多个层次有机组合而成的。
5)特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。
2、测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
心理测量也有两种误差,即随机误差和系统误差。
所谓随机误差就是那种由与测量目的无关的、偶然因素引起的而又不易控制的误差。
所谓系统误差就是那种由与测量目的无关的变因引起的一种恒定而有规律的效应。
系统误差只影响测量的准确性,不影响稳定性。
而随机误差既影响稳定性又影响准确性。
误差来源主要有3个:
测量工具、被测对象、施测过程。
3、经典测量理论的数学模型及其基本假设:
观察分数X=真分数T+一个随机误差E,这就是CTT的数学模型。
根据这一公式可引申3个假设公理:
1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。
2)真分数和误差分数之间的相关为零。
3)各平行测验上的误差分数之间相关为零。
第四章测量信度
1、信度指的是测量结果的稳定性程度。
若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。
2、信度的作用:
1)信度是测量过程中所存在的随机误差大小的反映;
2)信度可以用来解释个人测验分数的意义;
3)信度可以帮助进行不同测验分数的比较。
3、重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
4、复本信度指的是两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。
如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数。
如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数。
计算复本信度的条件之一是首先要构造出两份或两份以上真正平行的测验,条件之二是被试要有条件接受两个测验。
5、分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
分半信度通常是在只能施测一次或没有复本的情况下使用。
而且,在使用斯皮尔曼——布朗公式时要求全体被试在两半测验上得分的变异数要相等。
当一个测验无法分成对等的两半时,分半信度不宜使用。
6、同质性信度也叫内部一致性系数,是指测验内部所有题目间的一致性程度。
题目间的一致性含有两层意思,其一是指所有题目测的都是同一种心理特质,其二是指所有题目得分之间都具有较高的正相关。
同质性信度就是一个测验所测内容或特质的相同程度。
7、评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。
当评分者人数为2时,评分者信度等于2个评分者给同一批被试的答卷所给分数的相关系数。
当评分者人数多于2个时,评分者信度可用肯德尔和谐系数进行估计。
★8、影响测量信度的主要因素:
1)被试方面2)主试者方面3)施测情境方面4)测量工具方面5)两次施测的间隔时间
★9、提高测量信度的常用方法:
1)适当增加测验的长度;2)使测验中所有试题的难度接近正态分布,并控制在中等水平;3)努力提高测验试题的区分度;4)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度;5)主试者严格执行实测规程,评分者严格按标准给分。
第五章测量效度
1、效度:
是指一个测验或量表实际能测出其所要测的心理特质的程度。
注意以下几点:
1)效度是一个相对的概念;2)效度是测量的随机误差和系统误差的综合反映;3)判断一个测量是否有效要从多方面搜集证据。
2、效度与信度的关系:
1)信度高是效度高的必要而非充分条件;信度高不一定效度高,效度高,信度必须高;2)测验的效度受它的信度制约。
3、内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。
主要应用于成就测验、选拔和分类的职业测验,不适合用于能力倾向和人格测验。
表面效度是外行人对某个测验从表面上看好像是测某种心理特质的一种现象。
4、内容效度的确定方法主要是逻辑分析法,其步骤是:
1)明确欲测内容的范围,包括知识范围和能力要求。
2)确定每个题目所测的内容,并与测验编制者所列的双向细目表对照,逐题比较自己的分类与制卷者的分类,并做记录。
3)制定评定量表,考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异,还要考察各种题目数量和分数的比例以及题目形式对内容的适当性等,对整个测验的有效性作出总的评价。
5、结构效度:
是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。
主要用于智力测验、人格测验。
6、结构效度的估计方法:
1)测验内部寻找证据法;首先,考察该测验的内容效度;其次,分析被试的答题过程;再次,通过计算测验的同质性信度的方法来检测结构效度。
2)测验之间寻找证据法;首先,考察新编测验与某个已知的能有效测量相同特质的旧测验之间的相关;若两者相关较高,则说明新测验有较高的效度。
这种方法叫相容效度法。
其次,考察新编测验与某个已知的能有效测量不同特质的旧测验间的相关。
若两者相关较高,则说明新测验效度不高,因为它也测到了其他心理特质。
两测验间相关不高只是新测验效度较高的必要条件,并不是充分条件,这种方法叫区分效度法。
再次,通过因素分析的方法来了解测验的结构效度。
3)考察测验的实证效度法;
4)多种特质——多种方法矩阵法。
7、实证效度:
指一个测验对处于特定情境中的个体的行为进行估计的有效性。
也就是说一个测验是否有效,应该以实践的效果来作为检验标准。
根据效标资料搜集的时间差异,实证效度可以分成同时效度和预测效度两种。
8、效标就是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。
9、实证效度的确定方法大体分3个步骤:
1)明确观念效标;2)确定效标测量;3)考察测验分数与效标测量的关系。
从效度估计的方法上看,实证效度可以用以下方法进行估计:
相关法;区分法;命中率。
10、影响测量的因素:
1)测验的构成;2)测验的实施过程;3)被试;4)所选效标的性质;5)测量的信度。
11、提高测量效度的方法:
1)精心编制测验量表,避免出现较大的系统误差。
2)妥善组织测验,控制随机误差;
3)创设标准的应试情境,让每个被试都能发挥正常的水平。
4)选好正确的效标,定好恰当的效标测量,正确地使用有关公式。
第六章测验的项目分析
1、难度对测验的影响:
影响测验分数的分布形态和离散程度。
区分度是指测验项目对被试心理品质水平差异的区分能力。
难度与区分度的关系:
有密切关系,难度越接近0.50,项目潜在的区分度越大,而难度越接近1或0时,项目的潜在区分度越小。
2、对多重选择题的项目具体分析的步骤:
1)按被试测验的总分,从高到低依次排列试卷;
2)从最高分依次向下取全部试卷的27%作为高分组。
3)从最低分依次向上取全部试卷的27%作为低分组。
4)分别登记高分组与低分组选中各选择项的人数,然后登记。
5)根据登记结果进行选择项的质量分析。
第七章测验常模
1、原始分数:
被试在接受测验后,根据测验的记分标准,对照被试的反应所计算出的测验分数。
2、导出分数:
就是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数,这种按某种规则将原始分数转化为导出分数的过程称作分数的转换。
常用的导出分数有百分等级、标准分数、T分数等。
3、百分等级:
一个原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。
4、百分等级分数优点:
百分等级是一种相对位置量数,具有可比性,且易于计算、解释方便,较适用于不同的对象和性质不同的测验。
另外,百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。
缺点:
单位不等,尤其在分配的两个极端。
百分等级只具有顺序性,无法用它来说明不同被试之间分数差异的数量。
5、标准分数:
是一种具有相等单位的量数,又称作Z分数,它是将原始分数与团体的平均数之差除以标准差所得的商数。
6、T分数=10·Z+50IQ=15·Z+100Z=X-X/S
7、常模:
根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。
8、确定常模团体的注意事项:
1)群体构成的界限必须明确;
2)常模团体必须是所测群体的一个代表性样本;
3)取样的过程必须明确且有详尽的描述;
4)样本大小要适当;
5)常模团体必须是近时的;
6)注意一般常模与特殊常模的结合。
9、制定常模的过程:
1)确定测验将用于哪一个群体;
2)对常模团体进行施测,并获得团体成员的测验分数及分数分布。
3)确定常模分数类型,制作常模分数转换表,即常模量表,同时给出抽取常模团体的书面说明,以及常模分数的解释指南等。
第八章心理与教育测验的编制与实施
1、编制一个可供使用的标准化的心理与教育测验,一般要经过以下几个步骤:
1)确定测验目的;2)制定编题计划;3)编辑测验项目;4)预测与项目分析;5)合成测验;6)测验标准化;7)鉴定测验;8)编写测验说明书。
2、施测者在测验的实施过程中要注意的问题:
一、施测前的准备工作:
1)准备好测验材料;2)熟练掌握施测手续,有必要进行训练,训练的内容包括:
a、熟悉测验内容;b、掌握施测步骤;c、掌握记分方法;d、掌握解释分数的技术。
3)熟记测验指导语并能用口语清楚而流利地说出来。
二、指导语;指导语直接影响受测者反应的态度和方式,确定指导语时,注意不要暗示受测者应该选择什么样的答案,应保持和表述中立的态度,不倾向于答案中的任何一种方向。
三、测验情境;测验情境包括测验场地、座位、答案纸型等,这些都会影响测验分数,要加以必要的控制,使之对每一个受测者都保持相同,不能有外界干扰,施测者的状态如语言、行为、态度等都要严格控制。
四、测验焦虑;主试以下4种态度容易使被试产生过度的焦虑,应避免:
a、以测验来威胁被试,以使被试循规蹈矩。
b、警告被试一定要尽力,因为这项测验很重要;c、告诉被试答题要快,才能在规定的时间内答完;d、恐吓被试说:
如果测验失败,会有严重的不良后果。
五、与受测者建立良好的协调关系
六、评分技术;在标准化的心理测验中,测验与答卷通常是分开的,被试将测验项目的答案直接记录在专用答卷上。
另外备有答案卡,评分时将被试答案与标准答案相比较,即可评定被试应得的分数。
3、将测验分数的意义告诉受测者的原则:
1)使用当事人所理解的语言。
2)要保证当事人知道这个测验测量或预测什么,这里并不需要作详细的技术性解释;
3)如果分数是以常模为参考的,就要使当事人知道他是和什么团体在进行比较;
4)要使当事人认识到分数只是一个估计;
5)要使当事人知道如何运用他的分数;
6)要考虑测验分数将给受测者带来什么影响;
7)测验结果应向无关的人员保密;
8)对低分者的解释应谨慎小心;
9)报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导。
第九章测验等值
1、寻找不同测验形式之间分数的转换关系,把所有不同形式测验的分数都转换到同一个分数系统上,就不会出现不公正现象了。
测量学上把为达到这一目的而发展起来的一套专门技术称为测验等值。
2、测验等值与原始分数转化为导出分数之间的区别:
等值转换的目的是为了比较两个不同测验形式之间的实测分数,导出分数转换是为了将一个实测分数转换到一个可评价个体相对位置的分数系统上去。
等值转换是两个或多个不同测验形式分数系统的转换,导出分数转换是一个测验形式不同分数系统的转换,两者之间是有本质差异的。
3、测验等值的条件:
1)同质性;2)等信度;3)公平性;4)可递推性;5)对称性;6)样本不变性。
第一十章目标参照测验
1、目标参照测验:
根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验中所得结果,也是根据某一明确界定的行为标准直接进行解释的。
2、目标参照测验的内容效度分析:
检验题目与测验内容范围所要求的内容与目标的一致性。
3、测验项目的区分度一般采取两类指标:
难度差值和相关系数。
第十一章学绩测验
1、学绩:
个体经过对某种知识或技术的学习或训练之后所取得的成绩,一般表现为个体心理品质在知识、技能或某种能力方面的增加和提高,是个体认识性心理品质的发展。
2、学绩测验的分类:
1)按测验的编制方法分为老师自编课堂测验和标准化学绩测验;
2)按测验内容分为单科测验和多科测验;
3)按测验的用途分为考查性测验和诊断性测验;
4)按测验评分的参照系分为常模参照性测验和目标参照性测验;
5)按测验的题型分为定向反应型和自由反应型。
3、在心理与教育测量学原理指导下,遵循一定的程序所编制的各方面质量都达到规定标准的学绩测验,称为标准化学绩测验。
4、标准化学绩测验的基本要求:
命题组卷、施测、评分、测验分数解释标准化。
5、标准化学绩测验的编制:
1)确定测验目的,选定测验编制的方法;
2)分析测量目标,拟定测验编制计划;
3)编题征题与选题组卷;
4)调查测验质量参数,编制测验常模;
5)编写测验指导书,正式出版发行。
6、教师自编课堂测验的步骤与方法:
1)审查测验目的:
教师应深入了解测验对象的学习水平和特点,明确具体的教学要求和教学目标是什么,明确是什么性质的学绩测验;
2)制定测验编制计划:
试卷结构上全面合理安排,要在一个个测题上进行深入细致的研究;
3)命题与组卷:
应该严格按照测验计划进行,按照测验双向细目表规定的教学目标编制出符合要求的试题,教师命题有3条要求:
一是提前,二是超量,三是审查。
还应考虑试题的编排顺序,编印要清晰、正确等。
7、教师自编课堂测验应注意的问题:
1)教师要深入研究教材,深入调查学生;
2)要维护准确稳定的合格标准;
3)要客观评价自己的命题技术,合理使用各种题型;
4)要注意总结命题经验,提高命题技术;
5)要尽量控制评分误差,防止简单粗糙。
6)要做一些定量分析研究。
第十二章能力测验(上)
1、智力的二因素理论:
斯皮尔曼首先发现一系列心理能力测验之间存在普遍的正相关,并首先利用因素分析方法,将这些相关归因于一种一般因素或共同因素的作用,他命名这种因素为G因素。
只有在某些特殊情况下才会表现出来的因素为S因素。
2、智力测验的功能:
基本功能是测量个体差异,可将人群分类、可预测,对个体进行诊断和采取相应且及时的补救措施。
3、传统智力测验的预测效度:
在用智力测验对个体未来可能成功程度作预测时,一般都假定所测的智力是个体相当稳定的特质。
事实上,人的智力并非一成不变,由于某些因素的影响而发生变化,智力的可变性主要表现在:
1)智力随年龄成熟而发展;2)智力随环境而变化;3)智力随个性特质的不同而产生不同变化。
4、智力测验作为有效的智力个体差异评估工具得到广泛应用的原因:
1)智力本身虽具有可变性,但它也具有稳定性;
2)智力测验实际运用于选拔和安置人员时,往往被实践证明其对学生和职业等效标的预测具有较好的效度,因而可以有效地帮助决策者提高决策正确率;
3)由于智力测验对不同团体可能存在的不公平性,人们已经试图从改善智力测验本身来缓解这一问题。
4)至今仍未出现成熟的、超越于传统智力测验之上的智力评估工具。
5、瑞文推理测验是由英国心理学家瑞文编制的一种团体智力测验,又称瑞文渐进图阵。
它是非文字型的图形测验,分为3个水平:
瑞文标准、采图、高级推理测验。
瑞文测验的优点在于测验对象不受文化、种族与语言等条件的限制,适用的年龄范围也很宽,从5岁半到老年,而且不排除一些生理缺陷者。
第十三章能力测验(下)
1、能力倾向测验的特点:
1)测验的目的:
成就测验的目的与能力倾向测验不同。
所谓成就,是指个体经过一定的教学或训练后所掌握的知识水平或所达到的能力水平,它针对于特定的学习经验,强调个体目前已经达到的水平。
换言之,成就测验是对个体过去学习经验的总结。
能力倾向指的是个体在不同能力因素上潜在的优劣倾向。
能力倾向测验的目的不在于总结过去,而在于预测将来,即预测个体在将来的学习或工作中可能达到的成功程度。
2)测验的编制:
能力倾向测验一般同时测量几种能力因素,以分测验形式组成,每个分测验针对一种能力,每个测验应该是独立的,并且,各分测验间的相关要尽可能低。
测验的内容涉及广泛,不像成就测验那样具有明确限定的内容范围,且较少涉及与学校习得知识有关的内容。
各分测验必须使用相同的常模样本,且应具有较高的信度。
3)测验结果的解释:
被试在能力倾向测验上可以得到若干测验分数,这些分数既可表明不同被试在每一分测验所测能力上的相对位置水平,又可表明同一被试在所测各能力上的相对优劣状况。
一般用能力剖面图来呈现个体内差异。
预测个体在某工作上的可能成功程度时,需解决各分测验的分数组合问题。
2、吉尔福特认为发散思维在行为上主要表现出3种特征:
流畅性、变通性、独特性。
第十四章人格测量
1、自陈人格测量:
根据要测量的人格特质,编制许多有关的问题,要求受测者根据自己的实际情况逐一回答这些问题,然后根据受测者的答案,去衡量受测者在这种人格特质上表现的程度。
★2、自陈量表的特点:
1)自陈量表的题量较大,多数用于测量人格的若干特质;
2)自陈量表通常采用纸笔测验,即将测验项目印在纸上装订成册,另有一张答卷纸,将备选选项印在答卷纸上,被试一边阅读测验项目,一边在答卷上选择适合于自己的选项。
3)自陈量表的计分规则简单而客观,施测手续比较简便,测量分数容易获得解释。
3、投射:
是指个人对客体特征的想象式解释,在这种解释中,个人具有将自己身上发生的心理过程无意识地附着在客体身上的倾向。
★4、投射测验的特点是:
1)测验材料没有明确的结构和确切的意义,这就为受测者提供了针对测验材料进行广阔自由联想的机会和空间;
2)受测者对测验材料的反应不受限制,可以根据自己对测验材料的理解作任何想象式解释,因此受测者对测验材料的解释在很大程度上不是决定于测验材料的性质,而是决定于受测者的人格特征和当时的心理状态;
3)测验的目的具有明显的隐蔽性,受测者事先并不知道施测者对他的反应作何心理学的解释,这就在很大程度上避免了受测者的伪装和防卫,使测验的结果更能反映受测者真实的人格特征;
4)对测验结果的解释重在对受测者的人格特征获得整体性的了解,而不是对某个或某些单个人格特质的关注;
5)投射测验的内容多为无明确意义的图片,在测验时不受语言文字的限制,所以,被广泛地应用于人格的跨文化研究;
6)投射测验的最大局限是计分上的困难,这使得研究者对测验结果难以进行确定的定量分析。
第十五章其他心理与教育测验
1、霍兰德把人格分成6种类型:
现实型、研究型、艺术型、社会型、企业型、传统型。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 测量 重点 全部