心理测量学共53页.docx
- 文档编号:6495969
- 上传时间:2023-01-07
- 格式:DOCX
- 页数:71
- 大小:125.08KB
心理测量学共53页.docx
《心理测量学共53页.docx》由会员分享,可在线阅读,更多相关《心理测量学共53页.docx(71页珍藏版)》请在冰豆网上搜索。
心理测量学共53页
心理(xīnlǐ)测量学
1、心理测量误差的分类、来源和控制(kòngzhì)方法
2、CTT数学模型的基本内容(1个基本假设、2类误差、3个分数、1个模型、3条公理(gōnglǐ)、3个结论、1个公式)
3、信度的估计(gūjì)方法及计算公式
4、效度的估计(gūjì)方法
5、信度和效度的影响因素与改进
6、信度和效度的关系
7、难度的含义及计算方法
8、区分度的含义及计算方法
9、难度和区分度的关系
10、常见的常模参照分数有哪些?
11、常见的智力测验有哪些?
12、常见的自陈量表的编制方法及举例
13、常见的人格测验有哪些?
14、测验中常见的常模有哪些?
15、简述标准参照测验的基本程序
16、简述标准参照测验与常模参照测验的区别与联系
17、简述测验等值的条件
心理测量(cèliáng)的基本理论
(一)心理(xīnlǐ)测量的理论(lǐlùn)基础(jīchǔ)
1、心理测量的理论依据:
心理特质的可测性。
2、心理测量的基本概念
测量:
就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
(考研成绩是依据考研答案使用阅卷老师和计算机对试卷答案进行打分的过程)
心理与教育测量:
根据心理学和教育学法则给人的心理特质和教育成就指派数字,或者依据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。
心理测量:
根据一定的心理学理论,使用一定的操作程序,给人的心理特质的行为表现确定出一种数量化的价值。
心理测验(安纳斯塔西):
实质上是对行为样本的客观和标准化的测量。
编制一个测验应该具备的四个基本条件:
①行为样本②标准化③难度和应答率④信度和效度。
行为样本:
从人的大量行为抽取与欲测量的心理特质直接有关的行为。
通过测量外部行为来推测心理特质。
(间接测量)
标准化:
内容、施测条件、评分规则、常模的标准化(常模是用来弥补心理测验没有绝对参照点的缺陷)
难度或应答率:
难度适中,应答率符合统计计算要求。
信度和效度:
结果一致且可靠。
测量的基本要素:
参照点、单位
参照点:
测量是确定特定事物的特定特征的数量,在测量工作中必须要有一个测量的原始起点,也就是测量前测量对象的数量的固定原点,称作测量的参照点。
绝对参照点:
以绝对的零点作为测量的起点。
(重量、长度)
相对参照点:
人为确定的零点作为测量的参照点。
(海拔、温度)
单位:
不同的测量所使用的单位是不同的。
理想的测量单位应具备2个条件:
①确定的意义②相等的价值。
测量的量表:
量表:
能够使事物的特征数量化的连续体就是量表。
量表类型
相等单位
绝对零点
四则运算
统计方法
例子
称名量表
无
无
无
百分比、次数、
众数、卡方检验
职业、性别、班级、准考证号
顺序量表
无
无
无
中位数、百分位数、等级、肯德尔和谐
名次、职称
等距量表
有
无
加减
平均数、标准差、积差、t检验、F检验等
温度、
智商分数
偏爱程度
比率量表
有
有
加减乘除
几何平均数、
变异系数
重量、反应时、身高
2、心理测量的特征与分类
心理测量的特征:
间接性、相对性、客观性
心理与教育测量的分类:
①按测量对象:
智力测验、能力倾向测验、成就测验、人格测验。
②按测量方式:
个别测验、团体测验
③按内容表达和反映形式:
文字(纸笔)测验、非文字(操作)测验
④测验功能:
成就测验、预测测验;难度测验、速度测验;描述测验、诊断测验。
⑤按评价所参照的标准:
常模参照测验、目标参照测验、潜力参照测验。
⑥按测验要求:
最高行为测验、典型行为测验。
最高行为测验:
要求被试尽可能做出最好(zuìhǎo)的回答。
典型行为测验:
要求被试按通常的习惯方式(fāngshì)做出反应。
3、心理测量(cèliáng)的评价:
贡献:
①为心理科学理论的发展,特别是个体差异心理提供了具体方法和手段。
②为社会时间服务(fúwù)做出了巨大的贡献。
局限:
①心理测量具有间接性,精确程度远远劣于物理测量。
②心理测量所依据的理论尚不完善。
③心理测量容易受到主客观各种因素的影响。
4、心理和教育测验的价值和应用:
①理论研究功能:
收集研究资料;建立和检验理论假设;实验分组。
②实际应用功能:
人才选拔、人员安置、心理诊断、描述评价、心理咨询。
人物
贡献
评价
中国古代
孔子
智力分三等级中之上人、中人和中下之人
习相远
孟子
差异的可测量性
特性能力量化思想
董仲舒
一手画圆,一手画方
世界上最早心理(注意)测验
杨雄
提出反应速度为标准来判断人智力的高低
诸葛亮
问答法和特定的情境诱导法鉴定人的心理。
著《心书》
刘邵
《人物志》
研究能力的著作,选拔人才的工具书
周岁试儿
婴儿发展测验
七巧板(唐图)九连环(迷津)
最早创造力测验
国学
世界上最早教育测验
汉武帝
岁考制
首开笔试先河
隋炀帝
在九品中正制基础上首开科举制
中国上最早的心理测验实践活动
乐正克
《学礼》
第一部把教学与测验相结合
《礼记.本命》
首次系统记录一个人从出生到十六岁成年大致发展历程
中国现代
1931年中国测验学会成立
1932年《测验》杂志创刊
2014-312-1992年,中国心理学会制定了《心理测量管理条例》和《心理测量工作者职业道德规范》
人物
贡献
评价
西方近代
冯特
创立第一个心理学实验室
使心理学走上科学之路
高尔顿
1、首先提倡测验运动,在《人类才能及其发展的研究》中首次提出测验与心理测量
2、发明了测量感觉灵敏度的方法,高尔顿棒,高尔顿哨
3、发明了分析个体差异资料的统计方法(相关概念的提出)
4、利用等级评定量表,问卷法和自由联想技术的先驱。
5、扩充百分位法,皮尔逊发展为积差相关公式
卡特尔
1、1890年在《心理测验与测量》论文中首次提出了“心理测验”的概念(出现在文献第一人)
2、心理测量只有建立普遍的统一标准,并与常模相比较,才能充分实现其科学价值和实用价值。
比内
1、1904年世界上第一个智力量表-比内西蒙量表
2、确定智力测验编制与分数解释(常模)
心理测验的鼻祖
科学心理测量学的创始人
艾斯克罗
首次区分智力落后与精神病
沈干
提出心理测验法和沈氏拼图版
训练智力落后者的先驱
桑代克
编制了第一批标准化的教育测验
教育测验的鼻祖
高尔顿:
心理测量的观点:
人的不同气质特点、智力是遗传的,认为感觉的辨别测验可以测量一个人的智力。
贡献:
①发明了一些测量感觉灵敏度的方法。
②发明了分析个体差异资料的统计方法。
③利用等级评定量表、问卷法和自由联想测验的先驱。
首先在《人类才能及其发展的研究》中提出“测验”“心理测量”-高尔顿。
卡特尔:
贡献:
①1890年,在《心理测验与测量》这篇论文中,首次提出“心理测验”(出现在文献第一人)②提出心理测量只有建立普遍的统一标准,并且与常模相比较,才能充分的实现其科学价值和实用价值。
比内:
科学心理测量学的创始人
①1904年比内和西蒙合作完成了世界上第一个智力量表—比内-西蒙智力量表。
②确定测验编制与分数解释(常模)。
中国测验学会在南京宣告成立的时间是:
1931年6月
心理测量产生的直接原因或前提是人恩的个体差异。
经典测量理论(CTT)
1、心理特质的可测性
心理测量的理论依据:
心理特质的可测性。
桑代克:
凡客观存在的事物都有其数量
麦柯尔:
凡有其数量的事物都可以测量。
2、测量误差及其来源
测量误差:
是指在测量过程中由那些与测量目的无关的变化因素所产生的一种不确定或不一致的测量效应。
心理测量的误差:
随机误差和系统误差
随机误差:
与测量目的无关(wúguān)的偶然因素引起的不易控制的误差(不确定朝哪里偏)(影响(yǐngxiǎng)准确性和一致性)
系统误差:
与测量目的无关变量的变因引起的一种(yīzhǒnɡ)恒定而有规律的效应。
(稳定的朝一个地方偏)(影响(yǐngxiǎng)准确性)
测量误差的来源及控制
(1)测量工具
测量工具通常是一套以测验(问卷)为核心的刺激反应系统(量表)。
当量表在测查人的某种心理特质时,若项目所测的东西与我们预测的目的出现偏差,则测量会出现误差。
测量工具信度不好,效度不好,是造成测量误差的两种主要原因。
(量表是否稳定,题目多少,代表性,格式,难度)
(2)被测对象
受测者真正水平是否得到正常发挥(一般来说受测者的某种心理特质是相对稳定的,但是他在接受测验时的生理和心理状态会影响其水平的正常发挥)受测者应试动机的强弱,受训时间的长短,受训内容的多少,答题反应的快慢等都会产生测量误差。
(3)施测过程
一些偶然因素,例如施测物理环境,主试的某些属性,评分计分环节出现的疏漏以及意外干扰等。
(4)主试特征
主试操作和评分是否客观。
补:
反应定势(反映风格):
独立于测验内容的反应倾向,即由于每个人回答问题习惯的不同,而使得有相同能力的被试获得不同的分数。
心理测验的误差控制:
(1)测量工具
提高编制测验科学性,注意材料的丰富性和普遍性,项目取样的代表性,使项目难度有一定的分布范围,测验用语明了。
(2)被测对象
主试和被试相互配合及规范操作。
(3)施测过程
被试在相同条件下测试,评分有客观性,结果有标准化。
3、经典测量理论模型(CTT)
真分数(T分数):
反映被试某种心理特质真正水平的那个值,称作该特质的真分数。
(操作定义:
无数次测量结果的平均数。
)
观测分数(X分数):
实际测量到的那个值。
经典测量理论假定:
观察分数和真分数之间是一种线性关系,并只差一个随机误差即X=T+E(经典测量理论的数学模型)(测量的观察分数等于真分数和误差分数之和)
根据这一模型,我们可以引申出3个假设(jiǎshè)公理
(1)若一个(yīɡè)人的某种心理特质可以用平行测验(cèyàn)反复测量足够多次,则其观察分数(fēnshù)的平均值会接近于真分数。
即:
ε(X)=T或ε(E)=0
(测量足够多,随机误差趋近于0,误差服从均值为0的正态分布,所以就被抵消了)
(2)真分数和误差分数之间的相关为零。
即:
ρ(T,E)=0
(说明真值和随机误差是独立的)
(3)各平行测验上的误差分数之间的相关为零。
即:
ρ(E1,E2)=0
(平行测验造成的随机误差之间无关,误差服从均值为0的正态分布)
平行测验:
对于测验总体的任何一个被试而言,若他(她)在平行测验上的观测分数同时满足CTT的数学模型和三大假设,并且具有相等的真分数和相等的标准差,则这两个测验被称为严格的平行测验。
(如果两个题目不同的测验,测的是同一特质,并且题目形式、数量、难度、区分度以及测验得分的分布都是一致的,则这两个测验被称作彼此平行测验。
)
(实际运作时,不是许多平行测验反复测同一批被试,是用一个测验来同时测许多被试。
)
根据CTT的模型和假设,我们可得:
(观察分数的方差=真分数方差+误差分数方差)
系统误差的变异包含在真分数的变异之中,所以真分数的变异还可以分成两部分:
与测量目的有关的变异和与测量目的无关的变异
(真分数的方差=有关方差+无关方差)
观测分数的变异=测量目的有关的变异数(有效变异、心理真值)+稳定的但出自无关来源的变异数+测量误差变异
2009—312—79简答:
简述测量误差的含义、类别以及控制测量误差的方法。
2014—南师—简答:
在测量中如何避免和控制误差?
2014-312-74-在心理科学的调查研究中,通常不可避免的误差有:
BCD
A.系统误差B.随机误差C.组间误差D.抽样误差
2011-312-74-在经典测量理论中,表示测量结果精确程度的指标有:
AC
A.测验信度B.测验效度C.测验标准误D.测验准确率
1、关于真分数模型,表述正确的是:
ABCD
A该模型未能区分各种测量误差。
B该模型对样本具有依赖性。
C该模型以弱假设为基础,这些假设容易验证。
D该模型忽视了被试的反应组型。
测量的信度与效度
信度:
测量(cèliáng)结果的稳定性程度和可靠性程度(chéngdù)。
也就是用同一测量工具(gōngjù)反复测量某人(mǒurén)的同一种心理特质,多次测量结果的一致性程度叫做信度(可靠性、稳定性、一致性)。
(信度指的是一组测验分数或一系列测量的特性,而不是个人分数的特性。
真分数的变异不能直接测量,信度是一个理论上构想的概念,只能根据一组实得分数做出估计。
)
信度指数:
信度系数的平方根。
信度的三种等价定义:
信度是一个被测团体的真分数的变异与观测分数的变异数之比。
信度是一个被测团体的真分数与观测分数的相关系数的平方。
信度是两个平行测验间的相关系数。
信度的作用:
(1)信度是测量过程中所存在的随机误差大小的反应(与系统误差无关)(测验中随机误差越大,测量的信度越低)
(2)信度可以解释个人测验分数的意义.
真分数的估计区间:
(3)信度可以帮助进行不同测验分数的比较(Z检验)
(来自不同测验的原始分数是不能直接比较的,必须转化为标准分数)
信度的估计:
(1)重测信度:
重测信度:
同一个量表对同一组被试施测两次所得结果的一致性程度。
其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
使用条件:
(1)所测量的心理特性必须是稳定的;
(2)遗忘和练习的效果基本上相互抵消(智力测验间隔6个月左右);
(3)两次施测之间,被试在所要测查的心理特质方面没有获得更多的学习和训练。
计算方法:
皮尔逊积差相关
缺点:
难以消除记忆和练习及学习的影响;难以取得被试的全面合作。
(2)复本(fùběn)信度:
复本(fùběn)信度:
两个平行的测验(cèyàn)测量同一批被试所得结果的一致性程度。
其大小等于(děngyú)同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。
使用条件:
(1)构造出两份及以上平行测验(A、B卷);
(2)尽量缩短间隔时间,排除记忆和练习的干扰。
计算:
两个复本测验上所得分数的皮尔逊积差相关。
缺点:
(1)严格的平行测验很难造出来;
(2)容易受到练习,记忆和迁移的影响
稳定性与等值系数:
两个复本测验是相距一段时间分两次施测的。
此种信度系数最小,最严格。
(3)分半信度(内部一致性信度):
分半信度:
将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
(智力迅速发展的幼儿,用分半信度)
使用条件:
(1)通常在只能施测一次或没有复本的情况下使用;
(2)当一个测验无法对等分半时不能用;(奇偶分半,题目难度分半,题目内容分半)
计算:
可以看成是短时距内实施的两个平行测验。
和复本信度一样,但是由于算出来只有半个信度,所以应该用斯皮尔曼-布朗公式加以校正。
(rhh两半分数间的相关系数,rxx为整个测验的信度值)
(两个测验的方差相等时才能使用,否则应该用弗朗那根公式或卢仑公式。
)
弗朗那根公式:
卢仑公式:
(4)同质性信度(内部一致性信度):
同质性信度:
内部所有题目的一致性程度。
(所有题目测的是同一种心理特质,所有题目得分之间具有较高的一致性)
计算方法:
(1)K-R20公式
(2)K-R21公式(3)克隆巴赫α系数(4)荷伊特信度
K-R20公式:
K-R21公式:
克龙巴赫α系数:
荷伊特信度:
结果(jiēguǒ)解释:
一致性高,说明所测的都是同一心理特质,而且题目得分(défēn)之间也有高的正相关
测量单一性是同质性高的必要(bìyào)而非充分条件。
特质(tèzhì)单一,同质性信度不一定高,但同质性信度高,特质一定单一。
(5)评分者信度:
评分者信度:
多个评分者给同一批人的答卷进行评分的一致性程度。
计算:
评分者2人:
积差相关或等级相关
评分者>2人:
肯德尔和谐系数(W系数)
被评对象>7个:
卡方检验。
评分者中有相同等级:
测试卷份数
测验次数
1份
2份
1次
分半信度
同质性信度
评分者信度
复本信度
(同时测验)
2次
重测信度
复本信度
(延时测验)
信度系数的类型
误差变异的来源
重测信度
时间间隔
复本信度(同时测验)
题目内容
复本信度(延时测验)
时间间隔+题目内容
分半信度
题目内容
同质性信度
题目内容+心理特质的同质性
评分者信度
评分者之间的差异
补充:
信度的其他应用
(1)速度测验的信度:
在估计信度的方法中,凡只测一次所得到的信度系数对于速度测验都是不适用的。
因为速度测验题目较容易,除了很少几个题目上由于马虎而造成的失误外,通常系数和偶然题目上的得分的相关,几乎接近+1.00。
是对信度的高估。
同质性信度也不适用于速度测验,因为只有当所有的人都试过每个题目时题目的变异数才是准确的。
方法:
用重测法和复本法,可根据被试两次回答题目数量的变化对速度的一致性作出估计。
(2)标准参照测验的信度:
在一个团体中,假如绝大部分人都达到了所要求的水平,分数的差异很小,在这种情况下,即使一个具有较高的稳定性和内部一致性的测验,信度系数也可能很低,故通常方法不适用。
方法:
对同一组被试施测两个等值型测验,看在同一个掌握水平上,通过人数的百分比的差别,差别越小,信度越高。
(3)分测验的信度:
当一个测验有几个分测验时,如果整个测验只有一个总的信度估计,不能认为分测验将与合成分数一样地可靠。
因为信度与测验长度有关,分测验分数几乎可以肯定不如合成分数可靠,因此,测验使用者必须查看每一个分测验是否有信度估计,若没有这方面资料,不可靠。
(4)差异的信度:
对一个人在两个测验上的分数作比较(例:
一个学生语文和算数哪一门学的好)因为两组分数差异的标准误差同时受到两组分数中的随机误差影响,因此比每一组分数的标准误差都要大。
变迁的信度:
信度表明的是测量的一致性,如果再次施测不一致便表明有测量误差,当研究者想要了解某一教学计划或方法使学生的知识与技能增加了多少,几年的大学经历使态度与价值观改变了多少时,分数的稳定就表示教育或治疗的失败,研究的是分数的改变,而不是稳定。
(如果测验有效,就应该对行为的变迁敏感,但这样前后分数就会不一致,这时高信度与高效度不相容。
)
信度的影响因素(yīnsù)与改进
影响(yǐngxiǎng)信度的主要因素有:
1、被试方面(fāngmiàn)
个体(gètǐ):
被试的心理特质水平的稳定性(身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等)
团体:
整个团体内部的离散程度以及团体的平均水平都会影响。
2、主试方面
施测人员不按指导手册中的规定施测,故意制造紧张气氛,或给考生一定的暗示,协助等,则测量信度会大大降低。
若阅卷评分标准掌握不一,则会降低测验信度。
3、施测情境方面
考场是否安静、光线和通风是否良好、设备是否齐全、桌面是否合乎要求,空间宽窄是否恰当等都可能影响测验的信度。
4、测量工具方面
测量工具是否稳定,试题取样、试题之间的同质性程度、试题难度等
5、两次施测的时间间隔
计算重测信度和稳定与等值性系数时,两次测验间隔的时间越短,其信度值就越大;间隔时间越长,信度值可能越小。
6、评分计分
提高测量信度的常用方法:
1、适当增加测验长度
注意新增测验项目必须与试卷中原有项目同质,新增项目的数量必须适量(报酬递减规律)。
2、使测验中所有项目的难度接近正态分布,并控制在中等水平。
3、努力提高测验试题的区分度。
4、选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。
5、主试者严格执行实测程序,评分者严格按标准给分,施测场地按测验手册要求布置,减少无关因素的干扰。
6、间隔时间要恰当。
效度
效度:
一个测验或量表实际能测出其所要测的心理特质的程度。
效度是一个相对的概念,是测量的随机误差和系统误差的综合反映,判断一个测量是否有效要从多方面搜集证据
效度:
在一列测量中,与测验目的有关的真实变异(由所要测量的变因引起的有效(yǒuxiào)变异)与总变异(实得变异数)的比率。
公式(gōngshì):
信度等于信度系数(xìshù),效度等于效度系数的平方。
效度的评估(pínɡɡū):
内容效度、结构效度、实证效度
内容效度:
内容效度:
一个测验实际测到的内容与所要测量的内容之间的吻合程度。
(考研时全是超纲题,内容效度就低)
适用范围:
成就测验,职业测验(选拔和分类)。
不适用于能力倾向测验和人格测验。
确定方法:
①逻辑分析法(专家判断法法)【主要方法】
请有关专家对测验题目和原定内容范围的吻合程度做出判断。
步骤:
明确欲测内容的范围-确定每个题目所要测的内容,并与测验编制者所列的双向细目表对照,逐题比较自己的分类和制卷者的分类,并做好记录-制定评分细目表,考察题目对所定义内容范围的覆盖率,判断题目难度和能力要求之间的差异,考察各种题目数量和分数的比例以及题目形式和内容的适当性。
②统计分析法
A克龙巴赫法B再测法C内容效度比
两套平行测验求相关,若相关低,说明至少有一个缺乏内容效度,相关高,一般可推论测验有内容效度。
再测法:
先将测验施测于被试,被试对测验内容了解甚少,得分低;教学训练结束时再测一次,成绩提高大,内容效度高。
③经验法
注:
与表面效度区分开来,表面效度不能算是一种效度。
表面效度是外行人认为某个测验能有效地测到某种心理特质,该测验就有较高的表面效度。
(一般来说,最佳行为测验要求表面效度高,其他则要求表面效度低。
)
结构效度(构想效度、构念效度):
结构效度:
一个测验实际测到所要测量的理论结构或特质的程度,或者说测验分数能够说明心理学理论的某种结构或特质的程度。
(例:
卡特尔根据他的人格理论制作了16pf,结构效度应该是高的)
特点:
(1)结构效度大小首先取决于事先假定的心理特质理论(基于不同的理论假设不能比较);
(2)实测资料无法证实理论时,并不一定结构效度不高;(有可能是理论假设不成立或者该实验设计不能对该假设做出适当检验)
(3)结构效度是通过测量什么,不测量什么的证据积累起来确定的,不是靠单一的数量指标描述的。
确定方法:
1、提出(tíchū)理论假设并分成细小的纲目,以解释被试测验上的表现。
2、依据理论框架,推演出有关测验(cèyàn)成绩的假设。
3、用逻辑的和实证的方法(fāngfǎ)来验证假设
用途(yòngtú):
智力测验,人格测验
结构效度的估计方法:
①测验内部寻找证据
内容效度高实质上也说明了结构效度高;题目反映测的特质之外的因素,结构效度不高;测验的同质性程度。
②测验之间寻找证据(A相容效度法B区分效度法)
相容效度:
新编测验与已知的信效度较好的测相同特质的旧测验之间的相关(越大越好)
区分效度(求异效度)新编测验与已知的信效度较好的测不同特质的旧测验之间的相关(越小越好)
③考察测验的实证效度。
根据效标把人分两类,看得分差异;根据得分把人高低分组,考察两组人在所测特质上是否有差异。
④多种特质-多种方法矩阵法(MTMM)
相容效度和区分效度的综合运用。
⑤因素
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 53