心理测量学知识.docx
- 文档编号:8235756
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:28
- 大小:37.51KB
心理测量学知识.docx
《心理测量学知识.docx》由会员分享,可在线阅读,更多相关《心理测量学知识.docx(28页珍藏版)》请在冰豆网上搜索。
心理测量学知识
第五章心理测量学知识
第一节 概述
第二节 测验的常模
第三节 测验的信度
第四节测验的效度
第五节项目分析
第六节测验编制的一般程序
第七节心理测验的使用
第一节 概述
第一单元测量与测量量表
第二单元心理测验的基本概念
第三单元心理测验的分类
第四单元纠正错误的测验观
第五单元心理测验在心理咨询中的应用
第六单元心理测验的发展史
第一单元测量与测量量表
一、什么是测量
二、测量要素
三、测量量表
一、什么是测量
测量就是依据一定的法则用数字对事物加以确定。
该定义包括三个元素:
1、事物:
指的是我们要测量的事物的属性或特征。
2、数字:
代表某一事物或事物某一属性的量。
3、法则:
代表的是测量所依据的规则和方法。
二、测量要素
两个要素:
参照点、单位。
(一)参照点
绝对参照点相对参照点
(二)单位
好的单位必须具备两个条件:
■有确定的意义,■有相同的价值
三、测量量表
量表是一个定有单位和参照点的连续体。
斯蒂文斯(S.Stevens)划分的四种水平:
(一)命名量表——最低水平
(二)顺序量表——次低水平
(三)等距量表——较高水平
(四)等比量表——最高水平
第二单元心理测验的基本概念
一、心理测验的定义
二、心理测验的基本要素:
*
三、心理测验性质
一、心理测验的定义
所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。
测验即引起某种行为的工具
二、心理测验的基本要素:
1、测量的对象是人的行为
2、选取的是行为样本
3、测量要标准化
4、测量要有常模
三、心理测验的性质
(一)间接性
(二)相对性
(三)客观性
第三单元心理测验的分类
一、按测验功能分类:
智力测验特殊能力测验人格测验
二、按测验的材料分类:
文字测验操作测验
三、按测验材料的严谨程度分类:
客观测验投射测验
四、按测验的方式分类
个别测验团体测验
五、按测验的要求分类
最高行为测验典型行为测验
第四单元纠正错误的测验观
一、错误的测验观
(一)测验万能论
(二)测验无用论
二、正确的测验观
(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具(例如,升学指导测验)
(二)心理测验作为研究方法和测量工具尚不完善
第五单元心理测验在心理咨询中的应用
一、智力测验
二、人格测验
三、心理评定量表(心理与行为评估和应急与相关问题评估。
)
一、智力测验:
韦氏成人智力量表(WAIS---RC)、
韦氏儿童智力量表(C---WISC)、
联合型瑞文测试(CRT)
二、人格测验:
艾森克人格测验(EPQ)
卡特尔16种人格测验(16PF)
明尼苏达多项人格调查表(MMPI)
三、心理评定量表
心理与行为评估:
90项症状清单(SCL--90)、抑郁自评量表(SDS)、焦虑自评量表(SAS)
应急与相关问题评估:
生活事件量表(LES)、社会支持评定量表、应对方式问卷
第六单元心理测验的发展史
一、科学心理测验的产生与发展
二、20世纪心理测验的主要发展:
三、现代心理测验在我国的发展
一、科学心理测验的产生与发展
三个重要人物:
高尔登(F.Galton)
卡特尔(J.M.Cattell)
比内(A.Binet)
二、20世纪心理测验的主要发展:
1、操作测验的发展
2、团体智力测验的发展
3、能力倾向测验的发展
4、人格测验的发展
三、现代心理测验在我国的发展
源于1914年前后。
20世纪二、三十年代两次修订比内-西蒙量表。
1979年后,协作修订国外智力和人格测验工具。
近年来致力于编制适合我国文化背景的测验工具。
第二节 测验的常模
第一单元常模团体
第二单元常模的类型
第三单元常模分数的表示方法
第一单元常模团体
一、常模团体的性质
常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
它用一个标准的、规范的分数表示出来,以提供比较的基础。
对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。
这种工作包括:
确定一般总体、确定目标总体、确定样本。
对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。
标准化测验中,通常提供许多原始分数与各种常模团体的比较转换表,被试者的分数必须与合适的常模比较。
抽取样本的步骤
1确定一般总体
2确定目标总体
3确定目标样本
二、常模团体的条件
(一)群体的构成必须明确界定
■可以用来区分和限定群体的变量是很多的,如性别、年龄、
职业、文化程度、民族、地理地域、社会经济地位等。
■依据不同的变量确定群体,便可得到不同的常模。
(二)常模团体必须是所测群体的代表性样本
■当所要测量的群体很小时,将所有的人逐个测量,其平均分
便是该群体的最可靠的常模。
■在群体较大时,因为时间和人力物力的限制,只能测量一部分人
作为总体的代表,这就提出了取样是否适当的问题
(三)样本的大小要适当
■总体数目小,只有几十个人,则需要100%的样本。
如果总体
数目大,相应的样本也大,一般最低不小于30或100个。
■全国性常模,一般应有2000~3000人为宜。
(四)标准化样组是一定时空的产物
三、取样的方法
(一)简单随机抽样
在简单随机抽样中,每个人或抽样单位都有相同的机会作为常
模中的一部分。
(二)系统抽样
有时在总体数目为N的情况下,若要选择K分之一的被试作为
样本,则可以在抽样范围内选择每个第K个人来构成样本。
(三)分组抽样
有时总体数目较大,无法进行编号,而且群体又有多样性,
这时可以先将群体进行分组,再在组内进行随机取样。
(四)分层抽样
它是先将目标总体按某种变量(如年龄)分成若干层次,
再从各层次中随机抽取若干被试,最后把各层的被试组合
常模样本。
包括分层比例抽样和分层非比例抽样。
四、常模分数与常模
(一)常模分数
■常模分数就是施测常模样本被试后,将被试者的原始分数按
一定规则转换出来的导出分数。
所以,常模分数又叫导出分数。
■导出分数具有一定的参照点和单位,它实际上是一个有意义
的测验量表,它与原始分数等值,可以进行比较。
(二)常模
■常模分数构成的分布,就是通常所说的常模(norm),它是解释
心理测验分数的基础。
■常模有一般常模与特殊常模之分
第二单元常模的类型
一、发展常模
二、百分位常模
三、标准分常模
一、发展常模
(一)发展顺序量表
(二)智力年龄
(三)年级当量
一、发展常模
(一)发展顺序量表
它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。
最早的一个范例是葛塞尔发展程序表,其中按月份显示出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。
皮亚杰——守恒概念的研究。
5岁——质量守恒
6岁——重量守恒
7岁——容量守恒
(二)智力年龄
方法一:
基础年龄与在较高年龄水平的题目上获得的附加
月份之和。
方法二:
将标准化样本中每个年龄组的平均原始分数作为
年龄常模。
通过将原始分数与年龄常模对比,
便可求得每个人的智龄。
(三)年级当量
■年级当量实际上就是年级量表,测验结果说明属哪
一年级的水平。
■年级量表的单位通常为10个月间隔,在一学年中假设
两个月的假期在所测量目标上的发展是不重要的,
因此以10个月为一个年级。
二、百分位常模
■百分等级
指在常模样本中低于这个分数的人数百分比。
■百分点
百分点也称百分位数,与百分等级的计算方法正好相反。
百分等级是计算低于某测验分数的人数百分比,
而百分点则是计算处于某一百分比例的人对应的测验分数是多少。
■四分位数和十分位数
百分位数是将量表分成100份,而四分位数是将量表分成四等份,
相当于百分等级的25%、50%和75%对应的三个百分分成的四段。
十分位数也可以依此类推出,1%~10%为第一段,91%~100%为第十段。
三、标准分数常模
标准分数常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。
因为它的基本单位是标准差,所以叫标准分数常模。
平均数是反应集中趋势当中的一个指标。
=∑X/n,∑表示求和X表示平均数
什么是标准差?
标准差是反映离中趋势当中的一个指标。
*
SD=∑(X-
)2/nSD表示标准差
标准差的用途:
*
1、直接反应数据离散程度的大小,
数据分布分散,曲线低而宽,标准差S值大.
数据分布集中,曲线陡而窄,标准差S值小
数据分布高度集中,是一条直线,标准差S值等于零.
2、标准差直接可以用作一个测量单位来反映某一个原始数据与平均值之间的距离
为了去掉小数和负数,通常把z分数转换成Z量表分数,
这一转换形式为:
Z=A+BzA、B为常数
什么叫标准分数:
标准分数就是以标准差为单位反映一个数与平均数的距离。
标准分数都是由常模样本原始分数的分布推导出来的,所以叫做导出分数,又叫做量表分,我们说原始分转成量表分就是转成了某种标准分。
标准分数用Z表示,也称为Z分数。
(四)常见的标准分数
Z分数
T分数:
平均数为50,标准差为10
离差智商(IQ)
标准九分:
以5为平均数,以2为标准差
标准十分:
平均数为5.5,标准差为1.5;
标准二十分:
平均数为10,标准差为3。
标准分数与百分等级的关系
四、智商的计算及其意义
比率智商
离差智商
必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,
标准差不同,其分数的意义便不同(见附表)。
第三单元常模分数的表示方法
一、转换表法
一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数
——百分位、标准分数、T分数或者其它任何分数。
因此测验的使用者利用
转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。
二、剖面图法
剖面图是将测验分数的转换关系用图形表示出来。
从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。
第三节测验的信度
第一单元信度的概念
第二单元信度评估的方法
第三单元信度与测验分数的解释
第四单元影响信度的因素
第二单元信度评估的方法
一、信度评估的方法
(一)、重测信度
(二)、复本信度
(三)、内部一致性信度——分半信度、同质性信度
(四)、评分者信
二、相关系数是反映信度的指标
(一)、重测信度(test-retestreliability)
又称稳定性系数。
它的计算方法是采用重测法,即使用同一测验,在同样条件下
对同一组被试者前后施测两次测验,求两次得分间的相关系数。
最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,
间隔时间最长不超过六个月。
(二)、复本信度(alternate-formreliability)
又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,
然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
在计算复本信度时,应该有半数的被试先作A本再作B本,
另一半被试先作B本再作A本,由此可以抵消施测顺序的效应。
(三)、内部一致性信度(internalconsistencyreliability)
分半信度(split-halfreliability)
是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试
在两半测验上的得分,求出这两半分数的相关系数。
常用的修正公式是斯皮尔曼—布朗公式
同质性信度(homogeneityreliability)
同质性主要代表测验内部所有题目间的一致性。
当各个测题的得分有较高的正相关时,
不论题目的内容和形式如何,则测验为同质的。
相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。
计算同质性信度有两种方法:
测验采用的记分方法是0,1记分的,用库德-理查逊公式。
测验采用的记分方法是多重记分,用克伦巴赫系数。
(四)、评分者信度(scorerreliability)
随机抽取若干份测验卷,由两位评分者按评分标准分别给分,
然后再根据每份测验卷的两个分数计算相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。
相关系数是反映信度的指标*
表示两类或两类以上数据变量之间关系上的密切程度,是数据的关联程度。
一是数据变化的方向
二是数据变化的程度
第一单元信度的概念
一、信度的定义
信度是指同一被试者在不同时间内用同一测验
(或用另一套相等的测验)重复测量,所得结果的一致程度。
在测量理论中,信度被定义为:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率。
第三单元信度与测验分数的解释
一、确定信度可以接受的水平
二、解释真实分数与实得分数的相关
三、解释个人分数的意义
四、比较不同测验分数的差异
一、确定信度可以接受的水平
当rxx<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;
当0.70≤rxx<0.85时,可用于团体比较;
当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。
二、解释真实分数与实得分数的相关
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,
也就是测验的总变异中真分数造成的变异占百分之几。
什么叫方差
——反映数据变动情况的一个指标。
也叫变异,平方后的标准差就叫方差。
什么叫真分数:
——真实分数是不可能通过测量得到的,测量报告的分数是一个实得分数,由有一个真实分数与一个或大或小的测量误差所组成。
X(实得身高)=T(真实身高)+E(测量误差)
当rxx=0.70时,我们可以说,实得分数中有70﹪的变异来自真正分数的差别,仅有30﹪是来自测量误差。
rxx=1.0,就是完全没有测量误差,所有差异都来自真分数;
信度测量理论的定义:
“信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
”
三、解释个人分数的意义
其一可以估计真实分数的范围
其二可以了解实得分数再测时可能变化的情景
四、比较不同测验分数的差异——这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。
这就是差异分数的标准误问题。
第四单元影响信度的因素
一、样本特征
二、测验长度
三、测验难度
四、时间间隔
一、样本特征
(一)样本团体异质性的影响
(二)样本团体平均能力水平的影响
二、测验长度
(一)测验越长测题取样或内容取样越有代表性。
(二)测验越长被试的猜测因素影响就越小。
三、测验难度
难度与信度不存在简单的对应关系。
如果因为难度过大或过小,
造成分数范围缩小,可使信度降低。
四、时间间隔
再测法求信度,间隔时间越短信度系数越大;间隔时间越久,信度系数越低。
第四节测验的效度
第一单元效度的概念
第二单元效度评估的方法
第三单元效度的功能
第一单元效度的概念
一、效度的定义
二、效度的性质
(一)、效度具有相对性
(二)、效度具有连续性
一、效度的定义
在心理测验中,效度是指所测量的与所要测量的心理特点之间的符合程度,或者简单地说是指一个心理测验的准确性。
在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率。
二、效度的性质
(一)效度具有相对性
任何测验的效度都是针对一定的目标而言。
(二)效度具有连续性
只有程度上的不同,没有“全有”或“全无”的区别。
测验效度是测验结果的有效性程度。
第二单元效度评估的方法
一、内容效度
二、构想效度
三、效标效度
一、内容效度
(一)什么是内容效度
指的是测验题目对有关内容或行为取样的适用性,从而确定测验
是否是所欲测量的行为领域的代表性取样。
(二)、内容效度的评估方法
1、专家判断法
–定义好测验内容的总体范围;
–编制双向细目表,确定内容的具体细节各自所占的比例;
–由每位评判者在评定量表上作出判断。
2、统计分析法
–计算两个评分者之间评定的一致性(评分者信度)
–两个测验复本上得分之相关(复本信度)
–再测法也可用于内容效度的评估(测验-学习-再测验)
3、经验推测法
这种效度是通过实践来检验效度
(三)内容效度的特性
内容效度与所有效度一样,并非普遍适用。
只有编制者与使用者定义的内容范围相同,编制者报告的内容效度对使用者才有意义。
内容效度也有时间上的特定性。
内容效度与表面效度不同。
二、效标效度
(一)什么是效标效度
亦称实证效度,反映的是测验预测个体在某种情境下行为表现的有效程度。
分为同时效度和预测效度。
一个好的效标必须具备4个条件
好效标的4个条件
1.效标本身必须有效;
2.效标必须具有较高的信度,不随时间等因素而变化;
3.效标可以客观地加以测量,可用数据或等级来表示;
4.效标测量的方法简单,省时省力,经济实用。
(二)效标效度的评估方法
1、相关法:
是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,
这一相关系数称为效度系数。
2、区分法:
分析高分组与低分组分布的重叠量,或者计算每一组内得分超过(或低于)另一组平均数的人数百分比,或者计算两组分布的共同区的百分比。
重叠量越大,说明两组分数差异越小,即测验的效度越差。
3、命中率法:
命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。
三、构想效度
(一)什么是构想效度
是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度如何。
要回答的问题是:
该测验欲测量什么心理构想?
对该构想测得有多好?
测验分数中有多少比例的变异数是来自测验所欲测之构想?
(二)构想效度的评估方法
1、对测验本身的分析
•测验的内容效度
•测验的内部一致性指标
•分析被试者对题目的反应特点
2、测验间的相互比较
•相容效度是构思效度的一个证据
•区分效度是构思效度的又一个证据
•因素分析法也是建立构思效度的常用方法
3、效标效度的研究证明
●根据效标分成相对照的两组,比较测验成绩
●观察分析测验高分组与低分组的心理特质
4、实验法和观察法证实
第三单元效度的功能
一、预测误差
二、预测效标分数
三、预测效率指数
一、预测误差
效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,
其表达式是rxy2,它表示能够正确预测或解释效标的测验分数的方差占总方差的比例。
另一种表达方法是估计的标准误,简写为Sest,它是指所有具有某一测验分数的被试
二、预测效标分数
在测验工作中,人们感兴趣的是从测验分数预测效标成绩,
因此最常用的是Y对X的回归方程。
三、预测效率指数用E来表示
第四单元影响效度的因素
一、测验本身的因素
二、测验实施中的干扰因素
三、样本团体的性质
四、效标的性质
一、测验本身的因素
为了提高效度,要做到:
1.测验材料必须对整个内容具有代表性;
2.测题设计时应尽量避免容易引起误差的题型(如是非题);
3.测题难度要适中,具有较高的区分度;
4.测验长度要恰当,即要有一定的测题量;
测题的排列按先易后难顺
二、测验实施中的干扰因素
(一)主试的影响因素
主试不符合标准化要求的任何做法
(二)被试的影响因素
兴趣、动机、情绪、态度和健康状况等
三、样本团体的性质
(一)样本团体的异质性
异质性越高,分数分布范围大,测验效度越高。
1、如果只以选拔出来的被试为样本团体参加研究,会降低测验的效度。
2、选拔标准太高,样本团体的同质性增加,会降低测验的效度。
(二)干涉变量
包括年龄、性别、教育水平、智力、动机、兴趣、职业等。
美国心理学家吉塞利(E.E.Ghiselli)寻找干涉变量的方法:
1、用回归方程求每个人的预测效标分数,与实际效标分数相比较;
2、根据样本团体的组成,设立对照组,分别计算效度。
3、根据显而易见的干涉变量将其分为预测性高和预测性低的两个亚团体。
第五节项目分析
第一单元项目的难度
第二单元项目的区分度
四、效标的性质
效标与测验分数之间是否呈线性关系是很重要的因素。
皮尔逊积差相关系数的前提是假设两个变量的关系是线性的分布。
效标测量本身的可靠性如何亦是值得考虑的问题。
第一单元项目的难度
一、难度的定义:
是指项目的难易程度。
二、计算方法
(一)二分法记分的项目
(二)非二分记分的项目
三、难度水平的确定
(一)项目的难度
P值越接近于0.50,区别力越高。
(二)测验的难度
■如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。
■对于正偏态分布,必须增加足够数量的较容易的项目;对于负偏态分布,必须增加足够数量的有较高难度的项目。
第二单元项目的区分度
一、区分度的定义:
也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。
二、计算方法
鉴别指数
D=PH-PL
相关法计算
■点二列相关:
适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。
■二列相关:
适用于两个连续变量,但其中一个变量被人为分成两类
■相关法:
适用于两个变量均为二分称名变量。
若将测验总分按及格、不及格或录取、淘汰划分,便可计算相关系数。
三、区分度与难度的关系
第六节测验编制的一般程序
第一单元测验的目标分析
第二单元测验的编写
第三单元测验的编排和组织
第一单元测验的目标分析
一、测验的对象
二、测验的用途
三、测验的目标
一、测验的对象
■在编制测验时必须明确测量对象,也就是该测验编成后要用于何种团体。
如WAIS,我们不能用于儿童,而编制时也不会出1+1=?
的题目,
因为这样的题目对幼年儿童比较合适。
■要考虑的因素:
年龄、文化程度、社会经济条件、文化背景、智力水平及阅读水平等
二、心理测验的用途
■心理测验的用途就是指我们编制测验是干什么用的,是要对被试做描述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 知识