心理测量06笔记.docx
- 文档编号:24867025
- 上传时间:2023-06-02
- 格式:DOCX
- 页数:63
- 大小:145.27KB
心理测量06笔记.docx
《心理测量06笔记.docx》由会员分享,可在线阅读,更多相关《心理测量06笔记.docx(63页珍藏版)》请在冰豆网上搜索。
心理测量06笔记
心理测量《心理测验学》2005年12月北大听课笔记
第一章总论
1.中国古代的心理测验思想
A孔子:
把人分为中人、中人以上、中人以下三个类别,“中人以上,可以语上也;中人以下,不可以语上也”。
(相当于现代测量学中的命名量表和次序量表)
B孟子:
“权,然后知轻重;度,然后知长短。
物皆然,心为甚。
”明确指出了心理能力和心理特征与物理现象一样,具有可测量的特性。
C(南朝)刘勰:
世界上最早的“分心测验”,认为一心不能二用。
D(南北朝)颜之推:
周岁试儿,其是1925年格塞尔婴儿发展量表的前导。
E“七巧板”又称益智图、唐图,为当代多数智力测验和创造力测验所使用。
F隋炀帝科举制度的开端,被认为是世界上最早的心理测验的实践。
当时的考试方法:
贴经和对偶,类似于现代西方言语测验中常见的填字和类比。
G中国古代心理测验的思想,包含着典型的东方文化特点:
a他们都是描述性的,没有定量的标准;
b往往将心理特点与道德观念联系起来(局限性)
2.科学心理测验产生的原因
A对智力落后着分类和训练的早期关注
a心理测验产生的最初原因:
对智力落后和精神病人治疗的需要。
b法国医生埃斯克罗:
1838年出版了两卷本著作,第一次明确地对智力落后与精神病人作出了区分,他认为精神病是以情绪障碍为标志。
c法国医生塞国恩:
训练智力落后者的先驱。
B实验心理学的发展
a冯特:
1879年他在德国莱比锡大学建立了心理学史上第一个实验室,引发了个别差异的研究。
b实验心理学的诞生和发展,给心理测验带来了另一个副产品:
严格的标准化程序。
3.心理测验的发展
A高尔顿:
英国生物学家和心理学家高尔顿是倡导测验运动的主要人物。
他设计了测量差异的方法,虽不是正式的心理测验,但可视为心理测验的开端。
他还是评定量表和问卷法应用的先驱,他的另一个重要贡献是为心理测验奠定了统计学基础,并第一个提出了相关的概念。
B卡特尔:
美国心理学家,从师冯特。
1890年,卡特尔在《心理》杂志上发表“心理测验与测量”,这是心理测验第一次出现于心理学文献中。
C世界上第一个智力测验:
比内与助手西蒙在《心理学年报》上发表了一篇文章,题为:
“诊断异常儿童智力的新方法”,是世界上第一个正式的心理测验。
比内-西蒙量表自1905年发表后,在1908年修订,1908年量表题目总数达到了59个,所有测题按年龄分组,组别从3-13岁,测验的结果用“智力水平”表示,但其通常翻译和提法为“智力年龄”。
后又经1911年修订一次。
D心理测验的蓬勃发展:
a操作测验的发展:
理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。
b团体智力测验的发展:
这是心理测验方式的极大进步,也扩大了测验的应用范围。
c能力倾向测验的发展:
韦克斯勒所编的学前儿童、学龄儿童、成人智力量表。
d人格测验的发展:
心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。
e现代西方心理测验的发展,受到计算机的产生和发展,以及统计方法的改进的极大影响。
4.现代心理测验在中国的发展:
以1949年中华人民共和国成立为分期
A中华人民共和国成立前心理测验的发展
a1916年,樊炳清先生首先介绍了比内-西蒙智力量表;
b1920年,廖世承和陈鹤琴在南京高等师范学校开设心理测验课,并用心理测验试测投考该校的学生,这便是中国正式开始的科学心理测验;
c1921年,他俩正式出版《心理测验法》一书,成为中国最早的心理测验专著;
d1922年,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学,并主持编制心理测验事宜;
e1924年,陆志韦发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订;
f1931年,由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会;
g1932年,《测验》杂志创刊。
B中华人民共和国成立后心理测验的发展
a1979年,林传鼎、张厚粲等以国外资料为参考,编制了少年儿童学习能力测验;
b1989年,成立中国心理学会心理测验专业委员会,标志着中国心理测验已进入了一个新的高速发展时期。
5.测量
A测量的定义:
测量就是根据一定的法则,用数字对事物加以确定。
a一定的法则:
是指测量行为发生时采用的规则或方法。
b事物:
是指我们要测量的感兴趣的事物的属性或特征。
c数字:
可以表示数量,也可以不表示数量。
d通常人们所说的测量,指的是给事物确定出一种数量化的价值。
B测量的要素:
一是参照点,二是单位
a参照点:
一种是绝对的零点;一种是相对参照点,是认为确定的。
最理想的参照点是绝对零点,心理测验中所用的参照点都是相对的,因而测量的结果常常不能以“倍数”的方式解释。
b理想的单位的条件:
有明确的意义和有相等的价值。
C测量的量表:
量表就是有参照点和单位的连续体。
斯蒂文斯将量表由低到高依次为:
a命名量表:
是水平最低的一种测量量表,用数字来代替事物或对事物进行分类;
b顺序量表:
不仅表明类别,还能表明不通类别的大小等级,或具有某种属性的程度;
c等距量表:
不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝对零点,所以不能做乘除运算;
d比例量表:
是最精确的测量,既有相等的单位,又有绝对零点。
D心理量表的性质:
一般来说,心理测量是在顺序量表上进行的。
6.心理测验
A心理测验的要素
a行为样本:
对少数经过慎重选择的样本进行观察,来间接推知被试的心理特征。
b标准化:
是指测验编制、实施、记分以及测验分数解释程序的一致性,标准化的量一个重要步骤是建立有代表性的常模。
c客观性:
在不受被试主观判断支配的范围内,测验的实施、评分、解释应是客观的,要尽量减少主试和被试的随意程度。
客观性另一个主要方面是测题或整个测验的难度水平的确定必须客观。
神经心理测验客观性最高,智力测验较高,人格问卷次之,投射测验的客观性较低。
B定义:
心理测验即是依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
C心理测验的性质
a心理测验的间接性;
b心理测验的相对性;
c心理测验的客观性:
心理测验标准化包括:
测验用的项目或作业、实测说明、实测者的言语态度及实测时的物理环境等,均经过标准化。
评分记分的原则和手续经过了标准化,对反应的量化是客观的。
分数转换和解释经过了标准化,对结果的推论是客观的。
D心理测验的种类
a按测验功能分类:
智力测验:
比内-西蒙智力测验、韦克斯勒儿童和成人智力量表。
特殊能力测验:
如音乐、绘画等
人格测验:
明尼苏达多项人格调查表(MMPI)、16种人格因素问卷(16PF)、艾森克人格问卷(EPQ)、罗夏墨迹测验、主题统觉测验(TAT)。
b按测验材料的性质分类:
文字测验:
言语作为刺激。
MMPI、EPQ、16PF及韦克斯勒儿童和成人智力量表中的言语量表部分。
优点:
实施方便,团体测验多用,有肢体残疾而无言语困难的病人只能用此。
缺点:
受被试文化程度的影响。
操作测验:
也称非文字测验。
罗夏墨迹测验、主题统觉测验、瑞文测验及韦克斯勒儿童和成人智力量表中的操作量表部分。
优点:
不受文化因素的限制。
缺点:
大多不宜团体实施,在时间上不经济。
c按测验材料的严谨程度分类:
客观测验和投射测验
d按测验的方式分类:
个别测验:
优点:
主试可以仔细观察被试的言语情绪,并有充分的机会与被试合作,所以其结果正确可靠。
缺点:
时间不经济,不能在短时间呢您收集到大量的资料。
团体测验:
优点:
时间经济,主试不必接受严格的专业训练即可担任。
缺点:
主试对被试的行为不能作切实的控制,所得结果不及个别测验正确可靠。
E心理测验的功能:
最基本的功能是测量个体差异或行为反应。
a从实际应用角度看:
人才选拔;
岗位安置
临床诊断;
教育评价;
心理咨询和治疗
b从理论研究角度看:
搜集材料:
心理测验是收集个体差异资料最快捷的办法。
提出和验证假设
实验分组
F错误的测验观
a测验万能论
b测验无用论:
某些人格测验侵犯了个人隐私;
测验为宿命论和种族歧视提供了心理学依据。
c心理测验即智力测验
G正确的测验观
a重要的心理学研究方法和决策的辅助工具:
心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。
b作为研究方法和测量工具尚不完善:
过分夸大心理测验的科学性和准确性是不对的。
c科学地看待心理测验,防止乱用测验:
测验使用者必须具备一定的资格;
慎重选择测验量表;
与被试建立良好的协调关系;
正确解释测验结果;
注意测验的保密。
第二章心理测验的编制
7.心理测验的对象:
首先要明确测量的对象,也就是测验编成后要用于哪些团体。
A年龄
B教育水平:
在编制儿童测验时,要同时考虑教育水平和年龄的影响。
在承认测验中,一般只考虑教育水平的影响。
C文化背景
8.测验的目的:
测验的目的分为显示和预测,由此测验分为:
A显示性测验:
是指测验题目和所要测量的心理特征相似的测验。
古德纳夫又将其分为:
样本测验和标记测验。
B预测性测验:
指预测一些没被测量的行为的测验。
9.测验的目标:
是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
目标分析以测验不同而异,一般分为三种情况:
A工作分析:
主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。
B对特定概念下定义:
如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。
C确定测验的具体内容:
如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能。
10.测题的编写技术
A搜集有关资料:
题目的有关来源
a已出版的标准测验
b理论和专家的经验
c临床观察和记录
B命题的原则及编写要领
a命题的原则(理解):
内容方面:
符合测验的目的,取样有代表性,相互独立,互不牵挂;
文字方面:
准确,简明扼要,少使用双重否定句;
理解方面:
不要超出受测团体的知识水平和理解能力,不要有争议误解;
社会敏感性方面:
应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
●菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略:
命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。
命题时假定规范不一致。
指出该行为是常见的,虽然是违规的。
b测题的编制要领:
根据被试的要求不同分为
提供型:
要求被试给出正确答案。
选择题:
要求被试在有限几个答案中选择正确的答案。
由题干和选项构成。
题干:
呈现一个问题的情境,一般由直接问句或不完全的陈述句构成。
选项:
问题的多种可能答案,常常是包含一个正确答案,若干(一般是1
~5个)错误答案,其中的错误的答案叫做“诱答”。
11.测题的编排
A一般原则:
a测题的难度排列易逐步上升;
b尽可能将同类型的测题组合在一起;
c各种类型测题本身的特点;
B常见试题排列方式:
a并列直进式
b混合螺旋式
第三章测验的信度
12.信度
A定义:
指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测、
量,所得结果的一致程度。
a理论定义:
传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为:
X=T+E(公式3-1)
讨论一组测验分数的特性时,可用方差导标具体分数,公式:
(测验实得分数的方差)=
(测验真分数的方差)+
(测验误差的方差)(3-2)
b操作定义:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。
计算公式:
(公式3-3)
由于真实分数的方差是无法统计的,因此公式3-3可转化为:
(公式3-4)
B信度的指标
a信度系数:
大部分情况下,信度是信度系数为指标,它是一种相关系数。
理论上说就是真分数方差与实得分数的方差的比值,公式是:
(公式3-5)
b信度指数:
是真分数标准差与实得分数的标准差的比值,公式是:
信度指数的平方就是信度系数(公式3-6)
c标准误:
指出个人测验分数的变异量。
信度系数表示一组测量的实得分数与真分数的符合程度,标注误表示个人测验分数的变异量。
用一组被试两次测量结果来代替同一个人反复实测,有了信度的另一个指标:
(公式3-7)
测量标准误。
测量的标准误与信度之间呈反比关系:
标准误越小,信度越;标准误越大,信度越低。
C信度与测验分数的解释
a解释真实分数与实得分数的相关:
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
b比较信度可以接受的水平:
一般的能力测验和成就测验的信度系数都在0.90以上;人格测验、兴趣、态度、价值观等测验的信度一般在0.80-0.85。
一般原则是:
当
<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤
<0.85时,可用于团体比较;当
≥0.85时,才能用来鉴别或预测个人成绩或作为。
c解释个人分数的意义:
从信度可以解释个人分数的意义,这是测量标准误的应用。
它有两个作用:
一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。
例题:
假设在一个智力测验中,某个被试的IQ为100,这是否反映了他的真实水平?
如果再测一次他的分数将改变多少?
已知该智力测验的标准差是15,信度系数为0.89,则其IQ的测量标准误和可能范围分别为:
SE=15
=5.0
IQ=100±1.96x5=100±9.8≈90~110
我们可以说这个被试的真实IQ有95%的可能性落在90与110之间。
即若再测一次,他的智商低于90、高于110的可能性不超过5%。
d比较不同测验分数的差异:
测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。
这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。
例题:
某被试在韦氏成人智力测验中言语智商为102,操作智商为108。
已知两个分数都是以100为平均数,15为标准差的标准分数。
假设言语测验和操作测验的分半信度分别为0.97和0.93。
问其操作智商是否显著高于言语智商呢?
首先计算出差异分数的标准误:
在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是
误差的影响。
因此,将差异标准误(4.74)乘以1.96,结果为9.29,这表明个体在韦氏测验两半得分的差异高于大约10分,才能达到0.05显著水平。
上述被试的分数差异(108-102=6)是不显著的。
D信度的类型及估计方法
a重测信度:
又称稳定性系数。
他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
前提假设:
所测量的特性必须是稳定的;
每个人对前一次反应的遗忘程度相同;
在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。
b复本信度:
又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
复本信度反映的是测验在内容上的等值性,故称等值性系数。
复本信度的高低关键取决于复本测验的选择。
如果两个复本的施测相隔一段时间,则称稳定与等值系数。
稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。
在实际应用时,为了抵消施测顺序的效应,应该有半数的被试先作A本再作B本,另一半被试先作B本再作A本。
c内不一致性信度
分半信度:
指采用分办法估计所得的信度系数。
这种方法估计信度系数只需
一种测验形式,实施一次测验。
通常是在测验实施后将测验按奇、偶数分为等
值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关
系数。
常见的是将测题按其序列号的奇偶分半,这种分法的前提是:
测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。
常用的修正公式是:
斯皮尔曼-布朗公式:
例题:
某测验分为两半后求得的相关系数为0.524,则测验在原长度时的度估计值为:
=
斯皮尔曼-布朗公式为经验公式,他的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。
当假设不成立时,可采用:
弗朗那根公式或卢伦公式中的任一一个。
同质性信度:
指测验内部所有题目间的一致性。
当各个测题的得分有较高
的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看
起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。
对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因
而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样
每个分测验就能用来预测异质效标的某一方面。
同质性信度的公式主要有:
库德-理查逊公式:
常用的是K-R20公式,在个各测题难度相同或近似的情况
下,还可采用计算更为简便的K-R21公式。
克伦巴赫α系数
d评分者信度:
用于测量不同评分者之间所产生的误差。
为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。
e各种信度系数相应误差方差的来源
信度系数类型
误差方差来源
重测信度
时间取样
复本信度(连续施测)
内容取样
复本信度(间隔施测)
时间和内容取样
分半信度
内容取样
同质性信度
内容的异质性
评分者信度
评分者之间的差异
E影响信度的因素
a样本的特征:
信度常用信度系数来表示,信服系数就是相关系数,相关系数受样本团体得分分布、样本是否异质及样本团体平均能力水平的影响。
样本团体分数分布的影响:
当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。
样本团体异质性的影响:
若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
样本团体平均能力水平的影响:
对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
b测验的长度:
测验越长,测验的测题取样或内容取样越有代表性。
测验越长,被试的猜测因素影响就越小。
c测验的难度:
难度对信度的影响只存在于某些测验中,如智力测验、成就测验、
能力倾向测验等。
如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。
两种情况均会使信度样本的分数范围变窄,从而使测验变得不够可靠。
从理论上说,只有难度水平为50%时,才能使测验分数分布范围最大,求得的信度也最高。
d测验的时间间隔:
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越大,信度系数便越低。
第四章测验的效度
13.效度
A定义:
效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
a在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率,即
(公式4-1)
b一组测验分数的总方差等于真实方差与误差方差之和,而真实方差又可分为两部分,即有关的方差和无关的但稳定的方差,后者也就是所谓系统误差带来的方差
(公式4-2),将(公式4-1)代入得
(公式4-3)由于有效方差是一个理论值,无法测量,所以效度和信度一样是一个理论上的概念。
B信度和效度的关系
a信度是效度的必要而非充分条件:
从方差分配公式:
可以看出,
增大,即效度高,信度的真方差(
)必然大,故信度必然高。
当信度高时,即
降低时,
是否增加还要看
是否增减,因此效度不一定就高。
效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必然条件,并不是效度高的充分条件。
b效度是受信度制约的:
信度系数的平方根是效度系数的最高限度,可见,一个测验的效度总是受它的信度所制约。
C效度的性质
a效度具有相对性:
我们不能笼统地说某测验有没有效,而应说它对测量什么有没有效。
b效度具有连续性:
测验效度通常用无关系数表示,它只有程度上的不同,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。
D效度的类型及评估方法
a内容效度:
指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
想编制有较高内容效度的心理测验:
要对所测量的心理特性有个明确的概念,并划定出哪些行为与这心理特性有关。
次测验题目应是所界定的内容范围的代表性取样。
内容效度的评估方法:
专家判断法:
请有关专家对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定的内容,这种估计效度的方法,是一个逻辑分析的过程,所以内容效度有时也可称为“逻辑效度”。
统计分析法:
出了描述性语言外,内容效度的确定也可采用一些统计分析方法,符合程度越高越能反映测验的内容效度。
克伦巴赫提出,内容效度可由一组被试在独立取得自同样内容范围的两个测验复本上得分之相关来作数量的估计。
再测法也可用于内容效度的评估。
经验推测法:
通过实践来检验效度。
如果通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。
内容效度与表面效度的关系:
经常混淆。
表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是所要测的东西。
表面效度只考虑题目与测量目的之间的明显的、直接的关系,内容效度则考虑到题目与测量目的和内容总体之间逻辑的微妙关系。
在编制测验时,表面效度是一个必须考虑的特性,最高作为的测验通常要求有较高的表面效度;典型行为测验要求有较低的表面效度。
b构想效度:
1954年提出,有人翻译为构思效度,也有叫结构效度。
它是指测验能够测量到理论上的构想和特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
构想效度的估计方法:
对测验本身的分析:
测验的内容效度可以作为构思效度的证据;测验的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;分析被试对题目的反应特点也可以作为构思效度的证据。
测验间的相互比较:
通过分析几个测验间的相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确定这些测验的构思效度。
最简单的是计算两种测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 测量 06 笔记