第5章心理测量学要点文档格式.docx
- 文档编号:22200315
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:35
- 大小:106.65KB
第5章心理测量学要点文档格式.docx
《第5章心理测量学要点文档格式.docx》由会员分享,可在线阅读,更多相关《第5章心理测量学要点文档格式.docx(35页珍藏版)》请在冰豆网上搜索。
14、在顺序量表中,数字没有相等的单位,也没有绝对的零点,因而不能进行代数运算。
15、等距量表:
能够指代事物的类别、等级,而且具有相等的单位。
16、在等距量表中的数字可以进行加减运算;
由于只有相对零点,等距量表不能进行乘除运算。
17、等比量表:
除了具有类别、等级、等距的特征外,还具有绝对的零点。
18、等比量表不仅可以知道测量对象之间的差异程度,而且可以知道它们之间的比率。
19、由于绝对零点难以确定,心理测量是在顺序量表上进行的。
20、相等的单位也难以获得,心理测量只是将顺序量表上得到的数据转换为等距数据。
第二单元心理测验的基本概念
1、心理测验:
依据心理学理论,使用一定的操作程序,通过观察人的少数代表性行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
2、心理测验应注意的四个方面:
(1)心理测量的是人的行为。
(2)在测量个别差异的时候,只是从少数具有代表性的行为样本进行观察,间接推知被试者的心理特征。
1、错误的测验观*:
(1)测验万能论
(2)测验无用论a.某些人格测验侵犯个人隐私,违背民主原则;
b.测验为宿命论和种族歧视提供了心理学依据。
(3)心理测验即智力测验。
2、正确的测验观*:
①心理测验是重要的心理学研究方法之一,是决策的辅助工具。
②心理测验作为研究方法和测量工具尚不完善。
第五单元心理测验在心理咨询中的应用
1、我国心理门诊中运用较多的大致有三类心理测验:
智力测验、人格测验、心理评定量表。
2、目前常用智力测验量表:
中国比内量表、韦氏成人智力量表~WAIS-RC、韦氏儿童智力量表~C-WISC(WISC-CR)、韦氏幼儿智力量表~C-WYCSI、瑞文推理测验~SPM、联合型瑞文测验~CRT。
3、智力测验量表可在求助者有特殊要求以及对方有可疑智力障碍的情况下适应。
4、常用的人格测验*:
艾森克人格问卷~EPQ、卡特尔16人格因素问卷~16PF、明尼苏达多项人格调查表~MMPI。
5、MMPI还有助于了解是否属于精神异常范围。
6、心理评定量表包括:
精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表。
7、心理测验在心理咨询中的应用*:
①心理测验是分析求助者的重要工具。
②不仅可以检验咨询人员的判断是否明确,还能帮助对求助者的问题进行深入分析。
③心理测验在咨询关系建立之前实施,而在进入正式的心理咨询程序后,尽量避免使用。
8、我国的科举制度被公认为世界上最早的心理测验的实践。
9、科学的心理测验是在工业革命成功后的19世纪发展起来的。
10、高尔顿的遗传学研究被视为心理测验的开端。
由他提出的相关概念,为判定心理测验的信度、效度和因素分析奠定了基础。
11、卡特尔写的《心理测验与测量》,是心理测验第一次出现在心理学文献中。
12、比内与西蒙合作完成了世界上第一个智力测验量表“比内~西蒙量表”。
13、在经过高尔顿(19世纪80年代)、卡特尔(90年年代)、比内(20世纪初)的十年后,心理测验呈现出的发展趋势:
a.操作测验的发展b.团体测验的发展c.能力倾向测验的发展d.人格测验的发展
14、我国的测验大约源于1914年前后。
1979年以后进行大规模的修订。
近些年,我国的学者开始致力于本土化,编制适合我国文化背景的智力测验、适应行为量表等。
第二节测验的常模
第一单元常模团体
1、在制定常模之前,首先就是要确定常模团体。
2、常模团体:
由某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
3、常模团体用一个标准的、规范的分数表示出来,以提供比较的基础。
4、常模团体的性质*:
①对于编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。
②包括确定一般总体、目标总体以及样本。
③对于使用者而言,现有的常模团体哪个适用?
5、常模团体的条件:
(1)群体的构成必须明确界定:
必须清楚地说明所要测量的群体的性质与特征。
(2)常模团体必须是所测群体的代表性样本。
(3)样本大小要适当:
一般不低于30或100个,全国性常模一般应有2000~3000人。
(4)标准化样组是一定时空的产物,只能反应当时当地的情况。
6、随机原则:
所取个案不是人为主观决定的,每个个案被抽取的机会均等。
7、取样:
从目标人群中选取具有代表性的样本。
8、取样的方法*:
简单随机抽样、系统抽样、分组抽样、分层抽样。
9、简单随机抽样:
按随机表顺序或编号随机选择。
10、系统抽样要求目标总体无序可排、无等级结构存在,如发现排列有某种内部循环规律存在,系统抽样不适用。
11、分组抽样应用于总体数目较大、无法进行编号、群体多样性。
12、分层抽样:
目标总体按某种变量分成若干层,再从各层中随机抽取、组合成常模样本。
13、分层抽样可避免样本集中于某种特性或缺少某种特性的现象。
14、在确定常模时,最常用的是分层抽样方法,又分为分层比例抽样和分层非比例抽样。
15、常模分数*:
施测常模团体样本被试后,将被试的原始分数按一定的规则转换出来的导出分数。
16、原始分数:
将被试者的反应与标准答案相比较而获得的测验分数,是从测验中直接获得的。
17、导出分数:
根据原始分数的分布特点和现代数理统计方法的基本原理,由原始分数转换而来的分数。
18、导出分数具有一定的参照点和单位,是一个有意义的测验量表,与原始分数等值,可以进行比较。
导出分数具有意义、等单位和参照点。
19、常模*:
常模分数构成的分布,是解释测验分数的基础,分为一般常模和特殊常模。
20、测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况。
21、特殊常模是为非典型团体建立的,可使被试的结果与最接近的人进行比较但不容许在较广的范围内使用。
第二单元常模的类型
1、常模的类型:
发展常模、百分位常模、标准分常模。
2、发展常模:
将各种发展水平的人的平均表现制成的量表,又称年龄量表。
3、在年龄量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。
4、发展顺序量表*是最直观的发展常模,最早的常模是葛赛尔发展程序表。
5、葛赛尔强调早期行为的发展是有规律的,如婴儿的感觉运动发展:
4周能控制眼睛运动追随一个物体、16周能使头保持平衡、28周能用手抓握东西玩弄、40周能控制躯干坐立爬行、52周能控制腿脚运动站立行走。
6、葛赛尔发展程序表按月份显示儿童在运动水平、适应性、语言、社会性方面的大致发展水平。
7、瑞士学家皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的研究,其中最著名的是对守恒概念的研究。
8、守恒:
等量物体只要无增无减,无论怎样改变组合,在质量、重量、长度、数量、容量等方面始终相等。
9、皮亚杰发现,儿童不同时期出现不同守恒概念,通常5岁理解质量守恒、6岁掌握重量守恒、7岁有容量守恒概念,后人组织成的标准化量表,能够对儿童的行为做质的描述。
10、比内-西蒙量表中最先使用智力年龄~心理年龄(MA)的概念。
11、智力年龄:
儿童在年龄量表上所得的分数代表其智力水平,简称智龄。
12、智龄是年龄量表上度量智力的单位。
13、教育成就测验中最常用的是:
年级当量~年级量表,通常为10个月间隔。
14、百分位常模:
百分等级、百分点、四分位数和十分位数。
15、*百分等级是应用最广的表示测验分数的方法。
16、百分等级:
在常模样本中低于这个分数的人数比例,分为分组资料和未分组资料,两者只是计算方法不一样,百分等级的意义相同。
17、PR=100﹣(100R﹣50/N),PR未分组资料百分等级,R原始分数排列顺序数,N样本总人数。
18、百分点~百分位数:
表示处于某一百分比例的人对应的测验分数是多少。
19、百分点的计算可根据直线内插法,100﹣X/最高分﹣PP=X﹣1/PP﹣最低分,PP百分等级的百分位数。
20、通过双向方式将原始分数与百分等级对照表一起编制,就是百分位常模。
21、四分位数和十分位数只是百分位数的变式。
四分位数相当于百分等级的25%、50%、75%、100%。
十分位数相当于0~10%、11%~20%等。
22、标准分常模是将原始分数与平均分数的距离以标准差为单位表示出来的量表。
23、常见的标准分数有:
z分数、Z分数、T分数、离差智商(IQ)等。
24、标准分数可通过线性转换和非线性转换。
25、z分数为最典型的线性转换的标准分数。
z=X﹣X-/SD,X为任一原始分数,X-为样本平均数,SD为样本标准差,z分数可用来表示某一分数与平均数之差是标准差的几位。
26、由于在z分数中经常出现小数点和负数,且单位过大,常转换成另一形式的量表分数。
Z=A+Bz,Z转换后的标准分数,A、B需要指定的常数。
加一个常数是为了去掉负值、乘一个常数是为了使单位变小去掉小数点。
27、当原始分数不是常态分布的,使之常态化的过程即为非线性的转换。
28、常态化过程:
将原始分数转换成百分等级,再转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。
29、几个重要的非线性转换导出分数:
T分数:
平均值为50,标准差为10,T=50+10z’;
标准九分:
平均分为5,标准差差为2;
标准十分:
平均分为5,标准差为1.5;
标准二十分:
平均分为10,标准差为3。
30、使用最广影响最大的一种常态化标准分数是离差智商。
31、目前,一般用比率智商和离差智商表示智力的高低。
32、斯坦福大学推孟教授制订斯坦福~比内量表,即比率智商。
33、比率智商~IQ:
心理年龄与实足年龄之比,在乘以100。
IQ=MA/CA×
100。
34、心理学家韦克斯勒提出离差智商。
35、离差智商:
以年龄组为样本计算而得到的标准分数,平均数为100,标准差为15。
WAIS-RC的智商采用此智商。
IQ=100+15z’=100+15(X﹣X-)/SD,X被试的量表分数,X-被试所在年龄水平的平均量表分数,SD这一年龄水平被量表分数的标准差。
第三单元常模分数的表示方法*
1、常模分数的表示方法:
转换表法、剖面图法。
2、转换表包含了一个特定的标准化样组的原始分数与其相对应的等值分数,如百分位、标准分数、T分数等。
3、剖面图是将测验分数的转换关系用图形表示出来。
第三节测验的信度~信度的概念、信度的评估方法、信度与测验分数的解释、信度的影响因素
第一单元信度的概念
1、信度的定义*:
同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
2、信度只受随机误差的影响,可视为测验结果受机遇影响的程度。
3、系统误差产生恒定效应,不影响信度。
4、每一个测验的实得分数X,部是由真实分数T和误差E两部分组成。
X=T+E。
5、一组测验分数的特性,可用方差代表具体分数。
S2X=S2T+S2E
6、信度可以看作在总的方差中非测量误差的方差所占的比例。
7、在测量理论中,信度被定义为:
一组测量分数的真分数方差与总方差(实得分数的方差)的比率。
rXX=S²
T/S²
x
8、信度也可以理解为在总的方差中非测量的方差。
可转化为rXX=S²
X﹣S²
E/S²
X=1﹣S²
X
9、信度的指标*:
信度系数、信度指数、测量标准误。
10、大部分情况下,信度以信度系数为指标。
11、理论上,信度系数是真分数方差与实得分数的方差的比值,信度指数的平方就是信度系数。
rXX=r2XT=S²
XrXX信度系数rXT信度指数。
12、测量标准误
理论上,常常用一个团体两次施测的结果,以估计测量误差的变异数。
两次测量的分数之差构成一个分布,这个分布的标准差便是标准误,它是测量中误差大小的客观指标。
SE=SX√1﹣rXXSE测量标准误SX所得分数标准差rXX测验的信度系数。
第二单元信度评估的方法*(概念)
1、对信度的评估方法是没有通用法则的,不同的信度反映测验误差的不同来源。
2、信度的评估方法:
重测信度~稳定性系数、复本信度~等值性系数、内部一致性信度、评分者信度*。
3、重测信度:
用同一个测验,在相同条件下对同一组被试施测两次所得到结果的相关系数,又称为稳定性系数。
4、重测信度的优点在于提供有关测验是否随时间而变异的资料,缺点是相隔太短记忆犹新相隔太长经验积累,两次测验时间间隔一般2~4周,不超过6个月。
5、复本信度:
以两个等值但题目不同的测验(复本)来测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数,又称为等值性系数。
6、如果两个复本间隔一段时间施测,被称为重测复本信度或稳定与等值系数。
7、复本信度的优点是避免重测信度的一些问题,如记忆效果、学习效应等;
局限性是如行为易受练习的影响则复本信度只能减少而不能完全消除这种影响、容易出现解题原则的迁移、建立复本是十分困难的。
8、重测信度与复本信度主要考察测验跨时间的一致性~稳定性和跨形式的一致性~等值性,内部一致性信度反映了题目之间的关系,表示测验能够测量相同内容或特质的程度。
9、内部一致性信度包括:
分半信度、同质性信度。
10、分半信度:
采用分半法估计所得的信度系数。
通常将一个测验分成对等的两半后,所有被试在这两半上所得分数的相关系数。
11、斯皮尔曼~布朗分半信度修正公式为经验公式,假设条件是两半测验分数的变异数相等。
rXX=(2rhh)/(1+rhh)
当假设不成立时,采用弗朗那根公式或卢伦公式直接求测验的信度系数。
12、同质性信度:
测验内部所有题目间的一致性。
相关高,测验是同质的,相关低,测验为异质的。
13、计算同质性信度的公式:
①库德~理查逊提出一组分析题目间一致性以估计信度的方法,K﹣R20或K﹣R21。
②克伦巴赫α系数,针对以上只适用于答对一题记一分,答错无分的测验,不适于多重记分的测题的情况。
14、评分者信度:
多个评分者给同一批人的答卷进行评分的一致性。
这种评分方法主要用于主观题的测试。
15、当多个评分者评定多个对象时,并以等级法计分时,可采用肯德尔和谐系数(W)。
16、一般评分者信度相关系数达到0.90以上,才认为评分者的结果可信。
第三单元信度与测验分数的解释
1、信度与测验分数:
解释真分数与实得分数的相关、确定信度可以接受的水平、解释个人分数的意义、比较不同测验分数的差异。
2、信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,即测验的总变异中真分数造成的变异占百分之几。
3、同时信度系数告诉了我们测量误差所占的比例,由于信度是承受情境改变的可据此精确地说明某种测验在某种特定条件下对某种特定样本所得的测量误差。
4、rXX=1表示完全没有误差、rXX=0表示所有的变异和差别都反映的是测量误差、rXX从0到1的正数范围代表了缺乏信度到完全可信的所有状况。
5、信度系数的原则:
rxx<
0.7,测验不能用于对个人做出评价;
0.7≤rxx<
0.85,测验用于团体比较;
rxx≥0.85,才能用于鉴别或预测个人的成绩。
新编测验的信度应高于原有的同类测验或相似测验。
6、从信度的角度解释个人分数的意义,这就是测量标准误的应用,可以估计真分数的范围、了解实得分数再测时可能的变化情形。
7、知道一组测量的标准差和信度系数,可求出测量的标准误。
8、根据标准误确定出在不同或然率水平上真分数的置信区间,即从每个人的实得分数估计出真分数的可能范围。
9、一般采用95%的或然水平,其置信区间为:
X﹣1.96SE<XT<X﹢1.96SE,约有95%的可能性真分数落在所得分数±
1.96SE的范围内、约有5%的的可能性真分数落在所得分数±
1.96SE的范围外、再测时分数改变的可能范围。
10、测量的标准误和测验信度在评价两个不同测验的分数是否具有明显的差异,非常重要。
这种比较包含了两个人在不同分数的差别和同一被试在两个测验上的差别。
这就是差异分数的标准误问题。
11、差异分数的标准误公式:
SEd=S√2﹣rxx﹣ryy
12、统计学上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差造成的。
即被试差异分数高于差异标准误乘以1.96的结果,才能达到0.05的显著水平。
第四单元影响信度的因素*
1、影响信度的因素:
样本特征、测验长度、测验难度、时间间隔。
2、信度常用信度系数表示,信度系数就是相关系数,相关系数受样本是否异质及样本团体平均水平的影响。
3、任何相关系数都要受到团体中分数分布的范围所影响,而分数范围与样本团体的异质程度有关。
4、若获得信度的取样团体较为异质,会高估测验的信度,相反会低估测验的信度。
5、同质团体中,主要受随机误差的影响,相关极低;
异质团体中,信度高。
6、一般来说,增加同质的题目,可以使信度提高。
这是因为a.测验越长,测验的测题取样或内容取样就越具有代表性;
b.测验越长,被试猜测的因素就越小。
7、通过斯皮尔曼~布朗公式的导出公式可计算出最少应增加的题数:
K=rkk(1﹣rxx)/rxx(1﹣rkk)
8、一般来说,难度越大,信度就越低。
9、从理论上说,只有平均难度水平为50%时,才能使测验分数分布范围最大,求得的信度最高。
10、事实上,难度为0.50只适合于简答型题目。
11、洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:
五择一测题0.70、四择一测题0.74、三择一测题0.77、是非题0.85。
12、时间间隔只对重测信度和不同时测量时的复本信度有影响,对其余的信度不存在时间间隔问题。
13、一般来说,间隔越短,信度越高,间隔越长,信度越低。
14、速度测验不存在评分者信度,也无法计算同质性信度。
15、重测信度和复本信度均可按传统的方法求得,只有分半信度不能按传统方法估计。
16、要会计速度测验的分半信度,不能奇偶项划分两半测验,而应按测验时间划分相等的两部分,再求出两部分测验间的相关,才是分半信度。
17、如无法独立施测测验的两部分,一种替代的方法是把整个时限分为四等分,并救出在每个时限内的分数,第一第四段时间里得到的分数相加,第二第三段时间里得到的分数相加,计算相关系数,并用斯皮尔曼~布朗公式校正。
18、韦氏成人智力量表~WAIS是由言语量表和操作量表两部分构成的,言语量表包括6个分测验、操作量表包括5个当测验,据此组合为言语量表分、操作量表分、全量表分,以估计被试的言语智商~VIQ、操作智商~PIQ、总智商~FIQ。
19、当一个测验有几个分测验时,如果整个测验只有一个总的信度估计,不能认为分测验的分数与合成分数一样可靠。
第四节测验的效度~效度的概念、效度的评估方法、效度的功能、效度的影响因素
第一单元效度的概念
1、效度:
测量与所要测量的心理特点之间的符合程度,或者说一个测验的准确性。
2、在一系列的测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得的变异数)的比率,即r²
XY=S²
V/S²
Xr²
XY=表示效度,S²
V表示有效方差,S²
X表示总方差
3、一组测验分数的总方差为真实方差与误差方差之和,真实方差又可分为有关方差和无关的但稳定的方差即系统误差带来的方差。
S²
T=+S²
V+S²
IS²
X=S²
I+S²
ES²
X为总方差、S²
V为有关方差~有效方差、S²
I为系统方差、S²
E为误差方差、S²
T为真实方差
4、测量的效度除受随机误差影响,还受系统误差的影响。
5、可信的测验未必有效,有效的测验必定可信。
6、信度是效度的必要而非充分条件,效度受信度的制约。
7、效度的性质:
相对性和连续性。
8、效度是相对于一定的测量目的而言的。
心理特质具有隐蔽性的特性,只能通过行为进行推测,因而测量只能达到某种程度的准确。
评鉴效度一定要考虑测验的目的和功能。
9、效度通常用相关系数表示,只是符合程度的差异,而非“全有”或“全无”。
此外,效度是针对测验结果而言的。
第二单元效度评估的方法*
1、效度分类:
内容效度、构想效度、效标效度。
2、内容效度:
测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量行为领域的代表性取样。
3、内容效度的评估方法*:
(1)专家判断法
(2)统计分析法
a.评分者评定结果的相关系数;
b.一组被试在独立取自同样内容范围的两个测验复本的相关系数;
c.学习前、后进行测量比较。
4、内容效度与表面效度的差异:
表面效度是指外行对测验作表面上的确定的,不反映测验实际测量的东西,而是表面上测验要测量的东西。
5、在编制测验时,表面效度是必须考虑的一个特性(最高行为测验要求表面效度高,典型行为测验却要求表面效度低)。
6、构想效度:
测验实际测到所要测量的理论结构和特质的程度,即测验结果是否能够证实或解释某一理论的假设、术语或构想,解释的程度如何。
7、构想效度解决三个问题:
测验测量的心理构想(提出假设)、对构想测得有多好(编制测验)、测验分数有多少来自构想(检验假设)。
8、构想效度的评估方法*:
①对测验本身的分析a.测验的内容效度;
b.测验的内部一致性程度;
c.被试对题目的反应特点。
②测验间的相互比较a.新测验与已有测验之间的相关系数;
b.区分效度,与无关测验的相关系数较低;
c.因素分析法,提取影响测验分数的共同因素。
③效标效度的研究证明a.采用效标将被试进行分组,若两组测验分数差异显著,则构想效度好;
b.根据心理特质的发展变化而定,这只有涉及发展变化特点的理论构想才能去检验
④实验法和观察法:
学习前、后分别进行测量
9、效标效度~实证效度:
反映测验预测个体在某种情境下行为表现的有效性程度。
其中,
10、效标:
被预测的行为是检验效度的标准。
11、根据效标资料是否与测验分数同时获得,分为同时效度和预测效度。
前者通常与心理特征的评估及诊断有关,后者常用于选拔、分组。
*
12、效标效度的评估方法*:
相关法、区分法、命中率法。
13、相关法是评估效标效度最常用的方法,是求测验分数与效标资料间的相关,这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 要点