心理测量学知识点总结Word格式文档下载.docx
- 文档编号:16611346
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:19
- 大小:67.16KB
心理测量学知识点总结Word格式文档下载.docx
《心理测量学知识点总结Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《心理测量学知识点总结Word格式文档下载.docx(19页珍藏版)》请在冰豆网上搜索。
①心理测验是重要的心理学研究方法之一,是决策的辅助工具。
②心理测验作为研究方法和测量工具尚不完善。
10.我国目前心理门诊中较多的运用:
智力测验、人格测验以及心理评定量表。
1.首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿,他的贡献主要有:
①提出人的不同气质特点和智能是按身体特点不同遗传的;
②设计了测量差异的方法,可以视为心理测验的开端。
③为心理测量学奠定了统计学基础。
④第一个提出了相关的概念,并由他的学生皮尔逊加以发展,创立了积差相关法。
2.卡特尔对促进心理测验发展得贡献有:
①1890年,发表了《心理测验与测量》一文,这是心理测验第一次出现于心理学文献中。
②主张测验手续和考试方法应有统一规定,并要有常模以便比较。
3.比内—西蒙在1905年发表了世界上第一个正式的心理测验。
4.20世纪以后心理测验主要的发展方面:
①操作测验的发展;
②团体智力测验的发展;
③能力倾向测验的发展;
④人格测验的发展。
5.近年来我国的心理学家致力于测验的本土化,编制适合我们文化背景的智力测验、适应行为量表等,并已取得了初步成果。
6.常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
7.常模总体的选择包括:
①确定一般总体;
②确定目标总体;
③确定样本。
8.常模团体的条件:
①群体的构成必须明确界定;
②常模团体必须是所测群体的代表性样本;
③标准化样本是一定时空的产物;
④样本大小要适当
(1)在实际工作中,应从经济、实用和减少误差等方面来考试样本的大小。
在其他条件相同的情况下,样本越大越好;
样本大小适当的关键是样本要有代表性。
(2)总体数目小,只有几十个人,需要100%样本。
总体数目大,相应的样本也大,一般最低不少于30或100个。
全国常模一般有2000~3000人。
1.取样:
从目标人群中选择有代表性的样本。
方法有:
简单随即抽样;
系统抽样;
分组抽样;
分层抽样。
2.系统抽样要求目标总体无序可排,可无等级结构存在。
其关键是计算组距(K)
3.分组抽样用于总体数目较大,无法进行编号,而且群体又有多样性。
4.分层抽样时确定常模时最常用的方法。
5.常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来就是导出分数,所以常模分数又叫导出分数。
导出分数的特点是:
①与原始分等值;
②具有意义;
③等单位;
④具有参照点。
6.常模分数所构成的分布,就是通常所说的常模,它是解释心理测量分数的基础。
7.发展常模:
也叫年龄量表,是根据平均表现所制成的量表。
在这个量表中,个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。
最直观的发展常模是发展顺序量表。
8.发展顺序量表最早的一个范例是葛塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。
婴儿的感觉运动发展是:
4周:
能控制眼睛运动,去追随一个对象看。
16周:
能使头保持平衡。
28周:
能用手抓握东西并玩弄它。
40周:
能控制躯干、坐立或爬行
52周:
能控制腿脚运动、站立和行走。
1.皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对守恒的概念的研究。
2.守恒是指两种等量的物体只要无增无减,无论怎样改变组合,它们在质量、重量、长度、数量及容量等方面仍然是相等的一种认知。
3.皮亚杰发现,儿童不同时期出现不同守恒概念,通常儿童到5岁时才会理解质量守恒;
6岁才会掌握重量守恒;
7岁才能有容量守恒的概念。
4.一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。
这种分数叫做智力年龄,简称智龄。
比内—西蒙量表中首先使用智力年龄的概念。
5.智龄的算法:
①先算出基础年龄,即全部题目都通过的那组题目所代表的年龄。
②然后再所有个更高年龄水平上通过的题目,用月份计算,加在年龄上,儿童的智龄是基础年龄与较高年龄水平的题目上获得的附加月份之和。
例如某个儿童6岁的题目全部通过,7岁组通过4题,8岁通过3题,9岁组通过2题,其智龄为:
6(岁)+4×
2(月)+3×
2(月)+2×
2(月)=6岁+18月=7岁6个月。
6.年级当量实际就是年龄量表,例如常模中6年级的算术平均分为35,某儿童在算术测验中也得35分,那么就有“该儿童的算术水平是6年级水平”的表述。
7.百分等级是指在常模样本中低于这个分数的人数百分比。
8.未分组资料的百分等级计算公式:
,其中R是原始分数排列顺序数,N是指总人数(样本总人数)。
例如小东在30名同学中语文成绩是80分,排列第五名,则其百分等级为:
9.在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。
10.高考的最高分时695,其中百分等级为100,最低分为103,百分等级是1,要求录取20%的学生进入大学,百分等级为80的百分位数(PP)可以用以下公式计算:
,得PP=575.40≈575分
★将103到695分成100份,其中第80分对应的分数。
1.四分位数是将量表分成四等份,相当于百分等级25%、50%和75%对应的三个百分点分成的四段。
十分位数也可以此类推。
2.标准分数常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。
因为他的基本单位是标准差,所以叫标准分数。
常见的标准分数有“z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。
标准分数可以通过线性转换和非线性装换得到。
3.
其中X为任一原始分数,X为样本平均数,SD为样本标准差。
由此可见,
z分数可以用来表示某一分数与平均数之差是标准差的基本。
4.
式中Z为转换后的标准分数,A、B为根据需要制定的常数。
加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。
5.当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。
6.常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。
平均数
标准差
T分数
50
10
标准九分
5
2
标准十分
5.5
1.5
标准二十分
3
离差智商
100
15或16
1.单纯用心理年龄来表示智力高低分方法缺乏不同年龄儿童间的可比性,因此,目前一般都用比率智商和离差智商来表示智力的高低。
2.比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。
为避免小说,将商
数乘以100:
公式是:
3.由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄发展不同步增长,所以比率智商并不适合于年龄大的被试。
4.离差智商的优点有:
①离差智商是建立在统计学基础之上的。
②表示的是个体智力在年龄组所处的位置。
③表示智力高低的一种理想的指标
5.计算离差智商的公式是:
6.不同的测验获得的离差智商只有当标准差同时或接近时才可以比较。
7.转换表,也叫常模表。
是一种最简单、最基本的且常用的呈现常模资料的方式。
它构成的要素为原始分数、导出分数和对常模团体的有关具体描述。
测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的解释。
8.剖面图是将测验分数的转换关系用图形表示出来。
从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。
9.对某些特殊的群体来说,情况很具体而特殊,我们就需要制定特殊常模。
标准分数与百分等级、T分数等的关系
标准分数
﹣2σ
﹣σ
μ
﹢σ
﹢2σ
百分等级
16
84
98
30
40
60
70
标准二十
4
7
13
85
115
130
1.信度是指同一被试者在不同时间内同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随即误差的影响。
2.在测量理论中,信度被定义为:
一组测量分数的真分数方差与总方差(实得分数的方差)
的比率:
3.公式
和公式
表明信度指数的平方就是信度系数。
公式中SE为测量的标准误,SX所得分数的标准差,rxx为测验的信度系数。
从公式中可以看出,测量的标准误与信度之间的关系是:
信度越低,标准误越大;
信度越高,标准误越小。
5.信度的评估方法有:
重测信度、复本信度、内部一致性信度和评分者信度。
6.重测信度:
又称稳定性系数,它的计算方法是采用重测法,即使用同一测验,在同样条件下同一组被试者前后施测两次测验,求两次得分间的相关系数。
7.用重测法估计信度,最适宜的时距随测验的目的、性质和被试者的特点而异,一般是2~4周较宜,间隔时间最好不要超过6个月。
8.复本信度:
又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求的被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。
9.复本信度的优点是:
能够避免重测信度的一些问题,如记忆效果、学习效应等。
10.复本信度的局限性:
①复本信度只能减少练习的影响,而不能消除。
②由于第二个测验只改变题目的内容,已经掌握的解题原则,很容易就迁移到同类问题。
③建立复本对很多测验来说十分困难。
11.如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则称重测复本信度,或稳定与等值系数。
1.内部一致性信度主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。
主要包括分半信度和同质性信度。
2.分办法通常是测验实施后将测验按奇、偶分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半的相关系数。
这个相关系数就代表了两半测验内容取样的一致程度。
3.分半法经常会低估信度,必须修正。
一般用斯皮尔曼—布朗公式:
其中rhh为一半分数的相关系数,rxx为测验在原长度的信度估计值。
4.同质性信度主要代表测验内部所有题目的一致性。
5.计算同质性信度的公式有:
①库德—理查逊公式。
在测验是二级评分(是非题、0~1计分)的情况下,常用K—R20公式,在难度相同或相近的情况下,还可以用K—R21公式。
②和伦巴赫α系数。
适合多重计分的测题。
6.为了衡量评分者之间信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分分别给分,然后再根据每份测验卷的两个分数计算相关,既得评分者信度。
一般要求在成对受过训练的评分者之间平均一致性达到0.90以上,才认为评分时客观的。
7.不同的信度反映测验误差的不同来源。
1.信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异种真分数造成的变异占百分之几。
2.一般能力测验和成就测验的信度系数都在0.90以上,有的可以达0.95;
而人格测验、兴趣、态度、价值观等测验的信度一般在0.80~0.85或更高些。
3.要确定信度可接受水平的一般原则是:
①当rxx<0.70时,测验不能用于对个人作出评价或预测,而且不能做团体比较;
②当0.70≤rxx<0.85时,可用于团体比较;
③当rxx≥0.85时,才能用来界别和预测个人成绩或作为。
4.新编的测验信度应高于原有的同类测验或相似测验。
5.信度系数在解释个人分数的意义时的作用:
①是估计真实分数的范围;
②了解实得分数再测时可能的变化情形。
6.某个被试的IQ为100,该智力测验的标准差为15,信度系数为0.84,则其IQ的测量标准误和可能范围分别为:
IQ=100±
1.96×
6=100±
11.76≈88~112
我们说这个被试的真实IQ有95%的可能落在88到112之间。
7.若两个测验差异显著,那么两个测验的差异分数要比差异标准误(SEd)乘以1.96大。
其中,SEd为差异的标准误,S代表两个测验使用的标准差,这两个标准差必须相同。
8.影响信度的因素:
①样本特征。
(1)异质性(一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信
度,相反则会低估测验的信度);
(2)平均能力水平(不同那水平的团体,题目具有不同的难度,每个题目在难度上微
小差异累计起来便会影响信度)
②测验长度。
(1)测验越长,测验的测题取样或内容取样就越有代表性。
(2)测验越长,被试的猜测因素影响就越小。
增加测验长度的效果应遵循报酬递减率原则,测验过长是得不尝试的,有时反而会引起被试的疲劳和反感而降低可靠性。
③测验难度。
(1)理论上,只有平均难度为50%时,才能使测验分数分布范围最大,求得的信度也最高。
事实上,难度为0.50只适合于简答型题目。
(2)各类型选择题的理想平均难度为:
五选一测题,0.70;
四选一测题,0.74;
三选一测题,0.77;
是非题,0.85。
④时间间隔。
(1)时间间隔只对重测信度和重测复本信度有影响。
(2)以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;
间隔时间越久,其他变因介入的可能性越大,受外界影响也越大,信度系数便会低。
9.增加题目的数量与测验的信度之间的关系公式:
,其中K为改变后的长度与原来长度的比,rxx为原测验的信度,rkk为测验长度是原来K倍时的信度估计。
1.效度是指所测量的与所要测量的心理特点的符合程度,或者简单地说是指一个心理测验的准确度。
2.在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方
差)与总方差的比率,即:
3.效度的性质:
①效度具有相对性,在评鉴测验的效度时,必须考虑其目的与功能。
②效度具有连续性。
4.信度和效度的关系:
①信度高是效度高的必要条件,也就是说可信的测验未必有效,有
效的测验必然可信。
即信度高,效度未必高;
效度高,信度一定高。
②一个测验的效度总是受它的信度制约的。
5.美国心理学会在1974年发行的《教育与心理测量之标准中》一书将效度分为:
内容效度、构想效度和校标效度。
6.内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
1.内容效度的评估方法有:
专家判断法、统计分析法和经验推测法。
2.专家判断法:
请有关专业对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定内容。
如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。
由于这种估计效度的方法,是一个逻辑分析的过程,所以内容效度有时又称“逻辑效度”。
3.为了使内容效度的确定过程更为客观,弥补不同专家对同一测验判断的可能不一致,可采用的步骤是:
①定义好测验内容的总体范围;
②编制双向细目表;
③制定评定量表来测量测验的整体效度。
4.统计分析法包括:
①计算两个评分者一致性;
②复本相关;
③再测法。
5.最高行为测验要求有较高的表面效度;
典型行为测验却要求较低的表面效度。
6.构想效度:
又叫构思效度或结构效度。
主要涉及的是心理学的理论概念问题,是指测验能够测量到理论上的构想或特质的程度,即测验的结构是否证实或解释某一理论的假设、术语或构想,解释的程度如何。
7.构想效度的评估方法有:
①对测验本身的分析;
②测验间的相互比较;
③较标效度的研究证明;
④实验法和观察法证实。
8.对测验本身的分析主要有:
①测验的内容效度可以作为构思效度的证据;
②测验的内部不一致性可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;
③分析被试者对题目的反应特点也可以作为构思效度的证据。
9.测验间的相互比较:
①相容效度:
是构思效度的一个证据,是指需判断内容效度的测验与某个和该测验测量同一种心理特质,且已有测验效度的成熟测验的相关系数。
②区分效度:
是构思效度的一个证据,是指需要判断内容效度的测验与某个和该测验测量不同心理特质,且已有测验效度的成熟测验的相关系数。
相关系数越高,区分效度越低。
若区分效度较低,则证明新测验的效度确实有问题。
但若区分效度较高,却不能说明新测验效度较高。
③因素分析法。
1.较标效度:
又称实证效度,反应的是测验预测个体在某种情景下行为表现的有效性程度。
被预测的行为是检验标准的标准,简称较标。
2.在检验一个测验的较标效度时,难点在于确定合适的效标。
因此较标的选择至关重要,一个好的校标必须具备:
①效标必须能最有效地反映测验的目标,即效标测量本身必须有效。
②效标必须具有较高的信度,稳定可靠,不随时间等因素而变化。
③效标可以客观地加以测量,可用数据或等级来表示。
④效标测量的方法简单,省时省力,经济适用。
3.效标效度的评估方法有:
①相关法;
②区分法;
③命中率法。
4.相关法:
是求测验分数与效标资料间的相关,这一相关系数成为效度系数。
常用的方法有:
①积差相关法;
②点二列相关公式;
③二列相关公式;
④贾思朋多系列相关公式。
5.区分法:
是检验测验分数能否有效地区分由效标所定义的团体的一种方法。
6.命中率法:
是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。
命中的情况是指:
①预测成功而且实际也成功;
②预测失败而且实际也失败
7.效度的功能有:
①预测误差;
②预测效度分数;
③预测效度指数。
8.效度系数的实际意义常常以决定性系数来表示,就是相关系数的平方,它表示测验正确预测或解释的效标的方差的总方差比例。
例如测验的效度是0.8,则测验的总方差中有64%的方差是测验分数的方差,即测验分数正确预测的比例64%,其余36%无法做出正确的预测。
1.估计的标准误计算公式为:
,其中,
代表效度系数的平方,即决定系数,Sy为效标成绩的标准差。
2.最常用的Y对X的回归方程:
,其中
是预测的效标分数;
a是纵轴的截距,用来纠正平均数的差异;
byx是斜率,亦即Y向X回归的系数;
X为测验分数。
3.E值大小表明使用测验比盲目猜测能减少多少误差。
例如一个测验的效度系数为0.80,那么
,E=100(1-0.60)=40,这表明预测误差仅为随机猜测所产生误差的60%。
换句话说,由于该测验的使用,使得我们在估计被试的效标分数时减少了40%的误差。
4.影响效度的因素:
①测验本身的因素;
②测验实施中的干扰因素;
③样本团体的性质;
④效标的性质。
5.要保证测验具有较高的效度,测验本身要做到:
①测验材料必须对整个内容具有代表性;
②测题设计时应尽量避免容易引起误差的题型(如是非题);
③测题难度要适中,具有较高的区分度;
④测验长度要恰当,既要有一定的测题量;
⑤测题的排列按先易后难排序。
6.测验实施中的干扰因素
①主试的影响因素:
(1)主试本身是否严格的按照测验对主试的要求进行测验的
(2)对于效标效度,测验与效标实施时间间隔越长,测验与效标越容易受到很多机遇因素的影响,因那次所求的相关必然很低。
(3)测验情景(场地的布置、材料准备等等)也会影响测验的效度。
②被试的影响因素:
被试的兴趣、动机、情绪、态度和身心状况、健康状态以及是否充
分合作与尽力而为等都会影响测验结果的效度。
反应定式也会降低测
验的效度。
7.样本团体的性质包括:
①样本团体的异质性,如果其他条件相同,样本团体越同质,测验效度就会越低;
样本团体越异质,测验效度越高。
②干涉变量:
是使得测验对于不同的团体具有不同的预测能力的特征,这些特征包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的性质。
美国心理学家吉赛利提出了如何找出干涉变量的一套方法,他们是:
(1)获得差异分数D,如果D的绝对值很大,说明测验中可能存在干涉变量。
(2)找出对照组,分别计算效度,找出干涉变量。
(3)对于预测团体,根据某些易见的干涉因素分为预测性高和预测性低的两个亚团体。
预测性高的团体,获得的测验效度会有所提高。
8.效标性质的影响主要体现在:
①效标本身的可靠性即效标测量的信度;
②效标与测验分数之间的关系是否是线性的,皮尔逊积差相关系数的前提就是两个变量的关系式现行的。
1.测验的项目分析包括定性和定量两个方面的。
定性分析包括考虑内容效度,题目编写的恰当性和有效性等;
定量分析主要是指对题目难度和区分度等进行分析。
2.难度:
是指项目的难易程度。
它一般用通过率来表示,即答对或通过该题的人数百分比
来表示:
,其中P代表项目的难度,N为全体被试者人数,R为答对或通过该项目的人数。
3.通过人数越多(P值越大),难度越低;
P值越小,难度越高。
4.二分法积分的项目计算通过率,若人数较少可以直接采用上边的公式计算。
若人数较多时。
则可根据测验总成绩将被试分成三组:
分数最高的27%被试为高分组,分数最低27%为低分组,中间46%的被试为中间组。
分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。
其公式为:
,其中P代表难度,PH和PL分别代表高分组和低分组通过率。
5.由于选择题可以猜测,所以通过率可能因机遇作用变大。
为了平衡机遇对难度的影响,吉尔福特提出了一个校正公式:
,其中CP为校正后的通过率,P为实际得到的通过率,K为备选答案的数目。
6.非二分变量的项目计算通过率,一般用:
其中X为全体被试在该题上的平均分,Xmax为该题的满分。
7.P值越接近于0或接近1,越无法区分被试间能力的差异。
相反P值越接近0.50,区别力越高。
8.在实际选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50±
0.20之间。
9.对于是非题而言,其难度值应该为0.75最为合适;
而对于四选一的题目,其难度值约为0.63时最为合适。
10.分数的分布时正偏态分布时,题目较难;
为负偏态分布时,题目较易。
1.项目区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 知识点 总结