心理测量学doc.docx
- 文档编号:4606552
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:54
- 大小:56.14KB
心理测量学doc.docx
《心理测量学doc.docx》由会员分享,可在线阅读,更多相关《心理测量学doc.docx(54页珍藏版)》请在冰豆网上搜索。
心理测量学doc
心理测量学王淑敏
目的:
1.了解心理测量的基本概念
2.掌握心理测验的形成过程,并能编制简单问卷
3.了解目前常用的心理测验,并知道如何使用
看一个量表(测验)需要了解
测量目的
适用年龄
测验内容
信、效度资料、常模
课程内容
一、心理测量学概述
二、测验编制中的项目分析难度、区分度概念及如何选择
三、信度
四、效度
五、测验分数转化和常模怎样解释一个测验分数
六、心理测验的编制和使用重点介绍如何选择一个合适的量表,如何正确解释测验
分数及如何表述自陈量表
七、人格测验回顾人格理论,常用2种人格测验
投射测验
自陈量表:
明尼苏达多项人格量表、艾森克人格问卷
投射测验:
TAT、墨迹图、自画像、屋树人投射测验
一对一测验
八、智力测验
团体智力测验
九、职业测验
主要参考书
1.张厚粲等心理和教育统计北京师范大学出版社
2.L.克罗克、J.阿尔吉纳经典与现代测验理论导论华东师范大学出版社
3.郑日昌等心理测量学人民教育出版社
4.金瑜心理测量华东师范大学出版社
5.陈国鹏心理测验与常用量表上海科学普及出版社
6.吴明隆spss统计应用实务中国铁道出版社
7.张厚粲等译心理测量与评估北京师范大学出版社
8.心理测验:
原理和应用上海社会科学院出版社(译本)
第一章心理测量概述
第一节测量概述
将人的特定属性变成特定数字,这是测量的关键点
一、界定
Stevens(1946):
测量是根据一定法则给客体或事物指派数字.
Lord、Novick及Torgerson(1968/1958):
测量指的是客体的属性而非客体本身.
★测量:
就是依据一定法则使用量具对客体的属性进行定量描述的过程.
★二、测量的要素
1.参照点
?
绝对参照点:
以绝对零点作为测量的起点,如长度测量
?
相对参照点:
以人为确定的零点为测量的起点.如考试成绩.只能表示差异的大小,不能表示倍数的关系
2.单位:
不同测量使用单位也不同
理想的测量单位必须符合两个条件:
①有确定的意义②要有相等的价值
三、测量的四种水平
量表:
能够使事物的特征数量化的数字连续体(有确定单位和测量参照点)
事物特征数字连续体数字特征
★Stevens分类:
精确度水平由低到高
★量表水平★特点要素使用统计方法
命名量表区分性无参照点和单位百分比、频数、众数、
χ2检验等
顺序量表区分性、等级性、顺序性无参照点和单位中位数、百分位数、
等级相关系数、
肯德尔和谐系数等
等距量表区分性、等级性、等距性相对零点和相等单位平均数、标准差、
积差相关系数、
以及T检验、F检验
比率量表区分性、等级性
等距性、比率性相等单位和绝对零点所用统计方法
心理测验属于顺序量表将顺序量表转化为等距量表(原始分数即实际分转化为标准分)
第二节心理测验和心理测量
一、心理测量
★1.定义:
通过观察人的少数有代表性的行为,对反映在人的行为活动中的心理特征,依确定的法则进行推论和量化分析的一种科学手段.
★2.特点:
①间接性
心理特质(征)→行为→行为样本←测量
↘个体所特有的、具有稳定性、可区别(辨别)性
②相对性顺序量表,没有参照点和单位
(1)只有相对参考点,没有绝对参考点
③客观性依赖于测验的四种标准化:
测验内容、情境、结果解释、评分标准
(测验内容无差标准化、测验情境对所有被试几乎一致、记评分标准一致、测量结果解释标准化)
3.心理测量的最基本假设——个体差异
个体差异意味着人的心理属性差异可区分、测量,在一段时间内相对稳定
一个量表仅能测量人的某方面心理特征
二、心理测验(理解)
1.界定
⑴权威心理学家的界定
⑵界定需包含要素
①行为样本(一个测验就是一个行为样本)
A.选择具有代表性的行为
B.每道题代表所要测量的心理特质的一个典型性行为
C.行为样本的代表性决定了一个测验水平的高低
②标准化样本在标准化环境下获得、保证测验客观性的最重要特征
③计分原则(易懂、界定清晰、理解时无歧义)
④其他要素:
信度、效度、难度、应答率
三、心理测验的功能
1.从实际应用角度看:
选拔人才、岗位安置、诊断、评价、辅助咨询
2.从理论研究角度看:
搜集资料、提出和验证假设、实验分组
3.测验是重要的心理学研究方法之一,是决策的辅助工具
四、心理测验的种类(了解)
⑴按测验的功能
能力测验①ability:
目前所具有的“所能为者”②aptitude:
可能获得的“可能为者”
学绩测验
人格测验
⑵按测验方式分:
个别测验
团体测验
⑶按测验材料分
文字测验处在所处文化中,脱离不了文化背景的影响
非文字测验
⑷按测验目的分
描述性测验(现在)
诊断性测验(临床)
预测性测验(未来)
⑸按测验的难度和时限分
速度测验
难度测验
⑹按测验要求分
最高行为测验
典型行为测验
⑺按测验应用分
教育测验
职业测验
临床诊断
第三节心理测量和测验的发展简史
一、中国心理测量发展史
(一)中国古代的心理测量思想和技术
1.理论方面
孔子:
“差异和分类”的思想性相近,习相远
孟子:
指出了心理现象进行测量的必要和可能
权,然后知轻重;度,然后知长短.物皆然,心为甚
刘劭:
《人物志》“观其感变、以审常度”
★2.实践方面
?
注意力分配测验:
“左手画方,右手画圆西方的注意力分配实验
?
婴儿发展测验:
“周岁试儿”或“抓周”
?
人事测评:
科举取仕制度言语、非言语操作、非操作测验
?
创造力测验:
七巧板和九连环七巧板需要个体有很强的发散性思维
刘再安《中国人用的非文字测验》迷津实验操作简单、实施方便
特点:
⑴多是描述性的
⑵分类式的、多是分成若干类型或层次
⑶注重对人做整体性的鉴定和评价,并倾向于和人的道德品质联系起来
⑷具有较强的应用倾向,多与教育中的因材施教、人才选拔和使用有着密切联系
(二)中国近代心理测量和测验的产生和发展(了解)
为当时教育改革提供了依据,对全国儿童心理发展进行了大规模调查
1.清末心理学由西方传入我国
2.1916年樊炳清对比奈——西蒙智力量表的引入和评述,首次正式系统介绍了西方测验
3.1920年建立心理学实验
4.1921年廖世承和陈鹤勤出版《智力测验法》一书(我国第一本心理测验书)
5.1922年比奈量表由费培杰译成中文
6.1923年进行了全国大规模教育调查
7.1924年,陆志伟先生发表了《订正比奈西蒙智力测验说明书》后与吴天敏再次做了修订
8.1931年中国测验学会成立
(三)心理测验在科学的春天中复苏
?
停止发展时期
?
重新蓬勃发展时期(1979年开始)1980年北师大开心理测量课
二.西方心理测量和测验的产生和发展
(一)现代心理测量的起源
1.社会需求
⑴工业发展需要
(比内量表:
区分智力低下儿童)
⑵精神病院需要社会上给予人性照顾明尼苏达多项人格测验
⑶职业指导需要帮助选择职业;在哪一领域发展潜力更大
2.个体差异的研究19世纪末心理物理学发展是最直接的推动因素
3.实验心理学的诞生
1879年,德国心理学家冯特在莱比锡大学建立了世界上第一个心理学实验室
(按照严格的步骤实验、分析结果等即标准化程序例子:
迷津实验3种不同的指导语需要严格控制条件)
(二)心理测量和测验的早期尝试者
★高尔顿英国生理心理学家优生遗传学创始人
①1869年出版《遗传的天才》
针对个别差异,人的能力是遗传而来的,人的能力是正态分布的、有差异的,而这种能力是可以测量的
②1884年设立了人类测量实验室(伦敦)
积累了有关简单心理现象的个别差异的大量系统资料
③1893年出版《人类才能及其发展研究》首次提出心理测量和测验术语
④发明了许多测量仪器
从事大量测量活动
⑤将统计方法应用于心理测验数据资料的分析
★卡特尔美国,师从于冯特,将实验心理学应用于测量学中
①在自己的实验室里编制测验50个
测量肌肉运动、反应时、记忆力等
②1890年发表《心理测验与测量》一文,描述了这些测验,并首创了“心理测验”这个术语.提到常模这个词,强调测量的标准化问题
★比奈心理测验的鼻祖
①1886年发表第一部著作《推理心理学》
②1889年与亨利?
博尼建立第一所法国心理学实验室
③1895年创办第一份法国心理学杂志《心理学年报》
④1898年比奈在哲学杂志上发表《人格心理学中的测量》一文
心理测量的基本原理:
将个人与他人进行比较某方面的特质有何差异
⑤1903年出版《智力的实验研究》
⑥1905年与助手西蒙发表《诊断异常儿童智力的新方法》一文,介绍了世界上第一个科学的智力测验——比奈-西蒙量表
总评:
著名美国心理学家波林指出,在测验领域中“19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头十年是比奈的10年”
(三)心理测量和测验的发展
1.智力测验标准化程度迅速提高
瑞文韦氏智力测验
2.普通智力测验发展到特殊智力测验
西沙尔(1915)音乐能力测验——最早的特殊能力测验
3.人格测验的产生和发展
1917沃德沃斯个人资料调查表、第一个自陈人格量表关于情绪适应
4.从个别测验向团体测验发展
“陆军甲种测验(文字测验)”和“陆军乙种测验(非文字测验)”为第一个团体智力测验
5.教育测验的产生:
鼻祖桑代克
小结:
西方心理测量发展历史
1.先是以解剖生理特征为根据,而后转向对心智活动的测量
2.由测量最简单的感知能力,发展到测量复杂的认知能力
3.由笼统的单一量数以评定个别间差异的观念,转变为以多个量表数兼顾个别差异与个别内差异的观念
4.心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了.
第二章项目分析
补充:
测量与统计:
变异、相关、预测、因素分析
⑴变异:
x平均数团体平均水平,但不能反映出个体与个体之间的差异
(x-x)离差,个体水平与平均水平的差异
∑(x-x)2/N方差:
个体水平与平均水平的差异程度→标准差→Z分数
大方差说明团体在这个测验的分差异比较大
标准差:
在测量上作为一个单位使用,获得Z分数
(被试在总体中的相对位置可以转化为百分数)
⑵相关两种心理特质之间的相关程度
⑶预测:
回归分析选拔人才
⑷因素分析:
解释相关
引言
(一)★项目分析就是对组成测验的每个测题进行分析
质的分析指的是内容效度分析,分析项目的内容和形式
量的分析则采用统计方法来分析项目的质量
(二)测验项目的关键特征
检验项目需回答的问题:
它所测量的属性与其他项目测量的属性是否一致.
难度测量:
有多少人能正确回答这个项目
鉴别力测量:
测验中被试对这个项目的反应和另一个项目的反应相关吗?
迷惑项测量:
每个选项上有多少人选择?
重点:
1.测验项目难度的意义及其计算方法
2.测验项目的区分度
3.难度和区分度的关系
第一节难度分析
定义:
测验项目的难易程度.
★一、估计项目难度的方法
(一)二值计分项目
1.通过率
P=R/NP:
项目的难度;R:
答对该题的人数;N:
总人数(注意:
P值越大,难度越小)
2.极端分组法
⑴将被试依照测验总分从低到高排列,分成二组,总分高端取27%被试——高分组,总分低端取27%被试——低分组
⑵分别计算高分组和低分组的通过率
⑶求项目难度计算公式
P=(PH+PL)/2=?
(RH/NH+RL/NL)
注意:
⑴当被试人数较少时,则需采用全部被试数据
⑵当被试人数较多时,若数据相对集中,则约取33%;若数据相对较分散,则约取25%,即根据情况在25%——33%范围内波动.
(二)非二值计分项目
计算难度公式:
P=x/xmax
x:
全体考生在该题上平均分xmax:
该题的满分
项目难度受机遇影响的矫正(对考生由于猜测而答对)
CP=(KP-1)/(K-1)
CP:
矫正后的难度P:
矫正前的难度K:
项目的个数(K代表“K择一”)
CP=0.50时,项目的区分度最大,将其代入上述公式得P=(K+1)/2K
★二、测验难度水平的确定
测验目的和性质1.测验为了考察被试的差异,则P应接近0.5.
2.测验是出于选拔目的,则P应控制在接近选拔率左右
项目形式若选择P<猜测率,则难度大,则猜测的成分更大,则测不出真实水平
三、项目难度的转换
(一)难度转换的理由
①难度量表是百分量表,而百分量表是等级量表
②难度量表是反序而行,P越大,项目越容易
(二)转换方法
①最基本方法:
Z分数法(存在负值)
②Δ法:
Δ=13+4Z(Δ:
项目难度;Z:
由P值转化来的标准分数)
第二节项目的鉴别力(区分度)
★一、项目鉴别力的意义
?
定义:
测验项目对于某种心理特质不同水平的被试反应差异的区分程度.
?
评价测验项目区分度高低依赖于对被试水平的准确测量,通常称作为效标分数
(测验项目区分度的效标分数更多的是用测验总分,称作为内部效标)
?
项目鉴别力(D)的取值范围介于-1.00至+1.00之间.通常D为正值称为积极区分,为负值称为消极区分,D为0称为无区分作用.D>0时,D越大,项目的鉴别力越好
★二、项目鉴别力的估计方法
1.项目鉴别指数法:
较适合于二值计分项目
当效标分数是连续变量时,可将分数从高到低排列,取两端27%被试,分别最为高分组低分组
D=PH-PL式中PH与PL分别为高分组、低分组在该项目上的通过率.
★2.相关系数指标:
项目与总分相关测验项目与总分区分度很高,说明二者测量性质时一样的
相关法:
区分度<0.2,不能保留
0.2<区分度<0.3,做修改
区分度>0.4保留,优秀
★三、难度与区分度的关系
难度越接近0.50,项目潜在的区分度越大,而难度D越接近1.00或0时,项目的潜在区分度越小.
项目通过率D的最大值
1.000.00
0.900.20
0.700.60
0.600.80
0.501.00
0.400.80
0.300.60
0.100.20
0.000.00
四、鉴别力的相对性
1.不同的计算方法,所得区分值不同
注意:
在分析同一个测验时,各个项目的区分度值要采用同一种指标,否则不便分析比较
2.样本容量大小影响相关法区分度值的大小
3.被试样本的同质性程度影响区分度值的大小(必须保证被试之间是有差异的(随机抽取),男女性别数目上也要有差异)
4.分组标准影响鉴别指数值(D)
第三节项目分析的实例
课本P91
第三章信度
重点:
1.掌握真分数模型及其假设
2.评估信度方法
3.影响信度的因素
4.提高信度的方法
第一节经典真分数模型和信度
★一测量误差
★
(一)测量误差:
在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的效应.
★
(二)测量误差的种类
(1)系统误差:
这是由那些与测量目的无关的因素引起的一种恒定而有规律的变化.稳定地存在于每一次测量中,具有跨情境的一致性.
★系统误差只与效度有关.
(2)★随机误差:
是由那些与测量目的无关的偶然因素引起而又不易控制的误差,它使多次测量产生了不一致的变化.
★随机误差同时影响信度与效度.
★(三)测量误差的来源:
(1)测验工具
(2)被试本身:
测验动机测验焦虑学习、发展与教育测验经验练习效应反应定势生理因素
(3)施测过程:
测试环境、主试者方面、意外干扰、评分
二经典真分数模型
(一)真分数的定义
真分数(T分数):
反映被试某种心理特质真实水平的那个数值
观察值(X分数):
实际测量到的数值
真分数的操作定义:
经过无数次测量所得的平均值
★
(二)数学模型及其假设
1.CTT基本思想:
把任何一个测验成绩看成是真分数和测量误差之和.
公式:
X=T+E(X:
实得分数或观察值T:
假设的真分数E:
随机误差,不包含系统误差)
★2.3个相关联的假设公理(书P42—43)
(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数.即
ε(X)=T或ε(E)=0
(2)真分数和误差分数之间的相关为零.即
ρ(T,E)=0
(3)各平行测验上误差分数之间相关为零.即
ρ(E1,E2)=0
注意:
如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布(x和S)都是一致的,则这两个测验被称作是彼此平行的测验.平均数与标准差越接近,说明两个平行测验的可替换性越高
3.信度和真分数模型
X=T+E(∑E=0)T=X
对一个团体来说,实得分数,真分数和测量误差之间有如下关系:
()
(SX)2=(ST)2+(SE)2
注意:
真变异数由两个部分构成:
与测量目的有关的变异((Sv)2)和与测量目的无关的变异(St)2
(SX)2=(SI)2+(SE)2+(SV)2
信度rxx=(st)2/(sx)2
效度rxy=(sv)2/(sx)2
第二节信度的估算方法
★一、信度的定义(理解)
(一)理论性定义:
稳定性/一致性/可靠性
(二)★操作性定义:
P46
★需注意的问题
信度是指一组测验分数或一列测量的特征,而不是个人分数的特征.
真分数的变异数是不可直接测量的,因而信度是一个理论上理想的概念,只能根据一组实得分数作出估计.
二、信度系数
(一)信度系数和信度指数
信度系数:
用同一被试样本所得的两组资料的相关.
即rxx=(st)2/(sx)2或rxx=Pxx’
信度指数:
实得分数与真分数的相关,即PTx=ST/Sx
信度指数的平方就是信度系数.
★实测分数的变异数中,有多少比例是由真分数的变异可以解释的.(信度系数)
r=0.9,实际测量中有90%可以由真分数来解释,有10%可以由测量误差来解释
r=1实际测量中100%都可以由真分数来解释,不存在测量误差
r=0时,测量结果完全不可靠,全都是由于测量误差引起的
(二)理解信度系数时需注意
1.一个测验可能不止一个信度系数.
2.信度系数只能是对测量分数不一致程度的估计,并没有指出不一致的原因.
3.获得很高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是为了获得高效度的一个必要条件.
(三)信度系数达到多高才可以接受呢?
当rxx<0.7时,测验不能用于对个人作出评价或预测,而且不能做团体间比较.
当rxx≥0.7时,可用于团体比较
当rxx≥0.85时,才可以用来鉴别或预测个人成绩或作用.
★三、信度的估计方法(定义、前提条件,注意问题等)
注意:
这一大部分大家都需要认真复习,主要是从定义、前提条件、误差来源、注意问题等方面复习!
画的部分为重点之重点
rxx=(St)2/(Sx)2或rxx=Pxx’
(一)估计信度的目标:
决定测验分数的变异有多少是测量误差引起的,有多少是由真分数引起的.
(二)关于估计测验信度的方法:
1.第一种观点:
运用尽可能平行的测验进行测量
2.第二种观点:
由测验分数的预期作用来决定(允许一种误差存在)
(三)估计方法
实施两次测验的方法
★1.交替测验法:
复本信度(等值性系数)
定义:
两个复本施测同一被试群体,求其相关.
前提:
建构出两份真正的平行测验,即两个等值测验
测量误差:
测验内容取样误差
数据收集方法:
用两个平行测验给同一组被试分别施测.
平行测验A——最短时间——平行测验B
★计算方法:
积差相关法(相关系数越高,越说明两个平行测验的可替换性高)
注意事项:
报告平行测验等值的证据:
报告每个平行测验的平均数、标准差和测量的标准误
若等值性系数作为信度估计值的话,这些值必须非常接近.
★2.重测法:
重测信度(稳定性系数)
定义:
同一量表,同一被试群体,在不同时间,两次施测,求其相关
实质:
表示测验结果的稳定性,故又称稳定性系数
测量误差:
时间取样误差,被试个人心理和生理状态的临时变化.
前提:
所测量的心理特质必须是稳定的;
遗忘和练习的效果基本上是相互抵消;
在两次施测的间隔时间内,被试所要测量的心理特质方面没有获得更多的学习和训练.
数据收集方法:
对同一组被试施测——间隔一段恰当时间——再施测
注意事项
①重测信度估计值的最小可接受值
重测信度估计大小的关键影响因素:
两次测量之间的间隔时间,被试的年龄以及所测特质本身的性质.
②两次测试之间应该间隔多长时间
a.如果选取不同的时间间隔,会产生不同重测信度.
b.报告重测信度应该说明间隔时间
(1)间隔时间越长,稳定性系数越低,适宜时间间隔依照测验目的、性质及被试特点而定,几分钟至几年.
(2)年幼儿童,间隔要小;年长群体,间隔可大;智力测验间隔时间不能太短,成就测验的间隔不能太长.
3交替测验重测法(等值稳定性系数)
测量误差:
同时来自于内容取样、时间取样和随机误差等.
★数据收集方法:
两次施测间隔适当时间
方法一:
A——B(必须有实验间隔)
方法二:
被试1组:
A——B;被试2组:
B——A(两套测验获得的数据为等值性系数)
计算方法:
积差相关系数
单次施测的方法:
内部一致性:
测验各项目之间的一致性.即同质性:
所有的测验项目是否集中反映同一心理特质.检验某一心理学理论的测验一般信度要求高
1分半法:
分半信度
定义:
在实验没有复本且只能实施一次的情况下,将测验项目分成待对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度.
误差来源:
测验分半而带来的内容取样误差.
分半方法:
不同的分半法可能会得到不同的信度值.
①奇偶分半法:
奇数项目分成测验1,偶数项目分成测验2
②难度分半法:
按难度水平排序,然后把序号为奇项目——测验1.,序号为偶项目——测验2
③随计分半法,内容匹配法
由于分半信度实际上只是半个测验的信度,测验越长,项目越多,两半分数的相关就越高.因此,对长度不同的测验,要用校正公式
修正公式:
Spearman-Brown修正公式rxx'=2Phh/(1+Phh)课本P50
注意:
该公式的使用要建立在半分测验严格平行的假设之上
Flanagan公式:
rxx=2[1—((Sa)2+(Sb)2)/(Sx)2]
Rulon公式:
rxx=1—(Sd)2/(Sx)2
注意:
分半信度反应的实际上是两半测验能够测量相同内容或心理特点的程度
2同质性信度
同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强.一般要求各个因素之间是中等相关.
当同质性信度不高时,有两种处理方法:
①中等程度相关,则按分量表的形成②相关程度极低时,测验编制有问题
因素分析思路
(1)α系数:
计算公式:
α=[K/(K—1)][1—(∑(Si)2)/(Sx)2]
K:
测验项目数(Sx)2:
测验总分的变异(Si)2:
所有被试在第i题上分数变异
适用条件:
二分法记分或记分权重范围较广的项目的内部一致性信度的估计
注意:
α值是测量信度下界的一个估计值,即α值大,必有高测量信度;但α值小,却不能断定测量信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 doc