心理测量学重点Word格式文档下载.docx
- 文档编号:14719752
- 上传时间:2022-10-24
- 格式:DOCX
- 页数:13
- 大小:29.47KB
心理测量学重点Word格式文档下载.docx
《心理测量学重点Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《心理测量学重点Word格式文档下载.docx(13页珍藏版)》请在冰豆网上搜索。
作业补充题:
1、为什么说心理与教育测验的分数本质上是顺序量表上的分数?
答:
从本质上讲,心理与教育测量的量表属于顺序量表。
(1)从使用的参照点来说,教育测量和心理测量领域的参照点均为相对零点;
(2)从使用的单位来说,教育与心理测量的单位远没有其他测量的单位成熟完善。
第二章简史
一、现代心理与教育测量的起源:
(1)1879年德国心理学家冯特在莱比锡大学建立了世界上第一个
心理实验室。
(2)高尔顿把统计方法应用到对个别差异资料的分析之中。
学生皮尔逊创立了积差相关公式。
(3)卡特尔1890年卡特尔在《心理》杂志上发表《心理测验与测量》一文。
首提“心理测验”。
(3)比内和西蒙在1905年合作完成世界上第一个智力测验量表一一比内-西蒙量表。
第三章经典测验理论的基本假设
一、心理特质:
表现在一个人身上所特有的相对稳定的行为方式。
心理特质的可测性假设:
1、具有比较稳定的特点;
2、可量化;
3测验中的行为可预测测验外的
行为;
4、优缺点共存;
5、误差存在于测验过程中;
6、测量能以公平和无偏见的方式进行;
7、测量
有其社会价值。
测量的步骤:
对所测量的特质进行界定;
编制测量项目;
制定评分标准和解释体系。
二、测量误差:
指在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测
量效应。
测量误差的种类:
1、随机误差:
由与测量目的无关的偶然因素引起的而又不易控制的误差。
(影响测验的不准确、不一致)2、系统误差:
由与测量目的无关的变因引起的一种恒定而有规律的效应。
(影响测验的不准确)
测量误差的来源:
测量工具;
测量对象;
施测过程。
三、真分数:
反映被试某种心理特质真正水平的那个数值称作该特质的真分数(T分数)。
把实测的分数称作该特质的观察分数。
其中,观察分数越接近真分数,说明这次测量的误差越小。
CTT的数学模型X=T+E(X为观察分数,E为随机误差)T=V+I(V为目标真分数,I为非目标
真分数)所以X=V+I+E
根据CTT推导出被试观察分数的方差等于其真分数方差与误差分数方差之和。
(书P47)
平行测验:
如果两个题目不同的测验测得的是同一特质,并且题目形式、数量、难度、区分度以及测验得分的分布都是一致的。
则这两个测验被称为彼此平行的测验。
第四章测量信度
一、信度:
指测量结果的一致性或稳定性(只受随机误差影响)
(书P50)定义:
1、信度是一个被测团体的真分数的变异数与实得分数的变异数之比。
、信度是一个被试团体的真分数与实得分数的相关系数的平方。
3信度是一个测验x(A卷)与它的任意一个“平行测验”X’(B卷)的相关系数。
二、信度的作用
1、信度是测量过程中所存在的随机误差大小的反映
2、信度可以用来解释个人测验分数的意义
3信度可以帮助进行不同测验分数的比较
三、重测信度:
指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积查相关系数。
适用于两个变量都是连续数据,总体呈正态分布,之间为线性关系时。
使用的前提条件:
1、所测量的心理特性必须是稳定的;
2、遗忘和练习的效果基本上相互抵消;
3、在两次施测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。
复本信度:
指两个平行的测验测量同一批被试所得结果的一致性程度。
(建立复本有难度)
1、要构造出两份或两份以上真正平行的测验;
2、被试要有条件接受两个测验;
3、
测量的是同一种心理特性。
分半信度:
指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
使用前提条件:
在只能施测一次或没有复本的情况下使用。
可按题号的奇偶、难度、内容分半。
斯皮尔曼-布朗公式只有在两半测验分数的变异数相等时才能使用。
当一个测验无法分成对等的两半时,分半信度不宜使用。
同质性信度:
也叫内部一致性系数,指测验内部所有题目间的一致性程度。
库德-理查逊公式(KR-20、K-R21)适用于二分法计分测验,当所有题目的难度接近时。
克龙巴赫a系数可以处理任何测验的内部一致性系数的计算问题。
评分者信度:
指多个评分者给同一批人的答卷进行评分的一致性程度。
当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计。
信度类型
误差变异的来源
重测信度
跨时间的一致性
复本信度(连续施测)
跨形式的一致性
复本信度(间隔施测)
跨时间和形式的一致性
分半信度
跨项目的一致性
同质性信度
评分者信度
跨评分者的一致性
提高测量信度的常用方法
1、适当增加测验的长度
2、使测验中所有试题的难度接近正态分布,并控制在中等水平
3、努力提高测验试题的区分度
4、选取适当的被试团体,提高测验在各同质性较强的亚团体上的信度
5、主试者要严格执行实测规程,评分者要严格按标准给分,实测场地要按测验手册的要求进行布置,减少无关因素的干扰。
第五章测量效度
一、效度:
指一个测量或量表实际能测出其所要测量的心理特质的程度。
性质:
(1)效度是针对测验结果的。
(2)效度是针对某种特定的测量目的的。
(3)效度只有程度上
的差异,不是一个“全”和“无”的概念。
定义:
与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率。
(书P68)
概念注意点:
(1)效度是一个相对的概念。
(2)效度是测量的随机误差和系统误差的综合反映。
(3)判断一个测量是否有效要从多方面搜集证据。
信度与效度的关系:
1、信度高是效度高的必要而非充分条件。
当随机误差的变异数减小时,真实分数的变异数增加,测验信度随之提高。
信度的提高只给有效变异数的增加提供了可能,至于是否能提高效度,还要看
系统误差变异数的大小。
可见,信度高不一定效度高。
但一个测验要想效度高,真分数的变异数必须占比较大的比重,即测验的信度必须高。
2、测验的效度受它的信度制约。
(公式在书P69)
二、效度的评估
1、内容效度:
指一个测验实际测到的内容与所要测量的内容之间的吻合程度。
内容效度主要应用于成就测验,因为成就测验主要是测量被试掌握某种技能或学习某门课程所达到的程度。
也适用于某些选
拔和分类的职业测验。
不适用于能力倾向和人格测验。
内容效度的确定方法:
专家判断(定性分析)、内容效度比、重测、双向细目表、经验推测法。
2、结构效度:
指一个测验实际测到所要测量的理论结构和特质的程度。
包括区分效度、效标效度和预测效度。
结构效度的确立步骤:
提出理论假设;
依据理论框架,推演出有关测验成绩的假设;
用逻辑的和实证的方法来验证假设。
估计方法:
测验内部寻找证据法,测验之间寻找证据法,考查测验的实证效度法,多种特质一多种方法矩阵法,因素分析法。
3、实证效度(效标关联效度):
指一个测验对于特定情境中的个体的行为进行估计的有效性。
(1)根据效标资料搜集的时间差异,实证效度可以分成:
同时效度和预测效度。
(2)效标:
衡量一个测验是否有效的外在标准。
效标与测验分数之间呈线性分布时用皮尔逊积差相关系数。
(3)实证效度的估计方法:
相关法;
区分法;
命中率;
基础率、灵敏度和确认度。
四、提高测量效度的方法:
1、精心编制测验量表,避免出现较大的系统误差
2、妥善组织测验,控制随机误差
3、创设标准的应试情境,让被试发挥正常水平
4、选好正确的效标,定好恰当的效标测量,正确地使用有关公式。
第六章测验的项目分析(计算题)
项目的分析包括量的分析和质的分析两个方面。
一、测验项目的难度(难度系数越大,题目越容易)
1、二分法计分项目的难度
(1)通过率
P=R/N(P代表项目难度,N为全体被试数,R为答对该项目的人数)
(2)极端分组法
当被试分数较多时,先将被试按照测验总分从高到低排列,分别计算高分组和低分组的通过率,然后求项目的难度。
通常以27%为分界值。
P=(P高+P低)/2或P=(高分组通过人数/高分组人数+低分组通过人数/低分组人数)/2
2、非二分法计分项目的难度
P=x/X(x为被试在某一项目上的平均得分,X为该项目的满分)
测验难度水平的确定
测验
难度值
标准化测验
P=0.3~0.7
常模参照测验
P=0.5
选拨和诊断测验
接近录取线
一般测验
极难(P<
0.1)~极易(P>
0.9)
3、难度的等距变换(书P85)
当样本容量很大时,测验分数将接近正态分布,此时,我们可以根据正态分布曲线,将试题的难度P
作为正态曲线下的面积,转换成具有相等单位的等距量数,即Z分数。
4、难度对测验的影响
(1)、测验难度影响测验分数的分布形态:
若测验项目的难度普遍较大,被试的得分普遍较低,则测验分数集中在低分端,分数分布呈现正偏态;
如果测验题目的难度普遍较小,被试的得分普遍较高,则测验分数集中在高分端,分数分布呈现负偏态。
(2)、测验难度影响测验分数的离散程度:
当难度集中在0.5时,分数的分布范围较广,方差较大,测验信度值较高;
难度集中在两端即不是太难就是太易时,分数分布范围最小,测验信度值较
低。
二、测验项目的区分度(D):
指测验项目对被试心理品质水平差异的区分能力。
当难度为0.5时,区
分度最大。
计算:
1、项目鉴别指数法D=P高-P低(P高与P低分别为高分组和低分组在该项目上的通过率)
2相关法(书P90)题目鉴别指数评鉴
鉴别指数D
题目评价
0.4以上
很好
0.3~0.39
良好,修改会更好
0.2~0.29
尚可,仍需修改
0.2以下
差,必须淘汰
D的最大值与项目难度的关系(学会如何计算)
项目通过率P
D的最大值
1.00
0.00
0.90
0.20
0.70
0.60
0.80
0.50
0.40
0.30
0.10
三、项目难度受猜测影响的校正
1、猜测校正的性质与公式:
选择题中为平衡机遇对难度的影响,吉尔福特提出的可用的校正公式
CP=P-(Q/(K-1))或CP=(KP-1)/(K-1)
CP为校正后的通过率,P为实际通过率,K为备选答案数目,Q=1-P。
2、猜测校正的优缺点:
优点
(1)通过猜测校正可避免降低测验的信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理测量学 重点