心理与教育测量第十章.ppt
- 文档编号:2767098
- 上传时间:2022-11-12
- 格式:PPT
- 页数:45
- 大小:3.21MB
心理与教育测量第十章.ppt
《心理与教育测量第十章.ppt》由会员分享,可在线阅读,更多相关《心理与教育测量第十章.ppt(45页珍藏版)》请在冰豆网上搜索。
心理与教育测量心理与教育测量主讲:
邓稳根(博士)主讲:
邓稳根(博士)赣南师范学院教育科学学院赣南师范学院教育科学学院E-Mail:
第十章第十章目标参照测验目标参照测验目标参照测验概述目标参照测验概述目标参照测验的项目分析目标参照测验的项目分析目标参照测验的信度与效度目标参照测验的信度与效度目标参照测验分数分界点的确定目标参照测验分数分界点的确定第一节第一节目标参照测验概述目标参照测验概述目标参照测验的产生目标参照测验的产生1、产生于实际需要:
、产生于实际需要:
西方国家发展测验初期只关心个别差异,到西方国家发展测验初期只关心个别差异,到20世纪世纪中叶发现这是片面的。
我们还需要关心个体在测验中叶发现这是片面的。
我们还需要关心个体在测验内容上掌握的绝对水平。
如学科结业考试,就是评内容上掌握的绝对水平。
如学科结业考试,就是评价个体能否达到基本要求;如很吃香执业资格考试,价个体能否达到基本要求;如很吃香执业资格考试,又如帮助学生达到掌握水平的诊断困难与缺限的诊又如帮助学生达到掌握水平的诊断困难与缺限的诊断测验等。
断测验等。
2、发展的原因是常模参照测验无法胜任这一、发展的原因是常模参照测验无法胜任这一任务。
任务。
因为这种测验要有掌握标准的确定界值,或称合格因为这种测验要有掌握标准的确定界值,或称合格分数线,而常模测验没有,用于常模参照测验的一分数线,而常模测验没有,用于常模参照测验的一整套理论和技术都不适用于目标参照测验。
整套理论和技术都不适用于目标参照测验。
3、目标参照测验应用广泛,且负作用较小,、目标参照测验应用广泛,且负作用较小,有利于素质教育,有利于教育大面积丰收。
有利于素质教育,有利于教育大面积丰收。
目标参照测验的定义目标参照测验的定义有许多定义,但有许多定义,但R.Glaser(1971)的定义较广)的定义较广泛地被接受。
泛地被接受。
“标准参照测验是根据某一明确界定的内容范围而标准参照测验是根据某一明确界定的内容范围而缜密编制的测验,并且被试在测验上所得结果,也缜密编制的测验,并且被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。
是根据某一明确界定的行为标准直接进行解释的。
”理解:
强调理解:
强调“内容范围内容范围”和和“行为标准行为标准”两词两词内容范围内容范围:
内容范围在测验编制之前就必须明内容范围在测验编制之前就必须明确界定,确界定,给予严格的给予严格的操作性定义。
操作性定义。
内容范围包括内容范围包括知识内容范围和能力目标范围两个方面。
知识内容范围和能力目标范围两个方面。
测验试测验试题应在内容范围之内,并且是所有属此内容范围内题应在内容范围之内,并且是所有属此内容范围内试题的一个有充分代表性的样本,否则评价是不准试题的一个有充分代表性的样本,否则评价是不准确的。
确的。
行为标准行为标准:
“行为标准行为标准”是一客观的、稳定的,是一客观的、稳定的,被指为被指为“已掌握这一内容范围已掌握这一内容范围”的最低标准。
的最低标准。
“行为行为”标准从统计上说就是一条合格分数线,也称标准从统计上说就是一条合格分数线,也称“分界点分界点”。
目标参照测验的应用目标参照测验的应用如果一门学科的难度水平呈递增趋势,学生需如果一门学科的难度水平呈递增趋势,学生需要达到一定的熟练水平才能进行更高阶段的学要达到一定的熟练水平才能进行更高阶段的学习。
习。
例如,学生要学会把句号放在一句话的结尾处这个例如,学生要学会把句号放在一句话的结尾处这个规则,必须先知道什么是句子。
规则,必须先知道什么是句子。
在必须掌握的领域,要使用标准参照测验。
在必须掌握的领域,要使用标准参照测验。
例如,乘法表的知识就可以用标准参照测验的方法例如,乘法表的知识就可以用标准参照测验的方法来测验。
来测验。
在诊断性的工作中,标准参照反馈比常模参照在诊断性的工作中,标准参照反馈比常模参照反馈更有用。
反馈更有用。
例如,知道一个学生在特定的内容方面学习有困难例如,知道一个学生在特定的内容方面学习有困难(还没达到熟练水平)要比知道这个学生在班级中(还没达到熟练水平)要比知道这个学生在班级中属于中等水平更重要。
属于中等水平更重要。
第二节第二节目标参照测验的项目分析目标参照测验的项目分析内容范围的确定内容范围的确定内容范围确定的意义内容范围确定的意义目标参照测验本身的要求,要有明确的内容范围。
目标参照测验本身的要求,要有明确的内容范围。
项目分析的需要以至测验总体的评价都要以内容项目分析的需要以至测验总体的评价都要以内容的界定作前提的界定作前提。
内容范围的特点内容范围的特点内容范围有边界:
边界有大,有小,须界定。
内容范围有边界:
边界有大,有小,须界定。
内容范围中的内容可以分类、分层。
每一类每一内容范围中的内容可以分类、分层。
每一类每一层有其相对地位,划分清楚类层及地位,如此构成层有其相对地位,划分清楚类层及地位,如此构成内容的结构。
内容的结构。
明确了内容范围的边界和其内部结构,则认为内明确了内容范围的边界和其内部结构,则认为内容范围得到了明确的界定。
容范围得到了明确的界定。
内容范围界定的依据和方法内容范围界定的依据和方法特定测验目的是界定的依据。
特定测验目的是界定的依据。
(A)如某专业资格测验,可以通过该工作分析来界如某专业资格测验,可以通过该工作分析来界定,测验内容范围。
定,测验内容范围。
(B)教学测验可通过教材、大纲来界定,测验内容教学测验可通过教材、大纲来界定,测验内容范围。
范围。
形式就是测验双向细目表。
形式就是测验双向细目表。
由三个要素组成:
一是由三个要素组成:
一是考查目标;考查内容;每一类内容和每一种目标相考查目标;考查内容;每一类内容和每一种目标相结合后在整个内容范围中所占的比重(即重要性)。
结合后在整个内容范围中所占的比重(即重要性)。
如下表:
如下表:
测验项目的内容效度分析测验项目的内容效度分析1、分析目的:
、分析目的:
检验所命试题的内容是否与测验内容范围所规定的检验所命试题的内容是否与测验内容范围所规定的内容一致。
内容一致。
2、分析方法:
专家评定法。
、分析方法:
专家评定法。
请请专家对测题所测内容与测题编制者宣称要测量的专家对测题所测内容与测题编制者宣称要测量的目标内容间的一致性进行评价。
目标内容间的一致性进行评价。
具体方法见内容效具体方法见内容效度这一章节,我们已经讲过。
度这一章节,我们已经讲过。
测验项目的难度和区分度分析测验项目的难度和区分度分析测验的预测测验的预测测验项目的难度分析测验项目的难度分析测验项目的区分度分析测验项目的区分度分析
(一)测验的预测
(一)测验的预测数据收集方法数据收集方法前测前测后测法:
后测法:
含义:
含义:
同一项目对同一组被试在学习之前之后同一项目对同一组被试在学习之前之后分别测试一次。
分别测试一次。
图解:
图解:
学过组学过组非学过组法:
非学过组法:
含义:
含义:
同一项目对学过组和非学过组被试各测同一项目对学过组和非学过组被试各测一次。
一次。
图解:
图解:
对照组法,掌握组对照组法,掌握组非掌握组法:
非掌握组法:
含义:
含义:
同一项目对两组被试各施测一次。
同一项目对两组被试各施测一次。
图解:
图解:
第第种方法被认为是对种方法被认为是对、两法的改进,两法的改进,但分组依赖于都是的经验判断。
但分组依赖于都是的经验判断。
(二)测验项目的难度分析
(二)测验项目的难度分析1、目标参照测验的难度计算与常模测验的、目标参照测验的难度计算与常模测验的难度计算采用同一种方法。
难度计算采用同一种方法。
2、有人认为,目标参照测验中属内容范、有人认为,目标参照测验中属内容范围中不可缺少题目并不在乎它是难还是易,围中不可缺少题目并不在乎它是难还是易,都要测。
都要测。
3、计算目的:
分析区分度的基础、计算目的:
分析区分度的基础。
(三)测验项目的区分度分析(三)测验项目的区分度分析难度差值指标:
难度差值指标:
掌握组掌握组非掌握组鉴别指数非掌握组鉴别指数(D)。
计算公式:
计算公式:
D=PA-PB,其中,其中PA为掌握组的得分率,为掌握组的得分率,PB为非掌握组的得分率。
为非掌握组的得分率。
D值范围在值范围在-1,1之间,之间,D值越大,区分度越高。
值越大,区分度越高。
个人获得指数个人获得指数(DIG)一般应用在前测一般应用在前测-后测方法中。
后测方法中。
计算方法为:
前测中错误回答某项目而在后测中能计算方法为:
前测中错误回答某项目而在后测中能够正确回答的被试人数比例。
范围在够正确回答的被试人数比例。
范围在0,1之间。
之间。
局限:
未考虑前测中通过而后测中失败的被试。
局限:
未考虑前测中通过而后测中失败的被试。
举例:
请用前述两种方法计算表中项目的区分度举例:
请用前述两种方法计算表中项目的区分度相关系数法相关系数法方法同常模参照测验。
但区分度大小的评价标方法同常模参照测验。
但区分度大小的评价标准不同。
准不同。
相关系数为负值,应检查题目问题所在,予以删除相关系数为负值,应检查题目问题所在,予以删除或修改。
或修改。
相关系数为正值,其值越大,越具有区分力。
项目相关系数为正值,其值越大,越具有区分力。
项目越有效。
越有效。
相关系数接近相关系数接近0,一般不予保留,但应视该项目所测,一般不予保留,但应视该项目所测内容在内容范围中的重要性而决定其取舍。
内容在内容范围中的重要性而决定其取舍。
第三节第三节目标参照测验的信度与效度目标参照测验的信度与效度信度及其估计信度及其估计定义:
与常模参照测验的信度定义一致。
定义:
与常模参照测验的信度定义一致。
计算:
计算:
不能采用相关系数法求取信度,原因:
不能采用相关系数法求取信度,原因:
相关系数信相关系数信度高低与被试团体度高低与被试团体的特质水平的特质水平分布有关,被试异质分布有关,被试异质性越强,信度越高,目标性越强,信度越高,目标参照参照测验不在于鉴别被试测验不在于鉴别被试差异,因而分数分布相对集中,即使测验可靠稳定,差异,因而分数分布相对集中,即使测验可靠稳定,其相关也不高,因此相关其相关也不高,因此相关系数系数不适用于目标不适用于目标参照参照测测验。
验。
方法:
分类一致性信度方法:
分类一致性信度(P0);荷伊特信度;荷伊特信度1、分类一致性信度、分类一致性信度原因原因目标目标参照参照测验关心的测验关心的是是对被试合格与否的分类对被试合格与否的分类是否一致,分类一致性指标成为目标测验的信是否一致,分类一致性指标成为目标测验的信度是顺理成章的。
度是顺理成章的。
方法方法:
测试采用复测法或复本法;测试采用复测法或复本法;统计以合格线统计以合格线为界分别进行。
为界分别进行。
计算在两次测试中分数一致计算在两次测试中分数一致人数人数(两次均及格或两次均两次均及格或两次均不及不及格人数格人数)在总人在总人数中之比。
数中之比。
校正。
校正。
分类一致性信度的求取及其校正分类一致性信度的求取及其校正评价:
评价:
越大,信度越高,意义明确,计算简单。
越大,信度越高,意义明确,计算简单。
但再测、复本的测试缺但再测、复本的测试缺陷陷存在。
存在。
依赖于合格分数线的准依赖于合格分数线的准确确划分划分。
举例举例若有一个若有一个60人的团体,采用某测验前后施人的团体,采用某测验前后施测两次,两次测试中均及格的人数为测两次,两次测试中均及格的人数为21人,人,均不及格的人格为均不及格的人格为12人,请计算分类一致人,请计算分类一致性信度。
性信度。
2、荷伊特信度、荷伊特信度计算公式:
计算公式:
评价:
由于此式不受被试分布及测验目标评价:
由于此式不受被试分布及测验目标影响,可用于目标影响,可用于目标参照参照测验,又因为不涉测验,又因为不涉及合格线,因此优于分类一致性信度及合格线,因此优于分类一致性信度。
效度及其估计效度及其估计内容效度内容效度效标关联效度效标关联效度1、内容效度、内容效度目标目标参照参照测验要求有明确的内容范围,要测验要求有明确的内容范围,要求试题严格限制在内容范围之内,且有最求试题严格限制在内容范围之内,且有最充分代表性,因此,内容效度是对目标参充分代表性,因此,内容效度是对目标参照性测验关心的重点照性测验关心的重点。
评估计方法与常模测验方法相同。
评估计方法与常模测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 测量 第十