教育测量与评价Word文档下载推荐.docx
- 文档编号:18294115
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:12
- 大小:22.65KB
教育测量与评价Word文档下载推荐.docx
《教育测量与评价Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《教育测量与评价Word文档下载推荐.docx(12页珍藏版)》请在冰豆网上搜索。
(一)测试开始前的准备
主试方面:
•首先,主试在测试前要熟悉测验的结构和内容以及使用方法。
•其次,测验实施者要熟练测验指导语并能口语清楚而流利地说出来。
•有时还要对施测者进行必要的训练。
训练的内容包括:
1、熟悉测验内容;
2、掌握施测步骤;
3、掌握记分方法;
4、掌握解释分数的技术。
测试方面:
•主试在测验前要把测验材料准备好,以免短缺而临时寻找。
(二)测试过程中应注意的事项
1、指导语
2、测验情景
3、施测顺序
4、测验焦虑
(三)主试和被试的良好合作关系
•主试保证测验结果绝对保密
•对被试加以积极的鼓励
4.简述区分度的相对性包括哪些方面?
1.不同的计算方法,所得的区分度的值不同。
两种相关值的比较。
2.样本容量的大小影响相关法区分度值的大小
3.分组标准影响鉴别指数。
4.被试样本的同质性程度影响区分度值的大小。
5.简述信度的几种估计方法?
信度种类及估计方法
(第六章6页只有估计同质性信度的方法)
重测信度
复本信度
分半信度
同质性信度
评分者信度
估计同质性信度的方法
库德-理查逊方法
K-R20公式(仅适用于以1、0记分)
公式:
公式K-R20中:
K为构成测验的题目数;
Pi为通过第i题的人数比例;
qi为未通过第i题的人数比例;
Sx为测验总分的标准差。
K-R21公式(适用于以1、0记分,各题难度近似)
公式K-R21中:
X杠为测验总分的平均分;
其它符号同上。
α系数或克伦巴赫公式
适用于一切非0、1记分和连续记分(即多重记分)的情况
式中:
KK为测验的题目数;
Si为第i题分数的标准差;
Sx为测验总分的标准差。
6.简述提高信度的方法有哪些?
(1)适当增加测验的长度
(2)使所有题目的难度接近正态分布
(3)努力提高测题的区分度
(4)选取恰当的被试团体
7.简述效度的性质有哪些?
(1)效度具有相对性
任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。
(2)效度是针对测验结果的,即测验结果的有效性程度。
(3)效度具有连续性
测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。
也就是说我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或较低来评价。
8.简述影响效标效度的因素有哪些?
(一)测验的长度
(二)效标的选择
(三)预测源与效标测量的信度
(四)受测者样本的特征
(五)基础率
(六)录取率
二、论述
9.论述教育测验的分类。
(一)按测验功能
能力测验
成就测验
人格测验
包括:
:
实际能力测验与潜在能力测验((能力倾向测验));
普通能力测验(智力)与特殊能力测验。
实际能力:
指个人当前“所能为者”,,代表个人已有的知识、经验与技能,,是正式与非正式学习或训练的结果。
潜在能力:
是指个人将来“可能为者”,,是在给予一定的学习机会时,某种行为可能达到的水平。
成就测验:
主要用于测量个人((或团体))经过某种正式教育或训练之后对知识和技能掌握的程度。
人格测验:
主要用于测量性格、气质、兴趣、态度、品德、情绪、信念、价值观等方面的个性心理特征。
(二)按测验方式分类
纸笔测验:
测验所用的是文字或图形材料,实施方便,团体测验多采用此种方式。
操作测验:
操作测验项目多属于对图片、实物、工具、模型的辨认和操作,无需使用文字作答,所以不受文化因素的限制。
口头测验:
测验项目为言语材料。
主试口头提问,被试口头作答。
电脑测验:
测验项目可以是文字、图形,在电脑上显示,被试按键作答。
(三)按测验的对象人数
个别测验:
每次仅以一位被试为对象,通常是一位主试与一位被试在面对面的情形下进行。
团体测验:
是在同一时间内由一位主试对多数人施测。
个别测验
优点:
获得的信息多;
容易建立融洽的合作关系;
特殊被试(幼儿、盲人)
缺点:
费时、复杂、对主试要求高。
团体测验
优点:
节省时间、短期内可收集大量的数据
缺点:
被试的行为不易有效控制,容易产生测量误差。
(四)按应用领域分:
学业测验
职业测验
临床测验
(五)按测验的性质分:
构造性测验
投射测验
(六)按测验要求分类:
最高作为测验:
此种测验要求被试尽可能做出最好的回答,主要与认知过程有关,有正确答案。
(能力测验、成就测验)
典型作为测验:
此种测验要求被试按通常的习惯方式作出反应,没有正确答案。
(人格测验)
(七)按测验的目的分类:
描述性测验:
测验的目的在于对个人或团体的能力、性格、兴趣、知识水平等进行描述。
诊断性测验:
目的在于对个人或团体的某种行为问题进行诊断。
预示性测验:
目的在于通过测验分数预示一个人将来的表现和所能达到的水平。
(八)按测验解释
常模参照测验:
此种测验是将一个人的分数与其他人比较,看其在某一团体中所处的位置。
标准参照测验:
此种测验是将被试的分数与某种标准进行比较来解释。
(九)按测验难度分类
速度测验:
此种测验题目比较容易,但数量多,时间短,几乎每个被试都不能作完所有题目。
测量的是反应速度。
难度测验:
包含各种不同难度的题目,由易到难排列,其中有一些极难的题目,几乎所有被试都解答不了。
但时间较充裕,测量的是解答难题的最高能力。
10.论述教育测量工作者的素质要求与道德准则。
(1)教育测量工作者的素质要求
专业理论知识
专业技能
对心理测验的科学态度
错误观念:
万能论
无用论
心理测验就是智力测验
(心理测验=智力测验=智商=遗传决定论)
对待测验的正确态度:
心理测验是研究心理学的重要方法之一,是决策的辅助工具;
心理测验作为研究方法和测量工具尚不完善;
防止乱编和滥用心理测验。
(2)心理测量工作者的道德准则
(一)测验的保密和控制使用
测验信息和样题的公布
有助于消除公众对心理测验的神秘感及误解
有关测验的技术程序以及信度、效度和其他测验属性应向所有人公开
让受测者熟悉测验,以消除焦虑,保证测验结果的准确性
对测验结果的反馈
(二)测验中个人隐私的保护
11.论述如何正确解释测验分数的意义。
(一和二哪一个是正确答案)
一、如何看待测验分数的意义
1.应根据教育和心理测量的特点进行分析。
应该把测验分数视为一个范围而不是一个确定的点。
2.不能把分数绝对化,绝不能根据一次测验的结果下定论,应参考其他有关资料。
其他有关资料包括:
•个人在测验前的经历
•测验情境也是一个需要考虑的因素
3.为了对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料。
4.对于来自不同测验的分数不能直接加以比较。
为了使不同测验的分数可以比较,必须将二者放在统一的量表上。
二、如何向受测者报告测验分数正确解释
1.不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议。
2.避免使用专业术语,使用当事人理解的语言。
3.要保证当事人知道这个测验测量或预测什么。
4.如果测验是以常模为参考的,就要使当事人知道他是和什么团体在进行比较。
5.要使当事人知道如何运用他的分数。
6.要考虑测验分数将给当事人带来什么影响。
7.要让当事人积极参与测验分数的解释。
12.论述影响测量信度的主要因素。
(一)样本特征
1.样本团体异质性的影响
一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
2.样本团体平均能力水平的影响
测验的信度会由于不同团体间平均能力水平的不同而不同。
因为对于不同水平的团体,项目具有不同的难度,每个项目在难度上的变化累积起来便会影响信度。
(二)测验长度
1.测验越长,测验的测题取样或内容取样就越有代表性。
2.测验越长,被试的猜测因素影响就越小。
(三)测验难度
难度对信度的影响,只存在于某些测验中。
如智力测验、成就测验、能力倾向测验等;
对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。
就难度与信度的关系而言,并没有简单的对应关系。
从理论上说,只有平均难度水平为50%时,才能使求得的信度最高。
事实上,难度为0.50只适合于简答题,对于选择题由于存在猜测因素,难度值应提高。
洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:
五选一测题:
0.70
四选一测题:
0.74
三选一测题:
0.77
是非题:
(四)时间间隔
时间间隔只对重测信度和不同时测量时的复本信度有影响。
以再测法和复本法求信度,两次测验相隔时间越短,其信度系数越大;
间隔时间越长,信度系数越低。
13.论述中国古代的教育测量思想与实践。
(1)中国古代的教育测量思想
心理特征差异性的思想
孔子——教育测量的思想
“性相近,习相远”
孔子说:
人((或生命))先天具有的纯真本性,互相之间是接
近的,而后天习染积久养成的习性,却是互相之间差异甚
大
“中人以上可以语上也,中人以下不可以语上
也”
“具有中等资质或道德水平以上的人,可以
告诉他较高的学问或道理;
而具有中等资质或道德水平以下的人,不可以告诉他
较高的学问或道理。
”
心理特征差异性的可测量性的思想
孟子:
“权,然后知轻重;
度(((duó
),然后知长短;
物皆然,心为甚”
((孟子))说:
“用秤称一称,才能知道轻重;
;
用尺量一量,才
能知道长短。
什么东西都是这样,人的心更需要这样。
(2)中国古代的教育测量实践
教育测量的实践活动((人才的评定和选拔))
1.科举取士制度----欧洲文官考试制度
商周时代:
礼、乐、射、御、书、数等六艺
汉代:
法律、军事、农业、税收和地理等五经
隋唐:
儒学经典
((形式多样:
帖经、墨义、口义、策论等))
2.民间的智力型游戏
周岁试儿:
到现在,婴幼儿的动作测量
七巧板九连环——古代测智力水平的器具
国外著名的--河内塔问题
六艺
九连环的设计精巧性可与现代的魔方、魔棍等操
作性玩具相媲美,也可被视为较之现代认知心理
学中的河内塔任务更为复杂的操作性问题解决任
务。
被著名心理学家伍德沃斯称为“中国式的迷津”。
七巧板被著名心理学家伍德沃斯称为“唐图”,
即“中国的图板”之意。
七巧板类型的拼图任务现在几乎为当代的多数智
力测验和创造力测验所使用,并且已经发展成为
标准化的纸笔型测验。
3.三国时期,刘劭[shà
o]《人物志》
“考课核实”法、
“八观与五视”((观察法)---被美国人翻译后,
名为《人类能力之研究》
4.韩非:
一手画圆,一手画方。
到现在用于测注意力
中国古代测量思想的特点:
描述性
分类式
注重整体评价,和人的道德品质联系起来
实用性
汉诺塔(河内塔)问题
河内塔是根据一个传说形成的一个问题:
有三根杆子AA,BB,CC。
AA杆上有NN个(N>
1)穿孔圆盘,盘的尺
寸由下到上依次变小。
要求按下列规则将所有圆盘移至CC杆:
每次只能移动一个
圆盘;
大盘不能叠在小盘上面。
提示:
可将圆盘临时置于BB杆,也可将从AA杆移出的圆盘重
新移回AA杆,但都必须尊循上述两条规则。
问:
如何移?
最少要移动多少次?
一位法国数学家曾编写过一个印度的古老传说:
在世界中心贝拿勒斯(在印度北部)的圣庙里,
一块黄铜板上插着三根宝石针。
印度教的主神梵((fà
n))天在创造世界的时候,在其
中一根针上从下到上地穿好了由大到小的64片金
片,这就是所谓的汉诺塔。
不论白天黑夜,总有一个僧侣在按照下面的法则
移动这些金片:
一次只移动一片,不管在哪根针上,小片必须在
大片上面。
僧侣们预言,当所有的金片都从梵天穿好的那根
针上移到另外一根针上时,世界就将在一声霹雳
中消灭,而梵塔、庙宇和众生也都将同归于尽。
不管这个传说的可信度有多大,如果考虑一下把64片金片,
由一根针上移到另一根针上,并且始终保持上小下大的顺
序。
这需要多少次移动呢?
?
这里需要递归的方法。
假设有nn片,移动次数是f(n).显然
ff⑴=1,f⑵=3,f⑶=7,且f(k+1)=2*f(k)+1。
此后不难证明f(n)=2^n--11。
n=64时,
ff(64)=2^64--1=18446744073709551615
假如每秒钟一次,共需多长时间呢?
一个平年365天,有31536000秒,闰年366天有
31622400秒,平均每年31556952秒,计算一下,
184********709551615/31556952
=584554049253.855年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 评价