书签分享收藏举报版权申诉 / 12

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 哲学历史 > 教育测量与评价Word文档下载推荐.docx

教育测量与评价Word文档下载推荐.docx

文档编号：18294115
上传时间：2022-12-15
格式：DOCX
页数：12
大小：22.65KB

《教育测量与评价Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《教育测量与评价Word文档下载推荐.docx（12页珍藏版）》请在冰豆网上搜索。

教育测量与评价Word文档下载推荐.docx

（一）测试开始前的准备

主试方面：

•首先，主试在测试前要熟悉测验的结构和内容以及使用方法。

•其次，测验实施者要熟练测验指导语并能口语清楚而流利地说出来。

•有时还要对施测者进行必要的训练。

训练的内容包括：

1、熟悉测验内容；

2、掌握施测步骤；

3、掌握记分方法；

4、掌握解释分数的技术。

测试方面：

•主试在测验前要把测验材料准备好，以免短缺而临时寻找。

（二）测试过程中应注意的事项

1、指导语

2、测验情景

3、施测顺序

4、测验焦虑

（三）主试和被试的良好合作关系

•主试保证测验结果绝对保密

•对被试加以积极的鼓励

4．简述区分度的相对性包括哪些方面？

1.不同的计算方法，所得的区分度的值不同。

两种相关值的比较。

2.样本容量的大小影响相关法区分度值的大小

3.分组标准影响鉴别指数。

4.被试样本的同质性程度影响区分度值的大小。

5.简述信度的几种估计方法？

信度种类及估计方法

（第六章6页只有估计同质性信度的方法）

重测信度

复本信度

分半信度

同质性信度

评分者信度

估计同质性信度的方法

库德-理查逊方法

Ｋ－Ｒ20公式（仅适用于以1、0记分）

公式：

公式K-R20中：

K为构成测验的题目数；

Pi为通过第i题的人数比例；

qi为未通过第i题的人数比例；

Sx为测验总分的标准差。

Ｋ－Ｒ21公式（适用于以1、0记分，各题难度近似）

公式K-R21中：

X杠为测验总分的平均分；

其它符号同上。

α系数或克伦巴赫公式

适用于一切非0、1记分和连续记分（即多重记分）的情况

式中：

KK为测验的题目数；

Si为第i题分数的标准差；

Sx为测验总分的标准差。

6.简述提高信度的方法有哪些？

（1）适当增加测验的长度

（2）使所有题目的难度接近正态分布

（3）努力提高测题的区分度

（4）选取恰当的被试团体

7.简述效度的性质有哪些？

（1）效度具有相对性

任何测验的效度是对一定的目标来说的，或者说测验只有用于与测验目标一致的目的和场合才会有效。

（2）效度是针对测验结果的，即测验结果的有效性程度。

（3）效度具有连续性

测验效度通常用相关系数表示，它只有程度上的不同，而没有“全有”或“全无”的区别。

也就是说我们评价一个测验时，不应该说“有效”或“无效”，而应该用效度较高或较低来评价。

8.简述影响效标效度的因素有哪些？

（一）测验的长度

（二）效标的选择

（三）预测源与效标测量的信度

（四）受测者样本的特征

（五）基础率

（六）录取率

二、论述

9.论述教育测验的分类。

（一）按测验功能

能力测验

成就测验

人格测验

包括:

:

实际能力测验与潜在能力测验（（能力倾向测验））；

普通能力测验（智力）与特殊能力测验。

实际能力：

指个人当前“所能为者”,,代表个人已有的知识、经验与技能,,是正式与非正式学习或训练的结果。

潜在能力：

是指个人将来“可能为者”,,是在给予一定的学习机会时，某种行为可能达到的水平。

成就测验：

主要用于测量个人（（或团体））经过某种正式教育或训练之后对知识和技能掌握的程度。

人格测验：

主要用于测量性格、气质、兴趣、态度、品德、情绪、信念、价值观等方面的个性心理特征。

（二）按测验方式分类

纸笔测验:

测验所用的是文字或图形材料,实施方便,团体测验多采用此种方式。

操作测验:

操作测验项目多属于对图片、实物、工具、模型的辨认和操作，无需使用文字作答，所以不受文化因素的限制。

口头测验：

测验项目为言语材料。

主试口头提问，被试口头作答。

电脑测验：

测验项目可以是文字、图形，在电脑上显示，被试按键作答。

（三）按测验的对象人数

个别测验：

每次仅以一位被试为对象，通常是一位主试与一位被试在面对面的情形下进行。

团体测验：

是在同一时间内由一位主试对多数人施测。

个别测验

优点：

获得的信息多；

容易建立融洽的合作关系；

特殊被试（幼儿、盲人）

缺点：

费时、复杂、对主试要求高。

团体测验

优点：

节省时间、短期内可收集大量的数据

缺点：

被试的行为不易有效控制，容易产生测量误差。

（四）按应用领域分：

学业测验

职业测验

临床测验

（五）按测验的性质分：

构造性测验

投射测验

（六）按测验要求分类：

最高作为测验：

此种测验要求被试尽可能做出最好的回答，主要与认知过程有关，有正确答案。

（能力测验、成就测验）

典型作为测验：

此种测验要求被试按通常的习惯方式作出反应，没有正确答案。

（人格测验）

（七）按测验的目的分类：

描述性测验：

测验的目的在于对个人或团体的能力、性格、兴趣、知识水平等进行描述。

诊断性测验：

目的在于对个人或团体的某种行为问题进行诊断。

预示性测验：

目的在于通过测验分数预示一个人将来的表现和所能达到的水平。

（八）按测验解释

常模参照测验：

此种测验是将一个人的分数与其他人比较，看其在某一团体中所处的位置。

标准参照测验：

此种测验是将被试的分数与某种标准进行比较来解释。

（九）按测验难度分类

速度测验：

此种测验题目比较容易，但数量多，时间短，几乎每个被试都不能作完所有题目。

测量的是反应速度。

难度测验：

包含各种不同难度的题目，由易到难排列，其中有一些极难的题目，几乎所有被试都解答不了。

但时间较充裕，测量的是解答难题的最高能力。

10.论述教育测量工作者的素质要求与道德准则。

（1）教育测量工作者的素质要求

专业理论知识

专业技能

对心理测验的科学态度

错误观念：

万能论

无用论

心理测验就是智力测验

（心理测验=智力测验=智商=遗传决定论）

对待测验的正确态度：

心理测验是研究心理学的重要方法之一，是决策的辅助工具；

心理测验作为研究方法和测量工具尚不完善；

防止乱编和滥用心理测验。

（2）心理测量工作者的道德准则

（一）测验的保密和控制使用

测验信息和样题的公布

有助于消除公众对心理测验的神秘感及误解

有关测验的技术程序以及信度、效度和其他测验属性应向所有人公开

让受测者熟悉测验，以消除焦虑，保证测验结果的准确性

对测验结果的反馈

（二）测验中个人隐私的保护

11.论述如何正确解释测验分数的意义。

（一和二哪一个是正确答案）

一、如何看待测验分数的意义

1.应根据教育和心理测量的特点进行分析。

应该把测验分数视为一个范围而不是一个确定的点。

2.不能把分数绝对化，绝不能根据一次测验的结果下定论，应参考其他有关资料。

其他有关资料包括：

•个人在测验前的经历

•测验情境也是一个需要考虑的因素

3.为了对测验分数做出确切的解释，只有常模资料是不够的，还必须有测验的信度和效度资料。

4.对于来自不同测验的分数不能直接加以比较。

为了使不同测验的分数可以比较，必须将二者放在统一的量表上。

二、如何向受测者报告测验分数正确解释

1.不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员，应告诉的是测验分数的解释和建议。

2.避免使用专业术语，使用当事人理解的语言。

3.要保证当事人知道这个测验测量或预测什么。

4.如果测验是以常模为参考的，就要使当事人知道他是和什么团体在进行比较。

5.要使当事人知道如何运用他的分数。

6.要考虑测验分数将给当事人带来什么影响。

7.要让当事人积极参与测验分数的解释。

12.论述影响测量信度的主要因素。

（一）样本特征

1.样本团体异质性的影响

一般而言，若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。

2.样本团体平均能力水平的影响

测验的信度会由于不同团体间平均能力水平的不同而不同。

因为对于不同水平的团体，项目具有不同的难度，每个项目在难度上的变化累积起来便会影响信度。

（二）测验长度

1.测验越长，测验的测题取样或内容取样就越有代表性。

2.测验越长，被试的猜测因素影响就越小。

（三）测验难度

难度对信度的影响，只存在于某些测验中。

如智力测验、成就测验、能力倾向测验等；

对于人格测验、兴趣测验、态度量表等不存在难度问题，因为这些测验的题目没有正确或错误答案之分。

就难度与信度的关系而言，并没有简单的对应关系。

从理论上说，只有平均难度水平为50%时，才能使求得的信度最高。

事实上，难度为0.50只适合于简答题，对于选择题由于存在猜测因素，难度值应提高。

洛德提出在学绩测验中，为了保证其可靠性，各类选择题的理想平均难度为：

五选一测题：

0.70

四选一测题：

0.74

三选一测题：

0.77

是非题：

（四）时间间隔

时间间隔只对重测信度和不同时测量时的复本信度有影响。

以再测法和复本法求信度，两次测验相隔时间越短，其信度系数越大；

间隔时间越长，信度系数越低。

13.论述中国古代的教育测量思想与实践。

（1）中国古代的教育测量思想

心理特征差异性的思想

孔子——教育测量的思想

“性相近，习相远”

孔子说：

人（（或生命））先天具有的纯真本性，互相之间是接

近的，而后天习染积久养成的习性，却是互相之间差异甚

大

“中人以上可以语上也，中人以下不可以语上

也”

“具有中等资质或道德水平以上的人，可以

告诉他较高的学问或道理；

而具有中等资质或道德水平以下的人，不可以告诉他

较高的学问或道理。

”

心理特征差异性的可测量性的思想

孟子:

“权，然后知轻重；

度（（（duó

），然后知长短；

物皆然，心为甚”

（（孟子））说:

“用秤称一称，才能知道轻重;

;

用尺量一量，才

能知道长短。

什么东西都是这样，人的心更需要这样。

（2）中国古代的教育测量实践

教育测量的实践活动（（人才的评定和选拔））

1.科举取士制度----欧洲文官考试制度

商周时代:

礼、乐、射、御、书、数等六艺

汉代：

法律、军事、农业、税收和地理等五经

隋唐：

儒学经典

（（形式多样:

帖经、墨义、口义、策论等））

2.民间的智力型游戏

周岁试儿:

到现在，婴幼儿的动作测量

七巧板九连环——古代测智力水平的器具

国外著名的--河内塔问题

六艺

九连环的设计精巧性可与现代的魔方、魔棍等操

作性玩具相媲美，也可被视为较之现代认知心理

学中的河内塔任务更为复杂的操作性问题解决任

务。

被著名心理学家伍德沃斯称为“中国式的迷津”。

七巧板被著名心理学家伍德沃斯称为“唐图”，

即“中国的图板”之意。

七巧板类型的拼图任务现在几乎为当代的多数智

力测验和创造力测验所使用，并且已经发展成为

标准化的纸笔型测验。

3.三国时期，刘劭[shà

o]《人物志》

“考课核实”法、

“八观与五视”（（观察法）---被美国人翻译后，

名为《人类能力之研究》

4.韩非：

一手画圆，一手画方。

到现在用于测注意力

中国古代测量思想的特点：

描述性

分类式

注重整体评价，和人的道德品质联系起来

实用性

汉诺塔（河内塔）问题

河内塔是根据一个传说形成的一个问题：

有三根杆子AA，BB，CC。

AA杆上有NN个（N>

1）穿孔圆盘，盘的尺

寸由下到上依次变小。

要求按下列规则将所有圆盘移至CC杆：

每次只能移动一个

圆盘；

大盘不能叠在小盘上面。

提示：

可将圆盘临时置于BB杆，也可将从AA杆移出的圆盘重

新移回AA杆，但都必须尊循上述两条规则。

问：

如何移？

最少要移动多少次？

一位法国数学家曾编写过一个印度的古老传说：

在世界中心贝拿勒斯（在印度北部）的圣庙里，

一块黄铜板上插着三根宝石针。

印度教的主神梵（（fà

n））天在创造世界的时候，在其

中一根针上从下到上地穿好了由大到小的64片金

片，这就是所谓的汉诺塔。

不论白天黑夜，总有一个僧侣在按照下面的法则

移动这些金片：

一次只移动一片，不管在哪根针上，小片必须在

大片上面。

僧侣们预言，当所有的金片都从梵天穿好的那根

针上移到另外一根针上时，世界就将在一声霹雳

中消灭，而梵塔、庙宇和众生也都将同归于尽。

不管这个传说的可信度有多大，如果考虑一下把64片金片，

由一根针上移到另一根针上，并且始终保持上小下大的顺

序。

这需要多少次移动呢?

?

这里需要递归的方法。

假设有nn片，移动次数是f（n）.显然

ff⑴=1,f⑵=3,f⑶=7，且f（k+1）=2*f（k）+1。

此后不难证明f（n）=2^n--11。

n=64时，

ff（64）=2^64--1=18446744073709551615

假如每秒钟一次，共需多长时间呢？

一个平年365天，有31536000秒，闰年366天有

31622400秒，平均每年31556952秒，计算一下，

184********709551615/31556952

=584554049253.855年

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 教育测量评价

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：教育测量与评价Word文档下载推荐.docx
链接地址：https://www.bdocx.com/doc/18294115.html

教育测量与评价Word文档下载推荐.docx

热门标签