增值性评价的回顾与前瞻Word文件下载.doc
- 文档编号:14920597
- 上传时间:2022-10-26
- 格式:DOC
- 页数:4
- 大小:36KB
增值性评价的回顾与前瞻Word文件下载.doc
《增值性评价的回顾与前瞻Word文件下载.doc》由会员分享,可在线阅读,更多相关《增值性评价的回顾与前瞻Word文件下载.doc(4页珍藏版)》请在冰豆网上搜索。
这种单一的评价方法反映的信息并不准确,已受到各方面的批评。
为更加科学和准确地评价学校和教师的效能,教育评价领域迫切需要一种新的评价方法。
近三十多年来,教育评价领域逐渐兴起一种新的评价方式——增值性评价(value-addedAssessment)。
一、增值性评价的起源和发展
针对学校效能的增值性评价起源于詹姆斯·
科尔曼1966年向美国国会提交的《关于教育机会平等性的报告》,简称“科尔曼报告”(ColemanReport),该报告虽然没有直接提出学校效能的增值性评价问题,但其研究结论却引发了世界范围内对学校效能的争论,催生了学校效能增值性评价的出现。
自20世纪70年代以来,以“科尔曼报告”为起点,学校效能的增值评价研究在世界范围内逐渐发展起来。
20世纪80年代中期以前,增值性评价的应用一直受到统计技术发展水平的限制。
80年代末,多水平模型技术的发展与完善,为增值性评价提供了精确可信的分析方法。
由于英美两国统计技术的发展以及现实的强大需要,多水平模型和增值性评价方法率先在这两个国家得到了充分的应用。
1983年,《国家处于危机之中:
教育改革势在必行》(ANationatRisk:
Theimportancefnredueaionalreform)报告的出台,美国全国上下对教育状况的关注水平空前提高。
1989年,美国总统召开五十州州长教育峰会,思考教育问题,制定行动方案,并最终形成了六项国家教育目标。
随后,为响应新的教育目标,美国各州掀起教育改革的热潮,并提出了学校问责制的概念。
1992年,应此热潮,田纳西州政府率先采用增值评价系统作为州教育促进法案的一部分。
达拉斯州也从增值的角度探讨了判断高效能学校的量化程序,并发展了适用于该州的增值性评价系统;
此外,北卡罗莱那州、德克萨斯州等也将增值性评价应用于其教育问责制主体框架之中。
随着联邦教育法《不让一个孩子掉队》(NoChildLeftBehind)的出台,增值评价受到越来越多教育工作者的认可和政策制定者的青睐,正逐渐成为美国教育评价的主流方式。
在英国,20世纪80年代末以来,政府每年都公布所有学校以原始分数表示的学生成绩排名表。
由于原始分数没有考虑影响学生成绩而学校自身又难以控制的因素,如生源质量等,因而不能公正、客观地反映学校效能。
为解决评价上的问题,研究者提出了“增值”概念。
英国的增值性评价同美国类似,也是首先从地区水平上发展起来的。
国家统一课程的建立及链接国家数据的新资源的出现,为增值性评价在整个国家内推行提供了可能。
英国政府于20世纪90年代接受了增值评价法,2002年在全英格兰和威尔士推行学校效能的增值评价模式,2004年和2005年试点,2006年全面开展学校效能的“多元”增值评价,并将增值评价指标作为一项重要的创新性指标加入到现有的评价指标体系中。
此外,随着增值性评价理论的完善,统计技术和相应软件的发展,这一评价方法也逐步在其他国家和地区推广和实施。
二、增值性评价的概念与主要特点
在教育评价领域中,增值性评价是指通过追踪研究设计,收集学生在一段时间内不同时间点上的标准化测验成绩;
基于学生自身测验成绩的纵向比较,并考虑其他不受学校或教师控制的因素对学生成绩的影响(如学生的原有成绩水平、人口学因素、家庭背景信息以及学校周围地区的经济发展水平等);
使用多水平模型对数据进行统计分析,可以将上述因素对学生成绩的影响与学校或教师对学生成绩的效应分离开来,追踪学生在一段时间内学业上的变化,考察学校或教师对学生学业成绩影响的净效应,进而实现对学校或教师效能较为科学、客观的评价。
与以往基于平均测验分数的横断性评价相比,增值性评价具有如下显著特点:
第一,增值性评价实现了关注点的变化。
教育评价中,最常用的评价方式是使用学生成绩原始分数的平均分或升学率作为评价指标,确定学校或教师的工作是否有效。
有研究发现,使用原始分数作为学校或教师效能的指标是不准确的,甚至会有误导作用。
此外,这种评价方式导致人们过于关注一次考试的结果,过分关注少数尖子生的培养,忽视了大多数学生的发展,损害了教育过程中的公平性。
而增值性评价则是基于每个学生的进步来计算学校或教师对学生学业增长的影响,这样就使学校和教师的关注点从个别学生身上转移到更加实质性的问题——每个学生的进步状况如何。
第二,增值性评价保证了更加公平的比较。
增值性评价将每个学生的当前成绩与过去成绩进行比较,关注学生的进步和成长,而不是学生成绩的绝对水平,从而改变了以往将学生的学业成绩与平均值或任意制定的标准进行比较的做法。
由此对学校或教师效能的评价都是基于学生的进步或增值,这一评价标准的确立,实现了教育评价过程中比较的公平性,有利于激发生源质量差的学校促进学生进步的动力。
第三,增值性评价与绩效责任紧密相连。
问责制目前已成为各个国家进行学校效能研究的主要方面,它要求使用学生标准化测验的成绩作为评价对象,以使教育对学生的学习成果负责。
评价是问责制的重要组成部分,评价的科学性直接关系到问责制实施的效果。
增值性评价本身的特点,为问责制提供了一个良好的评价框架,能够提供对学校和教师更为公平的考察。
第四,增值性评价具有潜在的诊断性功能。
单纯的增值性评价不能识别学生成绩差的原因,但是增值性评价是基于追踪设计的研究,因此它能够根据详尽的数据描述识别出学生的成功与失败之处,这将成为学校和教师发现问题作出决策的起点。
此外,利用增值性评价的信息,可同时为教师提供形成性评价和终结性评价的信息,从而为教师的自我提升提供依据。
第五,增值性评价能够满足所有学生的需要。
增值性评价的基本理念是学校和教师应该保证所有水平的学生都以相同的速率取得学习上的进步,即每个学生在一年内的学业增值幅度应当相同。
这就要求学校和教师不能只关注成绩好的学生,而要兼顾所有学生的发展和进步。
根据每个学生的需要,采取相应的教学措施,从而促进每个学生的进步,满足所有学生的需要。
三、增值性评价的模型
增值性评价方法发展初期受到统计方法发展水平的限制,但随着相关统计方法的发展,增值性评价方法的统计技术也随之得以完善。
目前应用于增值性评价的主要统计模型如下:
(一)概要统计分析
概要统计分析是描述统计分析的一种,它使用一系列描述性统计量对数据的概貌进行描述,如最大值、最小值、平均值、中数、众数、方差、标准差、偏度和峰度等。
增值性评价的分析使用学生原始成绩的平均数作为增值性指标,如美国北卡罗来纳州将某学校学生群体连续两年测验成绩的平均增长与本州学生测验成绩平均增长的差值,作为该校的增值指标。
这种增值性分析方法使用学生两年内的平均成绩增长作为指标,较传统的依赖于一次测验成绩所进行的评价更加科学、全面,但是其中学校是统计分析的最小单位,因此学生层面和学校层面的其他影响因素没有得到应有的关注,仍是对数据的简单利用。
(二)多元线性回归分析
多元线性回归分析是分析一个因变量与多个自变量之间线性关系最常用的统计方法,这一方法是估计观测值与期望值之间残差值的标准统计技术。
以学生水平的数据分析为例,残差值可以解释为某位学生的成绩是高于期望值还是低于期望值,这里期望值是基于样本中所有学生的基线成绩与其学习成绩间的统计关系基础上的。
通过多元回归分析得到的残差值,即学生在一段时间内学习进步的“增值”。
与概要统计分析相比,这一方法的优点是可以将学生或学校层面的各种影响因素纳入到统计模型中加以分析,如学生的基线成绩、学生的家庭背景信息或学校层面的变量等,从而提供一个更为灵敏的增值指标。
但是这一方法的缺点是,统计分析只能从学生层面(估计学生层面的残差)或学校层面(估计学校层面的残差)中两者择其一。
因此,如果选择前者为分析单位,那么就无法利用学校群体特性的信息;
而如果选择后者为分析单位,则会丧失学生层面的详细信息。
(三)多水平分析模型
多水平模型是针对传统的多元回归分析的不足发展起来的。
教育和组织管理等领域的研究中,存在着大量的分层数据结构,如学生嵌套于班级,班级又嵌套于学校等;
为了充分利用各个层面的数据信息,迫切需要一种新的统计方法,多水平模型就这样应运而生了。
以教育评价领域的研究为例,多水平模型通常将学生水平的数据作为第一层,将学校水平的数据作为第二层加以分析。
McCaffrey等人总结了三类用于增值性评价的多水平模型,包括协变量校正模型、增长的重复横断模型、交叉分类模型。
在上述模型的基础上,McCaffrey等人提出了一个学生纵向成绩的广义模型,上述模型均可作为该广义模型的特例。
其中,前两个模型可以使用标准的多水平模型软件进行分析(如HLM),并且得到了广泛的应用;
而其他的模型则需要专门的软件,由于其计算的复杂性,还没有得到广泛的应用。
多水平模型的学校或教师的增值指标是模型中的学校或教师水平对应的残差值,使用的估计方法是限制极大似然估计法,这一方法是基于广义最小二乘法和最佳线性无偏预测实现的。
用于分析多水平模型的增值指标的统计软件主要有HLM、MLwin、Lisrel、M-plus、R统计软件以及SAS等。
增值性评价的多水平分析模型充分利用了学生层面和学校或教师层面的数据信息,能将影响学生成绩的外部因素(如学生的前测成绩、家庭背景、学校或教师层面的外部信息等)与学校或教师的效应分离开来,得到学校或教师的“净效应”,实现对学校或教师效能的科学评价。
但是,这一方法的估计程序较为复杂,对于那些没有专业背景的家长、教师和学生来说不易理解;
此外,估计的过程中可能存在不收敛的情况,这样估计就无法进行,也无法实现对学校或教师效能的评价。
四、增值性评价目前仍需解决的问题及发展趋势
增值性评价作为一种新的教育评价思路,近年来得到越来越广泛的关注,并引发了大量的相关研究。
它为传统的教育测验分数的分析提供了新的视角,能够实现对学校和教师效能的客观评价。
但是作为一种新的正在发展中的方法,它自身仍然存在一些问题。
第一,目前增值性评价存在几类多水平统计分析模型,这些统计模型对学生数据的处理方式不尽相同,那么到底哪种模型是最佳模型,能够实现对学生成绩的科学分析与分解,需要进一步的研究。
此外,虽然复杂的统计方法能够实现良好的统计控制,但是不容忽视的是,统计方法自身存在对现实世界的解释力问题,这在一定程度上削弱了这种新的评价方法的应用与推广。
因此,如何借助教育统计的相关研究,既能够深入理解教育问题,又能够产生对现实问题的合理解释,成为增值性评价研究的一个核心问题。
第二,增值性评价采用追踪测验的研究范式,必然产生庞大的数据库系统,因此数据处理的技术支持以及各个数据库之间的有效链接和整合也成为应用者必须要思考的问题。
此外,在追踪数据的分析中,不同年份测验的等值是增值性评价的基础。
在前述的几种增值性评价模式中,有的采用简单常模参照式处理方式,即将多年的测验分数都转换到同一常模量尺上,有的则忽视了这一问题。
这两种处理方式显然都存在严重的问题。
这一问题的最终解决也同样需要借助教育与心理测量研究的发展。
近年来引起广泛关注的垂直等值,即多年追踪数据的等值方法,有望成为该问题解决的突破口。
第三,增值性评价解决不了所有考试领域都面临的一个难题:
很难区分学生真正的学习和为了考试而学习的问题。
为了提高测验的成绩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 增值 评价 回顾 前瞻