第二章 学业成就的传统评价.docx
- 文档编号:8301240
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:59
- 大小:56.77KB
第二章 学业成就的传统评价.docx
《第二章 学业成就的传统评价.docx》由会员分享,可在线阅读,更多相关《第二章 学业成就的传统评价.docx(59页珍藏版)》请在冰豆网上搜索。
第二章学业成就的传统评价
第二章学业成就的传统评价
学业成就的评价是教育评价中最重要的内容之一,而对学生知识掌握程度的评价侧重于纸笔测验。
因此,纸币笔测验试题编制品质的好坏直接关系到评价的可靠程度。
本章着重介绍试题编制中试题应具备的重要特征及各类题型所读有的命题原则和技巧,并且列举说明其编制的方法。
第一节 概述
学业成就是学生在学校教育中的主要成果,也是学生发展的重要目标。
因此,对学业成就的评价也就成为教育评价最重要的内容之一。
只有通过运用科学的方法,才能真正了解学生学习结果的真实情况,才能使教师了解是否达到了预期的教学目的,并明确教学中可能存在的问题,以便在以后的教学中不断改进,进一步激发学生学习的积极性和主动性。
本章将介绍有关学业成就评价中的传统的纸笔测试方式。
一、什么是学业成就传统评价
(一)学业成就传统评价的含义
学业成就的评价是指在一定的阶段性学习时间内进行的,对学生所获得的学习结果的测量与评价。
它所评价的内容是相对明确的,有利于教师发现教学中所存在的问题,以改进教学、提高教学质量、促进学生更好地掌握知识、并能适时地进行应用和迁移。
对学生学业成就的评价已成为学校教育教学过程中一个不可缺少的重要评价内容。
它是衡量教师教得如何和学生学得如何的一个重要标志。
对学业成就的评价大体可划分为传统评价和替代性评价两类评价方式。
其中学业成就的传统评价是指那些主要采用纸笔测试方法对学生在一定阶段的学习时间内的学习成效所进行的测量和评价。
(二)学业成就传统评价的特点
1.评价内容范围的明确性
学业成就评价涉及学生特定的知识和学习经验,而且一般以阶段性的学习时间为准。
所评价的知识内容也是在这一阶段性学习时间内获得的,是对学生阶段性学习结果的测量与评价。
2.评价的内容可反映学生对该内容的掌握程度,具有一定的代表性
评价的内容应与测验的目的相一致,要符合教学目标的内容,而且内容应具有一定的代表性和切实性,能够鉴别出学生的学习水平,激励学生学习的积极性。
3.评价条件具有同一性
评价过程中,各个学生所测试的内容材料都相同,而且有统一的时间限制和相同的指导语,都是评价学生在一定阶段性学习时间内对知识或技能的掌握程度,利于对学生评价的客观公正性。
4.评价方法相对成熟
在学业成就评价发展的历程中,评价的方法在理论上已得到了相当的完善和丰富,评价的方法也层出不穷,种类也较全面,在教育实践中的应用也十分广泛和深入,已取得了相当大的成果,为教育评价的发展作出了重要贡献。
(三)学业成就评价的意义
学生学业成就的评价对教师搞好教育教学工作,提高教学水平和教育质量都具有重要的意义。
1.诊断的功能
对学生学业成就的评价不仅可以了解与评价学生的学习结果,还可以用来评价教师的教育教学,使教师了解每个学生的学习状况,诊断学生在知识掌握和能力发展上的不足及所存在的问题,以便于教师因材施教和进行个别学习指导。
2.有利于对教师的教学提供有效的反馈信息
通过对学生学业成就的评价,教师可以及时了解学生的学习状况,达到诊断学生学习上的困难和评价学生学习进步的目的,同时还可以发现自己教学中所存在的问题,改进教学方法,调整教学计划和内容。
此外,也可以评定教学目标的完成情况和学生对知识的综合运用及迁移能力,为制定新的教育目标提供了有效的依据,利于增强教学的实效性。
3.有利于激发学生的学习动机
对学生学业成就的评价,能使学生更好地了解自己,进行自我评价,找出自己学习中的薄弱环节,调整和改进学习方法,为自己确定新的努力目标。
4.教育研究的功能
通过评价,教师能不断总结教育教学经验,改进教学方法,增强教学的实效性,为教学方法和教材的改革提供一定的实践材料,有利于教学改革。
二、学业成就传统评价的种类
学业成就传统评价的分类是一个相对的概念,按照不同的标准可以分为不同的种类。
(一)按测验的标准划分——标准化测验与教师自编测验
标准化测验是由专家或专业的测验发行机构编制的,测验的设计、编制、实施、评分及分数解释等一系列过程都依据统一的标准而进行。
标准化测验的试题取材广泛,题量多,涉及面广,具有较高的信度和效度。
它的难度适中,区分度高,施测、评分等都按一定的标准进行,因而具有客观性、真实性等优点,是学生学业成就评价的主要方式之一。
然而,标准化测验不易编制,有关的要求也比较高。
教师自编测验是教师依据实际的教学需要,为对学生的学习结果进行考查而自行设计与编制的测验。
它的编制较简单、灵活,使用范围广,可以针对不同情况的学生使用,贴近教学实际,有利于教师正确评价学生的学习成就。
当然,教师自编测验也要遵循一定的规则,才能达到真实评价学生的目的。
教师自编测验的信度和效度要求不如标准化测验那么严格。
表2-1教师自编测验与标准化测验的比较(王汉澜:
《教育测量学》,195页,开封,河南大学出版社,1987。
)
项目
教师自编测验
标准化测验
测验内容
根据各地实际使用的教材编写
根据统编教材编写,不反映地方教材特点
试题质量
未经预测和筛选,质量一般比较低
经过预测、题目分析和筛选等步骤,质量较高
测验信度
信度未知,一般在测验后用分半法求得
在0.89以上
施测与评分
可以统一要求,但不完全标准化
按指导语施测,用机器或记分器评分
分数的解释
按照某种标准或用被试在团体内的相对位置解释测验分数
与常模相比较,解释考生的测验分数
(二)按测验题目的特性划分——客观式测验与主观式测验
测验的试题可以客观地记分,不受主观因素的影响,而且答案唯一,这样的测验叫客观式测验。
客观式测验的试题形式多样,主要包括再认式的选择题、是非题、匹配题和再现式的填空题、简答题等。
客观式测验的优点是测试试题容易标准化,试题内容取材广泛,评分也客观公正,而且省时。
不足之处是只能评价学生一般的学业成就,而对较复杂的学业成就如学生语言文字材料的组织、表达能力,问题解决中的创造性等能力则难以胜任,而且也易受学生猜测因素的影响。
主观式测验是指传统的问答式测验,学生根据测验提出的问题自由作答。
它包括论述题、说明题、作文题等形式。
其中,论文式测验的优点是试题编制容易,学生可以充分表达自己对问题的理解和看法,可以有效地评价学生分析问题、理解问题、材料组织和应用等能力,而且学生回答的猜测因素较小。
其缺点是取材范围有限,代表性不强,评分易受主观因素的影响,客观性不足,而且也很费时。
尽管论文式测验有以上缺陷,但同时又有着客观式测验所不具备的优点,因此,在实际评价过程中不能简单排斥或取消这类测验题型,而应在不断改进试题及提高命题质量的基础上,将二者很好地结合起来,取长补短,配合使用。
(三)按测验的用途划分——形成性测验与终结性测验
形成性测验主要是指在教育教学过程中,教学者为了改进教学方法、提高教学质量而对学生进行的学习阶段及结果的评价。
它有单元测验、平时的随堂考试等形式。
形成性测验注重对学生学习过程中学习内容的评价,通过评价结果来调整教学内容或改进教学方法,使教学在不断的评价、反馈、改进中不断地完善;同时也有利于学生了解自己在学习过程中对知识的掌握程度以及自己的进步状况,便于学生自我评价、自我促进、自我提高。
形成性测验具有诊断和预测的功能。
形成性测验的测试过程比较频繁,可以是一周一次或是一单元一次等,但其测试的概括水平不高。
终结性测验是指在课程或一个教学周期结束时对学生学习结果的评价。
它主要评定学生的学业成绩,判定学生的学习是否达到教育教学目标的要求,同时也对学生的知识、技能及能力水平进行综合的评估。
终结性测验侧重于评价学生在较大范围内对知识的掌握程度,大多数是在形成性评价的基础上进行的。
它的取材内容广泛且具有一定的典型性和代表性,评价的频率不高,一般一学期或一学年两三次,如常见的期中考试、期末考试等。
但是它的周期太长,只是对学生学习效果的“回顾式”评价,不能适时地解决学生在学习中所出现的问题。
(四)按测验的特征划分——学科测验与综合测验
学科测验是测量学生在一定阶段时间内通过学习各门具体学科所获得的知识和技能的一种重要评价工具。
学科测验的种类很多,按科目来分,可以分为语文测验、数学测验、物理测验、化学测验等。
这类测验的试题具有基础性和全面性的特点,它们在概念与标准化上与其他任何学科的测验无关。
综合测验是包括不同学科内容范围、相互配合进行的成套测验。
此类测验用来测量各个教学阶段中学生在若干学科上所获得的知识与技能。
其优点在于编题计划的综合性,即把主要的知识、技能或各课程的主要内容设计到试题计划的各个组成部分中。
评价的结果既可以进行综合性比较,也可以为分科性比较提供依据。
(五)按测验的形式划分——操作测验与书写测验(纸笔测验)
操作测验主要考查学生实际的动手操作能力及知识的应用和迁移能力。
尤其在理、化、生学科方面比较突出。
操作测验的准备和实施很费时,而且评分也困难,测试的条件不易控制。
书写测验也叫纸笔测验,指以书面形式的测验工具评价学生学业成就或认知能力发展状况的一种评价方式,可分为再认式测验(如是非题、选择题、匹配题等)和回忆式测验(如填空题和简答题等)。
纸笔测验是教育者了解学生分析和有效解决各类问题、语言材料的组织和表达能力的有效手段。
在传统的评价中一般以纸笔测验为主。
三、有效评价的必备条件
作为测验工具的测验或量表是有好坏之分的。
判断一个测验是否有效,主要依赖客观的标准来衡量,而不能只凭主观经验来判断。
无论是心理测验还是教育测验,不管是标准化的测验还是教师自编的测验,都要考虑其效度、信度、难度、区分度等反映该测验质量特性的重要指标;否则,这一测验的代表性和可行性就会让人质疑,影响测验的效果。
(一)效度
效度是指一个测验所能测量的准确程度,即测量结果能否准确表达所测量的特征和功能。
一个测验的有效与否,关键在于它是否准确测量了其所能测量的内容。
效度是学业成就评价最重要的必备条件。
值得注意的是,测验的效度是相对的。
任何测验只是针对一定的目的而言才是有效的,而不存在对所有目的都有效的测验。
因此,在测验中,测验的试题必须依据一定的教学目标而定,而且取材应具有典型性和代表性,能对学生的评价起到诊断和预测的作用。
(二)信度
信度是指一个测验的一致性程度,即测验的可靠性程度。
它是表明评价工具质量的另一个重要指标。
信度和效度是相互关联的。
一个测验对于某个目的具有一定的信度,但它不一定是有效的;而一个测验对于某个目的是有效的,那么它一定是可信的。
在学业成就的评价中,必须保持测验的准确性和可靠性。
因此,在测验实施的整个过程中,必须要使试题的编制和评分具有良好的可靠性。
编制的试题必须符合学生现有的心理特点,而且试题的内容应在大纲要求的范围内取材。
同时,对试题进行评分时,评分者应客观公正,持相同的评价尺度,尽可能地增强评价的信度。
(三)难度
难度是指试题的难易程度。
测验中,试题应具有一定的难度。
只有这样,才能达到评价学生的目的。
但是,难度也不应过大,一般难度值在05左右为宜。
难度值通常用答对或通过测验的人数比例来衡量。
(四)区分度
区分度也叫鉴别力,它主要指测验将不同水平的被试区别开来的能力,反映了测验与被试实际水平的符合程度如何,而且它与难度紧密相关。
测验的难度过大或过小,都不利于正确地评价学生,而且这时测验的鉴别力也毫无意义。
四、学业成就传统评价设计的原则
无论标准化测验还是教师自编测验,都侧重于书写测验即纸笔测验,它们所包含的试题类型也大致相同。
为了更好地对学生的学业成就进行评价,提高评价的有效性和针对性,在采用纸笔测验时应明确以下设计原则。
(一)试题的分布必须依据双向细目表,而且题目陈述的内容要有一定的代表性
对于测验编制者而言,细目表就像是“蓝图”,它详细说明了测验试题的数目、内容和性质,可以作为编制试题的指导。
因此,在试题的编制过程中,试题的分布必须符合双向细目表的要求,而且,试题陈述的内容也要具有一定的代表性,这样才能编制出一份很好的测验。
(二)试题的陈述应清晰、明了,避免使用含混不清的表达
在测验中,试题的陈述要清楚、明了,而不能含糊其辞,致使学生老是停留在理解题意上而不能作出正确的回答,影响对学生学业成就的正确评价,达不到评价的最终目的。
(三)试题题目的陈述要简明、扼要,突出重点
试题中,题目的遣词造句要明确,问题叙述要完整,且重点突出,这样有利于学生的正确作答,提高作答的效率,否则学生在解题上会花费过多的时间。
(四)试题所使用的材料应切合教学目标且符合学生现有的身心特征
试题中所涉及的知识内容应符合学生身心发展的特征,并切合教学的目标。
另外所使用的指导语、试题的类型、作答方式等都应符合学生的现有程度,不要让学生因看不懂题目而不会作答。
(五)明确指导语,表述应清楚,便于学生作答
指导语包含对测验目的的说明和如何作答、如何施测的指示。
因此,测验中,试题的指导语应清晰、明确地指出对学生作答的要求、时间的限制等,让学生明确具体的要求,而不至于盲目作答,这样有利于提高测验的效率,达到正确评价学生学业成就的目的。
(六)答案必须是公认的正确答案,应避免有争议答案的存在
试题编制应严密,保证答案的唯一性和公认性,而不应是有歧义或争议的内容,至少在一定程度上符合既定的规则。
(七)各类试题应是相互独立的,在内容上不应有重叠
在测验中,各试题类型间是相互独立的,而且兼顾教学目标的具体要求,在内容上也不应有重叠,这样编制的试题才能从整体上和局部上都能反映出所要评价的学生各方面的层次,从而能对其学业成就的评价提供正确的依据。
(八)试题陈述中避免提供暗示性的语句
测验中,试题应清楚、确切,题目中不能潜藏着答题的线索,特别是在描述中应避免具有暗示性的特殊字词。
这些暗示性的字词很容易被学生当做线索来猜题,从而使学生的作答受到影响,影响对学生的正确评价。
(九)试题应具有良好的鉴别力,利于教师正确评价学生
试题应具有良好的鉴别力,能够很好地达到评价者的目的,能具有分辨、筛选、诊断和评鉴的功能,达到正确评价学生学业成就的目的。
小结
学业成就传统评价的类型很多,从不同的角度和标准可以划分出不同的评价种类。
它们大多是侧重于对学生知识掌握的评价,在教育评价中具有重要的作用和意义。
一份良好试题的编制必须具备良好的特征(如信度、效度、难易适中、高鉴别力等)和相应的命题原则及技巧,这样才能很好地考查学生对知识的掌握程度。
第二节 客观式测验
测验题目是构成测验的基本元素,题目编制得恰当与否直接关系到整个评价的好坏。
为此,从本节开始将介绍有关纸笔测验试题的类型、特点及设计命题的要求、原则和技巧。
为了保证测验试题的高质量,教师在自编成就测验时,应严格遵循下列各类题型的设计命题要求,降低试题品质的不良率,增强试题的鉴别力和有效性,从而真正达到评价的目的。
一、什么是是非题
(一)是非题的含义及使用
是非题也叫二项选择题、正误判断题。
它基本上是只有两个选项的选择题,当选项只有两种可能性时,出是非题比选择题更适合。
是非题一般是由陈述句组成的,其基本形式是提供一个叙述,让学生判断叙述正确与否。
常见的是非题的变形有丛集题型(clustervariety)和改正题型(correctionvariety)。
丛集题型也称多重是非题(multipletrue-falseitems),它提供一个题干,根据题干,设计若干对或错的答案叙述供学生判断。
改正题型要求学生对叙述所强调部分(通常是字或词)的对错作判断,并将错误的部分加以改正。
下面是两个是非题的示例。
例1
指导语:
阅读下列命题,并作出判断。
正确的在题号前的括号内画“T”,错误的画“F”。
(F)1.只有一对对边平行的四边形是菱形。
(F)2.《中俄尼布楚条约》是中国历史上的第一个不平等条约。
(F)3.某数的80%是200,那么该数比200小。
例2(选择题的变例,只有一个题干和多个对与错的陈述,即多重是非题。
)
下面是关于等边三角形特点的叙述,正确的在题号前的括号内画“T”,错误的画“F”。
(T)三个内角都等于60°。
(T)任意一内角的平分线都是对边的中线。
(T)任意一内角的平分线都是对边的高。
(F)面积等于两边乘积的一半。
一般而言,是非题最适合考查学生对基本概念、性质、原理定则等的认知和判断能力。
对低年级儿童的思维能力及对态度、兴趣等方面的测验等不宜采用是非题。
(二)是非题的优点及不足
是非题可以说是一种简化了的选择题,它在编制与使用中具有这样一些优点:
(1)与选择题相比,是非题的编制较容易,评分也客观、公正;
(2)是非题的作答迅速,能在较短时间内考核较多的教学内容,效率较高;(3)可以和解释性试题连用,来测量学生更高水平的认知能力和复杂的学业成就;(4)是非题的命题内容很广。
但是,是非题也有其不足之处。
(1)猜测因素很强。
由于是非题只有两个选项,即使学生对命题的内容一无所知,也有50%的机会猜对答案,不能真正反映出学生对知识的理解和掌握程度,而且很容易使学生在学习中产生侥幸心理,从而导致教师对学生实际知识的评价失真,使得评价的鉴别力低,信度也不高。
(2)虽然是非题的命题内容广泛,但很难编制出能测量较高层次的认知能力的试题。
是非题一般适用于测量学生较低层次的认知能力,如判断概念、定律或规则的是与非,而对较高层次的认知能力目标就难以测量。
为了提高是非题的信度和鉴别力,可以采用以下方法来减少学生对试题的猜测因素。
(1)当所有的学生都不知道正确答案时,鼓励他们都去猜测。
由于学生的猜测行为是不可阻止的,所以只有让所有学生都去猜测才能平衡猜测效应。
(2)要求学生改正错误。
运用这种方法时,在每个选项后面都留出一点空隙,如果学生判断题项有错误,就在空隙处给以改正,并要求学生把不正确的部分用横线标示,写出正确的内容。
(3)鉴于是非题存在的不足,可采用将是非题与说明题相结合的办法。
这种方法既让学生判断,又让其说明理由,既可以减少学生猜测的机会,也可以测量学生较高层次的认知能力。
([美]G.D.Borich&M.L.Tombari:
《中小学教育评价》,81页,北京,中国轻工业出版社,2004。
)
例1
判断下列陈述,正确的在题号前的括号内画“T”,错误的画“F”,并改正。
(F)Televisionisrapidlybecomingtheliteratureofourperiods.(time)
(F)闰年的八月都要加一天。
(二月)
(T)造纸术是中国古代的四大发明之一。
例2
判断下列陈述,正确的在题号前的括号内画“√”,错误的画“×”,并说明理由。
(×)太阳由西方升起,东方落下。
理由:
(三)是非题的设计
鉴于是非题自身的特点,为了教师能够编制出高质量的是非题试题,发挥其鉴别的功能,教师在编制试题时应遵循以下命题要求。
1.应尽量避免用否定句,尤其是双重否定
学生在答题时很容易忽视否定陈述中的否定词,从而导致判断错误。
双重否定则使叙述的语句模糊,从而增加了学生对内容理解的不确定性。
在不得不使用否定句来陈述时,应突出强调否定词眼,起到提醒的作用。
【不良试题】
(T)几乎不可能没有一个人在其成长过程中不曾遇到挫折。
【修正试题】
(T)几乎每一个人在其成长过程中都曾遇到挫折。
2.避免使用具有暗示性的字词或特殊的限定词句
避免在题目的陈述中使用“所有”“通常”“只有”“可能”等词。
【不良例题】
(F)只有考上重点高中,才能考上名牌大学。
3.每一题只能包含一个核心的概念
应避免两个或两个以上的概念在同一试题中同时出现,而造成“似是而非”的情形,干扰学生的判断及回答。
【不良例题】(叙述中的概念,一个是对的,另一个是错的)(余民宁:
《教育测验与评量:
成就测验与教学评量》,155页,台北,心理出版社,2002。
)
(F)妯娌是属于姻亲关系,而叔侄是属于直系血亲关系。
【修正例题】
(T)妯娌是属于姻亲关系。
(T)叔侄是属于旁系血亲关系。
4.题目的陈述应简洁
是非题中,试题题目陈述的内容应当简洁、明了,尽量使用简单句来表述,避免使用复杂的句法结构,否则会使其变成阅读能力的测验,而达不到测试的目的。
【不良例题】([美]R.L.Linn&N.E.Gronlund:
《教学中的测验与评价》,104页,北京,中国轻工业出版社,2003。
)
(T)尽管在判断溶液的pH值时存在理论和实验方面的困难,我们还是有可能通过将石蕊试纸插入溶液视其颜色变化来判断其酸性。
【修正例题】
(T)石蕊试纸在酸性溶液中变红。
上面的例子中,我们完全可以去掉那些无用的部分,保留重要的观点即可。
也可以改变句子的句法结构使句子变得简洁、明了,利于学生正确作答。
5.试题正确与错误的题数应大致相同,且以随机排列的方式呈现
是非题很容易造成学生猜测作答。
当学生遇到不会做的试题时,就会作出猜测。
因此,为了避免学生作答时盲目猜测,在编制试题时,应尽量让正确与错误的试题数大致相同,防止因学生猜题而造成能力评价的误差。
正确与错误的试题应按随机的方式呈现,以降低学生猜测的倾向。
6.试题的表述应清晰、明确
是非题中试题的表述要清晰、明确,不能含糊其辞、“或左或右”,否则会影响学生作出正确的评判。
7.试题中的陈述应避免直接使用教材中的原话
试题的取材不能一成不变地引用教材的内容,应适当地加以组织加工,以达到评价学生能力的目的,而不至于只评价学生的再认能力。
8.避免使用没有任何来源的观点,意见性的陈述必须指出参考资料的出处或依据
一般情况下,意见性的陈述并无对错之分,不能让学生把它视为事实来作答。
因此,为了避免有争议,在凡涉及相关的个人意见、观点等时,都应列出其来源或依据,这样材料才具有说服力。
【不良例题】
(T)五权分立的政府比三权分立的政府要好。
(余民宁:
《教育测验与评量:
成就测验与教学评量》,158页,台北,心理出版社,2002。
)
【修正例题】
(T)根据孙中山先生的观点,五权分立的政府比三权分立的政府要好。
二、什么是匹配题
(一)匹配题的含义及使用
匹配题(matchingitem)是由两列词或短语组成的,要求学生将一列中的每一条与另一列的相匹配,又称为配对题。
需要从另一列中找到对应信息的项目称为前提项,从中作出选择的那部分称为反应项。
两列项目数完全相同的称为完全匹配题,不相同的称为不完全匹配题。
凡是学习结果强调的是判断两种事物之间联系的能力,并且有同质的前提项和反应项,那么就可以使用匹配题。
一般认为,比较重要的联系有:
([美]R.L.Linn&N.E.Gronlund:
《教学中的测验与评价》,106~107页,北京,中国轻工业出版社,2003。
)
人物……成就 日期……历
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 学业成就的传统评价 第二 学业 成就 传统 评价