语文评价考试标准等crosoft Word 文档Word文件下载.docx
- 文档编号:22281488
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:17
- 大小:26.14KB
语文评价考试标准等crosoft Word 文档Word文件下载.docx
《语文评价考试标准等crosoft Word 文档Word文件下载.docx》由会员分享,可在线阅读,更多相关《语文评价考试标准等crosoft Word 文档Word文件下载.docx(17页珍藏版)》请在冰豆网上搜索。
区别主要有:
..使用对象不同:
课程标准主要面向教学人员、教材编写人员和教学评价人员,课
程标准规定的国家教育质量在特定教育阶段应达到的具体指标,必须通过教师教
学、教材和教学评价,才能实现预先的目标。
考试标准面向教学人员(包括教师
和命题者),但更是为了面向考试的主体——学生,便于学生在复习迎考中,了解
该考试的内容,要求和形式等相关信息,增强复习针对性,充分发挥自己的真实
水平。
..性质与功能不同:
课程标准具有法规性,教材编写、教师教学、课程评价都必须
遵循课程标准的各项规定。
课程标准的重点是对国民素养的基本要求做出规定,
因此对教材编写、教师教学和学业评价的影响是间接的、指导性的、弹性的,给
教材编写和教学留有一定的空间。
考试标准则是指令性的,往往作为行政指令颁
发,而且指向特定的考试,特定的考试命题、管理与评价都必须遵守考试标准的
规定,对教学的影响也较为直接。
课程标准的权威性远远高于考试标准。
..可测程度不同:
课程标准对课程目标、课程内容、评价等内容往往较为原则化,
是否可以测量,如何测量,不是它的重点考虑问题。
而考试标准就是使课程标准
中各项原则性规定转化为可以测量的考试目标。
因此,考试标准更加强调可测性,
一定要便于考试命题、考试复习领会和理解各项考试要求。
..稳定程度不同:
课程标准一旦制定与颁发,相对而言,比较稳定。
考试标准由于
是指向特定的考试,虽然也要求在一定时期内表示相对稳定,但容易随着考试性
质、考试环境、考生群体水平的变化而变化。
(2)教材与考试标准的关系
过去,在“一纲一本”模式下,教学大纲不仅对教学目标和教学内容做出了清晰明确
的规定,而且还规定了知识点的具体要求。
多数教学大纲还规定了详细的教学顺序,以及各
部分内容分别占几课时等,教材编写也完全依据教学大纲的各项规定,因此教材在一定程度
是解释和落实教学大纲的范本,又是学生学习教学大纲规定内容的唯一材料,很多时候出现
“以本代纲”的想象,很多考试标准都是直接依据教材。
然而现在,我国实行“一标多本”的多样化教材管理政策,象上海初中阶段,语文和
英语学科就分别具有两套教材。
政策上国家只制定一个课程标准,只要根据课程标准可以编
写多套教材,而且义务教育的课程标准应适应普及义务教育的要求,让绝大多数学生经过努
力都能达到,也就是说课程标准只是一个最低限度的要求,是一个基本性的要求。
课程标准
所规定的课程目标都是教学所要达到的阶段性目标,不强调知识点的先后顺序,这也为教材
编写提供了广阔的空间。
教材是对课程标准的一次在创造和在组织,显然它跟课程标准的一
致性不如以前在“一纲一本”模式下教材与教学大纲那么强,甚至与课程标准的各项要求或
规定有一定的差距,比如出现高于课程标准的要求等情况。
就上海目前的初中阶段的数学教
材,由于其惟一性,是学生学习课程标准规定内容的重要材料,教材在考试标准的制定过程
中仍有一定的参照作用。
(3)考试标准的结构
..考试性质:
主要阐述考试的性质及相应的功能、作用以及考试的对象;
..考试的目标:
对考查的知识范围及能力的具体表现作出界定;
..考试内容及要求:
对考核的知识条目以及要求两个维度进行具体描述;
..考试结构及细则:
说明试卷的结构,包括各块内容、试题类型等项目的分布比例;
..题型示例:
根据考试形式中规定的试题题型,每个题型提供若干个典型试题,以便学生
了解考试的考核方法和要求。
..样卷:
根据考试形式对试卷结构的各项规定,提供一份典型试卷、参考答案,以便考生
更加直观地了解和适应该考试,克服复习迎考中的盲目性,发挥真实水平。
试卷设计及整合编制
(1)考试蓝图
作为试卷编制的原则之一,在试卷编制前必须先要设计试卷的蓝图,并依据试卷蓝图着
手进行具体的命题工作。
设计试卷蓝图也就是试卷的设计。
通常试卷设计的工作可分为两个
步骤去完成。
首先依据考试的目的、性质,在分析课程标准课程目标及学习内容、要求的基
础上,先制定出考试命题的多维细目表,初步勾勒出整个考试的设计蓝图,如后面的表:
表1反映了试题与考核目标,考试内容与认知层次之间的关系,同时兼带了对每道难度
的控制,从而对整卷易中难试题比例的大体控制。
表2是对表1中的题量及分值进行整理。
表3对表1中知识块面在题量、分值进行整理。
其中根据考试标准中对试卷结构的描述,在
试卷命制的开始,先对各个知识块面权重进行进一步细化,同时随着命题的逐步展开将上述
表格相应数据充实。
这里就涉及到试卷设计的第二步,就是将蓝图中的考试内容和题型的使
用与考试目标相一致起来,并具体化。
整个蓝图形成、完备的过程,既体现了考试标准中对试卷结构的规定,同时对试题所
含的知识内容及其所要求的认知层次进行监控。
这些考试蓝图的存在的主要作用为:
..便于命题人员的编题操作,保证整卷的质量控制。
既保证了在考试标准中所规定
的试卷结构能得到确实地实现,在大大减少命题人员编制试题的盲目性和个人的
随意性的同时,即保证全卷考查知识覆盖面,又有利于试题发挥其积极的考查功
能,突出考查重点,确保考试目标的实现;
..便于审题人员的审核。
审题人员根据上述所呈现的考试蓝图,依据考试标准,逐
条对照,对发现的问题,有的放矢的提出修改甚至更换意见,促进试卷与考试标
准的一致性,有利于提高试卷的质量。
..便于对试后结果的效度进行评价。
没有这考试蓝图,评价就缺少了参照物,有了
这个考试蓝图,就可以对考试成绩进行更为细致、深入的统计分析,收集、归纳
考生的案例进行质性分析,对命题技术和试卷质量进行评估。
总之,考试蓝图的存在和细化极大减少命题的随意性,为考试对自身的质量提供了保障,
同时对试后结果的效度的反馈提供有利的依据。
试题、试卷质量分析
由于在初中数学的教学中,初步涉及到了数据的整理和相关图表(折线图、扇行图、条
形图、频数分布直方图、频率分布直方图)的表示,以及如平均数、加权平均数、中位
数、众数、方差、标准差的概念及相关应用,所以在这里不再具体展开说明。
(一)试题难度和区分度分析
1、难度
难度主要用于对试题质量的评价,其计算公式和计算方法如下:
(1)难度指数:
难度是衡量试题难易程度的指标,它的大小用难度指数来表示;
(2)难度的计算:
计算试题难度指数的基本公式是:
iiixpw=………………………………………………(公式1)
其中ip是指试题i的难度指数;
ix是指参加考试的全体考生在试题上的平均得分;
是指试题i的满分分数。
iiw
对于全卷的难度指数,可以用如下公式:
xpw=………………………………………………(公式2)
其中p是指全卷的难度指数;
x是指参加考试的全体考生在试卷上的平均得分;
w
是指试卷的满分分数。
(2)难度分析
从公式1中看出,试题的难度指数越大,该题的平均得分就越高,表示该试题越
容易。
反之,试题的难度指数越小,试题就越难。
同时试题难度指数的取值范围在[0。
难度指数一定程度上会影响到考试成绩的分布形态。
如果一份试卷中的试题普遍较难,
那么学生的成绩就普遍偏低,考试成绩的分布就会呈现正偏态。
反之,若试题普遍偏易,
考试成绩的分布就会呈现负偏态。
如果试卷的难度指数接近0.5,则该试卷整体表现出
较强的鉴别力,考生的成绩的离散程度较大,这对于具有选拔功能的升学试卷是很有利
的,但对于学业考试,具有水平评定功能,标准参照测试,则整卷的难度控制在0.75—0.85
比较合理的。
1]
鉴于试题训练的强度和广度,特别对于我们这个考试大国,对于如学业考试这样大
规模的考试,学生针对这考试的训练肯定非常多,这就使得学生对很多试题的形式,甚
至知识点的组合、解决问题策略及方法的使用,都非常熟悉,这也导致试题中即使试题
中知识点很多,解决问题的策略很复杂,但学生还是容易在该类试题能取得较高的分数。
在试卷的编制过程中,我们鉴于上述的现象,更注重试题相对于学生应试时的难度,我
们称之为“相对难度”。
一定程度上也反映出试题难度对考试群体的严重依赖性。
对于影
响试题相对难度的要素,归纳起来,大致有如下几个:
..试题的指示词、材料、情境对解题的提示程度;
..试题设问的角度和措辞
..解题的思维量的大小及繁简程度;
有些材料上又称之为:
推理的转折数及运算
量,推理的转折数即逻辑推理过程中因果转换的次数,一般的说,转折数多题
目难;
试题的解答的运算量大的试题,学生往往由于运算失误容易丢分,造成
试题难度指数下降。
..试题的“新鲜度”:
通俗的讲,即试题的“面孔”熟不熟,如果对于考生,试题“面
孔”比较熟悉,上手往往比较快,问题的正确解决策略或方法的选择往往比较
块,容易得分;
反之则不易得分。
..对于选择题,错误答案的迷惑程度及正确答案的隐蔽程度
..评分标准的宽严程度。
(3)难度的预估
为了有效控制试题的难度,以至控制整卷的难度,在命题过程中必须对试题的难度
进行预估。
一般在命题中,我们往往采用专家系统难度综合评估的办法。
事先收集应届
考生学习状况的信息,同时提供相关试卷中试题的各项统计参数。
由命题教师根据当前
命制的试卷中每一试题难度要素的强弱进行分析,同时结合上述信息和参数综合考虑,
作出试题难度的群体估计,最终出来专家独立估计后,去掉最高和最低的分值,对剩下
的估计值计算出平均数作为该试题的难度预估,进而对试卷难度分布和试题难度进行调
整。
同时对于命题人员在整卷试题上难度估计的分布与最后试卷试题实际的难度指数分
布之间的一致性进行量化,为命题人员的素质正确评定提供了有利的量化指标。
学业考试试题难度预估表
题号
赋分
难度估计
专家1
专家2
专家3
专家4
专家5
平均
得分
4、区分度
区分度也用于对试题质量的评价。
区分度是衡量试题对学生学习水平区分程度的指
标,它的大小用区分度指数来表示。
D
(1)区分度的计算:
对于试题的区分度指数的计算,有两种方法:
..相关系数法。
它将考生在某一题上的得分与他们在该试卷上的考试总分两者之
间的积差相关系数r作为该题的区分度指数D,即
1()(
NiiixyxxyyDrNσσ=
..
==
Σ…………………………………(公式3)
其中,表示考生的总数,Nix表示第个考生在该试题上的得分,ix表示全体考
生在该试题上的平均得分,xσ表示全体考生在该试题上得分的标准差;
同样iy表示第
个考生在该试卷上的总分,
iy表示全体考生在该试卷上的平均总分,yσ表示全体考生
在该试卷上所得总分的标准差。
..高低分组得分率相减法。
它先将全体考生的总分按照由高到低排列,然后按
27%、46%、27%的百分比依次将它们划分为三个分数段,对应与第一个分数
段的所有学生称为高分组,对应于第三个分数段的所有学生称为低分组。
记高
分组的某题难度指数为HP,低分组的相应该题的难度指数为LP,那么这道试
题的区分度指数HL。
DPP=.
根据学业考试的性质和任务,要求试题具有区分是否合格的良好性能,在教育测量
学上,称识别是否合格的区分度为项目识别度。
学业考试目的是目的是全面、准确
地反映初中毕业生在学科学习方面所达到的水平,这个水平不仅仅是合格的水平,
还包含良好、甚至优秀的水平。
如果针对上述三个水平(包含合格水平),分别建
立水平标准,根据这些水平标准对试卷的成绩划定四个群体(不合格群体,记为D;
合格群体,记为C;
良好群体,记为B;
优秀群体,记为A)。
我们称识别是否达
到某一标准的区分度为局部区分度,则A级的局部区分度为AADPP=.,B级
的局部区分度为,C级的局部区分度为BBDPP=.CCDPP=.,其中、、
、
APBPCPDP表示相应群体考生在该题上的难度指数。
(2)区分度分析
在常模参照测试中,有其目的是在于测量学生的相对位置,因此,区分度指标对于
试题质量的评价影响极大。
但是在标准参照测试中,其目的是在于测量学生是否达到预
选制定的教学目标,因此,由公式3得到的试题的区分度指标就显得不是很重要了,即
使这道试题根据公式3得到的值接近0,但完全根据考试的目的,这试题仍然有效。
在
类似学业考试的标准参照测试中,我们比较关注试题项目识别度和局部区分度指标。
此
时,一般而言,难度指数在0.75—0.9的试题,其项目识别度比较大,而如果难度指数
在0.5左右的试题,其对A级的局部区分度比较大。
(二)试卷的信度、效度分析
1、信度
考试作为测量学生学习水平的工作,必须要有一个测验的成绩是否稳定、可靠的问
题,而信度就是来回答这个问题的指标。
我们可以这么描述试卷的信度,就是指该试卷
对同一组被测试者实施两次或多次,所得结果的一致性程度。
如果一致性程度越高,说
明试卷信度越高。
试卷信度的大小用信度系数来表示。
2、信度系数的计算及分析
克伦巴赫(L.J.Cronbuach)在1951年提出了一个可适用于任何评分方法的试卷计算
信度系数的公式:
212
(1)
1niinrnσσ==.
.
Σ…………………………………(公式4)
其中表示试卷中试题的个数,n2iσ
表示考生在试题上得分的方差,i2σ表示考
生在整卷上所得总分的方差。
我们将上述所得的信度系数称为内在一致性信度系数,在
实际运用中比较广泛。
3、试卷提高信度的一般方法
对于数学考试,一般信度系数要能达到0.9以上,以保证整卷的可靠性程度较高。
要做到这一点,可以通过如下方法:
(1)适当增加试题量。
整卷中放多少试题比较合适,是值得深入研究的问题,但就提
高试卷的信度而言,我们通过一个公式,即斯皮尔曼—布朗(Spearman-Rroun)公式:
1
(1)
krrkr′=
+.
………………………………………(公式5)
公式5显示了在试卷增加题量后与原有试卷在内在一致性信度系数上的关系。
其中,r和分别表示试题增加前后的试卷内在一致性信度系数,内在一致性信度
系数,表示增加试题后试卷题量与原有试卷题量的比值,,显然。
r′
k1k>
r′>
(2)尽量采用难度适中,区分度大的试题;
(3)提高评分标准的准确性,减少评卷误差,提高试卷的信度;
(4)整卷中试题的排列尽量按由易到难的安排,有利于稳定学生的情绪,有利于学生
正常发挥水平。
第十三讲:
试卷的效度
对于一份试卷,即使它具有较高的可靠性和稳定性,但如果试卷的测试结果的有效
性值得质疑的话,这份卷子就没有任何的价值了。
就如同在我们初中毕业生学业考试数
学试卷中如果全部考的是小学的内容,那么这份卷子就完全无效的了,因为它完全达不
到测试的目的。
在对试卷质量的分析中,效度是对试卷质量进行评价的一个非常重要的
指标,是整个试卷分析的灵魂。
对效度本身的认识决定了分析过程及分析手段的使用,
以至影响效度分析的结果的形成。
正因为如此,对效度本身的认识,伴随着测量理论和
实践的发展,经历了一个历史的演进过程,已经由一个单薄的相关系数发展成为一个内
涵丰富、多维的概念系统。
效度从一开始20世纪50年代前所认为:
测验的成绩与采用其它客观方法进行度量
所得结果之间的相关,发展到1954年,美国心理学会出版的《关于心理测验和诊断的
技术建议》明确列举了四种类型的效度:
..预测效度:
即测验的结果与另一后来获得的测验结果之间的相关程度;
..同时效度:
即测验结果与一大约同时获得的测量结果之间的相关程度;
..构想效度:
指测验结果可以凭借编制该测验所假定的心理学理论或观念予以解
释的程度;
..内容效度:
指一个测验所包含的内容是否充分概括了预测范围的内容。
1966年美国心理学会、美国教育研究学会和国家教育测量委员会联合出版的《教
育与心理测验的标准和指南》中将效度类型进一步简化,将预测效度和同时效度合为效
标关联效度,形成三种类型:
效标关联效度、构想效度、内容效度。
许多年来,认为上述类型的效度适用于不同的目的,如在教育测量中,需要内容效
度,而对于人事测验中需要的可能效标关联效度等。
但今天,人们认为,这些代表了三
种不同类型的策略,这些策略用来证实以测验分数而不是以这三种不同类型的效度为基
础的推论(美国心理协会,《教育和心理测验的标准》,1999)。
现在,研究者们都同意,
所有的效度策略追求的是相同的基本目标:
理解测验分数的意义和应用,而不是从根本
上描述不同类型的效度。
麦西克(1989)提供了一个简短的效度定义;
即“科学地追求
测验分数的意义”。
现在研究者认识到,调查效度的所有策略可以在广义的构想效度的
标题下进行分类,其中可以包含相互关联的六个方面:
..构想效度的内容方面。
这里主要涉及内容的相关性和代表性两个问题;
..构想效度的实在性方面。
即测验应保证所引发的心理加工过程有代表性,应该
提供证据证明考生在任务完成过程中确实运用了设想的心理加工过程;
..构想效度的结构方面。
要求测验的评分模式与待测构想的内在结构相一致。
即
评分模式应该最大程度的反映行为表现背后所隐含的结构关系。
..构想效度的概括化方面。
即分数意义的使用范围和界限。
..构想效度的外部方面。
即测验成绩与其他测验结果之间的关系在多大程度上反
映了待测构想的理论预期。
应有证据表明一个测验不仅与理论上应该相关的那
些变量具有高相关,而且与理论上应该区别的那些变量具有低相关;
..构想效度的后果方面。
该方面关注测验使用的价值含义和社会含义,旨在收集
用于评价分数解释和使用结果方面的各种证据。
上述六个方面紧紧围绕测验的各个环节展开。
收集效度证据的包括:
基于测验内容
的证据、基于反应过程的证据、基于内部结构的证据、基于测验分数与其它变量之间关
系的证据、基于测验后果的证据。
总之要对测验的效度进行分析,后记效度证据的过程
必须经历对测验的编制到解释、再到使用结果的整个程序进行不断的检验。
在这里,针对试卷的效度分析中,内容方面的分析,我们通常分两个步骤:
第一、
对考试的考试蓝图进行分析与评价,判断与考试的目的、要求是否相符合;
第二,对试
题进行分析和评价,判断它与考试蓝图中制定的具体测验目标是否相对应。
对于其它方面,由于都要涉及到高级统计测量模型的使用,如对于结构反面,就需
要运用实证性因素分析,对于后果方面,在广泛的使用调查量表的基础上,分层模型的
使用是常用的手段;
在概化方面和外部方面,概化理论和模型使用上有效的量化过程;
而在实在性方面,需要质性分析方法的介入。
这不是这次学习的重要内容,在这里简单
提一下,如果感兴趣,可以查阅相关资料。
5、提高效度的有效途径
..依据测验的目的与要求,制定好考试蓝图,处理好构想效度的内容方面;
..保证试题的科学性;
..题型使用的合理性,切忌小题大做,大题小做;
..提高分数与能力的一致性程度,在评分标准的制定过程中,要注意分数的高低
尽量与学生能力水平的高低相一致。
第十四讲:
SPSS软件在教育统计中的使用
1、SPSS软件简介
SPSS是“社会科学统计软件包”(StatisticalPackagefortheSocialScience)的简称,
是一种集成化的计算机数据处理应用软件。
该软件是世界公认的最优秀的统计分析软件
包之一(SAS、SPSS、SYSTAL)。
它面向行业应用人员,软件设计突出统计方法的成熟、
实用性、易用性及与文字处理软件等的交互性上。
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作
界面极为友好,输出结果美观漂亮。
存储时专用的SPO格式可以转存为HTML格式和
文本格式。
它几乎将所有的功能都得以统一、规范的界面展现出来,使用Windows的
窗口方式展示各种管理和分析数据方法的功能。
对话框展示出各种功能选择项。
用户只
要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科
研工作服务了。
SPSS采用类似EXCEL表格的方式输入和管理数据,数据接口较为通用,能方便的
从其他数据库中读入数据。
其统计过程包括了常用的、较为成熟的统计过程,如描述性
统计、均值比较、方差分析、相关分析、回归分析、探索性因素分析等,完全可以满足
非统计专业人士,特别是教育工作者的需要。
目前,国内市场上汉化的相应版本不多见,一般都是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语文评价考试标准等crosoft Word 文档 语文 评价 考试 标准 crosoft