考试成绩统计分析中的理解和思考1.docx
- 文档编号:23653345
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:17
- 大小:37.36KB
考试成绩统计分析中的理解和思考1.docx
《考试成绩统计分析中的理解和思考1.docx》由会员分享,可在线阅读,更多相关《考试成绩统计分析中的理解和思考1.docx(17页珍藏版)》请在冰豆网上搜索。
考试成绩统计分析中的理解和思考1
考试成绩统计分析中的理解和思考
五峰县教研培训中心饶士望
毋庸置疑,考试始终是检查教师的教学是否达到教学目标以及达到目标的程度,了解学生学习水平的重要手段之一,我们常常通过调研测验来进行分析评价。
通过对成绩的统计分析,衡量教师所教班级学生的相对水平,评价教师的教学质量,以促进教师全面贯彻教育方针,面向全体学生,全面实施素质教育。
根据教育统计理论,科学、全面地理解和设计考试统计分析的量化指标,是考试成绩统计分析工作中至关重要的基础性工程。
有鉴于此,笔者结合自己的学习理解、工作中的认识和思考,对考试成绩统计分析尝试一些研究和探索,以期为学科教师、教学研究者、教学管理决策者提供一些参考。
之一说说考试成绩“平均分”
现阶段考试成绩统计分析中,“平均分”是一个非常重要的量化指标,实在是很有必要全面了解它所描述的统计学层面的含义。
所谓平均分,是把一组学生的考试成绩作为观测对象计算出它们的算术平均数的通俗说法。
是用一组学生成绩的总和除以学生个数所得的商,又称均数、均值。
表示为:
在EXCEL、MSSQLSERVER中,均采用函数AVERAGE来计算。
平均分之所以被各类教育统计广泛使用,是因为它具有反应灵敏、简明易解、较少受抽样变动的影响等特点,它反映了成绩数据的集中趋势,是对成绩数据的最佳估计值,是最富有代表性的集中量数。
其缺点是容易受到极端成绩数据的影响。
近几年的实际工作中,我们引入得分率这一概念,理由是,在采用百分制的卷面设计时,平均分=总分÷人数,得分率=所得总分÷人数÷卷面总分×100,平均分即为得分率,考虑到现行各种考试中,部分学科卷面设计不是100分,为消除学科之间的差别,统一为得分率,即得分率=总分÷人数÷卷面分×100。
这样就可以进行学科之间的简单比较和计算,本质上仍是转换为百分制的平均分。
是否应该设计一个新的量化指标——均分达成度呢?
所谓均分达成度,就是样本中达到或超过总体样本平均成绩数量的比率。
例如:
某校8年级语文均分达成度(%)=某校8年级语文成绩达到或超过全县平均分的人数÷某校8年级语文考试人数×100
在下表中,我们可以清楚地看到,平均分(得分率)与平均分达成度存在明显的正方向“相关性”,即平均分大,平均分达成度就高,因此,平均分达成度仅作参考指标。
在理解得分率的基础上,得分率容易理解,得分率的作用是不同总分学科的比较。
均分达成度的比较结果一样,但得分率更通俗易懂。
单位代码
参考人数
得分率(百分制均分)
语文均分达成人数
语文均分达成度%
101
137
59.93
65
47.45
201
244
63.91
150
61.48
301
123
67.46
89
72.36
401
279
63.09
164
58.78
501
115
54.49
45
39.13
601
70
66.30
45
64.29
701
119
54.09
44
36.97
801
48
65.61
31
64.58
全县合计
1135
63.35
633
55.77
实际上,我们是将全县8年级语文的平均分作为一个标准,语文均分达成度就是评价各学校8年级语文成绩完成这一标准的情况。
在这里,我们模糊学生成绩的分层现象以及试题的难易程度(这是合格率等统计指标无法实现的),而重点考察各校8年级语文成绩达到基本标准(全县8年级语文平均分)的程度,符合普及教育、基础教育的要求,同时也避免了采用简单比较均分距值(全县语文平均分-某校语文平均分)的方式中成绩数据中极值(极大值、极小值)的影响,可以做到比较全面和公正。
尤其是有利于纵横比较,即同一次考试中,不同学科的比较和不同考试中同一学科的发展变化。
“平均分”是个好东西!
考试成绩统计分析中的理解和思考之二
说说“三率”
在成绩的常规统计分析中,合格率优秀率低分率等指标概念常常和前文所述的“均分”同时出现,虽然说它们也会更换不同的“马甲”,唤着“及格率”“高分率”“差生率”等等,不一而足。
我始终认为,合格率优秀率包括新近引入的“特优率”,这些指标更多的体现考试的选拔功能,而不是为了评价,或者说体现一种愿望,是希望学生成绩更倾向更接近最大值。
但这一愿望确实跟实际情况存在着矛盾。
矛盾一,为什么60分或者60%的卷面分是合格(及格)成绩,80分或者80%的卷面分是优秀?
明显地这些指标了忽视的试卷本身难度系数的不确定性(本来在命制试题时,我们都预设并尽可能控制难度系数,但即便是高考也会出现难易不均的现象),在考试之前就确定标准是不合适的,只有根据某次考试的整体情况,来评价教师或学生才符合实际情况。
所以,也有人在统计中采用某次考试成绩排名前20%的人视为优秀,前40%的为合格,末位20%的为低分,有一定道理(但这种统计方法在多学科综合统计时明显先天不足,如何解决,我们再做讨论)。
在课程标准下,达到标准即可,为什么不能每个人合格?
矛盾二,采用合格率高分率来纵向分析研判某科教学的变化趋势就更是无能为力,这一次考试中某班合格率70%与上一次考试中的60%合格率无法比较,也许上次考试中某班成绩在总体样本中更好一些。
直到“低分率”这一指标的加入,它们兄弟四个才成为老大——“平均分”的真正帮手,才体现出考试成绩统计分析后的指导意义,这是告诉大家,“均衡发展,提高水平,要抓两头带中间!
”,换句话说,提高合格率,优秀率,降低低分率,是提高平均分的途径。
在倡导学生全面发展的义务教育阶段,“三率”作为评价指标的作用甚微。
但这是提高整体水平或者说均分的有效策略。
我认为素质教育在考试成绩上的体现,最理想的状态就是所有学生的成绩比较均匀整齐并尽可能的趋向于最大值。
近两年牛庄中学中考成绩就提供了最好的注脚。
考试成绩统计分析中的理解和思考之四
成绩统计中为什么要引入“标准差”
一、什么是标准差
标准差(StandardDeviation),也称均方差(meansquareerror),标准差也被称为标准偏差,或者实验标准差。
可表述为各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根,用σ来表示。
标准差在本质上也是一种平均数。
公式表示如下:
一个较大的标准差,代表大部分的数据和其平均值之间差异较大;相反,则代表这些数据较接近平均值。
如是总体,标准差公式根号内除以n;如是样本,标准差公式根号内除以(n-1)。
关于这个函数,在EXCEL和MSSQLSERVER中的,都是用STDEVP来计算。
二、标准差在学生成绩统计中有什么作用
例如,
项目
A组成绩
B组成绩
学生1
95
73
学生2
85
72
……
75
71
……
65
69
……
55
68
……
45
67
平均分
70
70
标准差
17.08
2.16
这两组的平均分都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。
“标准差”是差异量数,反映了数据分布的离中趋势。
一组成绩的标准差小,表明成绩很“整齐”,反之,反映学生成绩两极分化严重。
我们要控制低分,是标准差减小;但我们要培养特优,标准差反而拉大了。
特别是对以下两种情况,意义重大:
1、在平均成绩相等的情况下,可以衡量整体成绩的合格程度,这样就可以为面对全体学生的学习状况提供一个简洁的依据;
2、在平行班级间,引入标准差这一评价指标,对班级间同一科目的全面评价更准确科学。
鉴于这种考虑,我们在分学科统计分析表中,引入这一指标,对教师的学科教学提供直接而简洁的依据之一。
考试成绩统计分析中的理解和思考之四
为什么要计算和使用标准分
近几年来,高考逐步引入标准分的统计概念,部分地区的中考也正开始尝试。
为什么要计算和使用标准分来评价学生学业状况?
我们在这里对标准分的意义、计算和使用作一较详细的讨论。
一.标准分制度的概念及意义
先列出我们在教学中常遇到的问题:
比如你是教物理的,你所教的一个班里有两名学生张月和李娜,在同一次物理考试中,张月考83分,李娜考78分,你可以判断张月比李娜考得好;在同一次综合考试中,张月物理考了83分,而语文考了91分,你能肯定地说张月的语文比物理考得好吗(张月的物理可能是全班第3,而语文可能在全班排第14)?
张月这次考试物理为83分,上次考试为76分,你能肯定地说他这次比上次考得好吗(上次可能是全班第1)?
同理,你如果是班主任,在期未考试中你班里的语文平均分为86.3,数学平均分为72.8,就这两个数而言,你能肯定地说语文比数学考得好吗?
现实中家长都是问:
学科分或总分在年级的名次,以比对是否进步。
学生考试成绩的高低,与学生个体的学习程度固然有关,但就整体而言,与这次考试的命题和评卷关系更大。
事物进行比较的前提是要选择共同的参照点(物)和标准,否则,比较就是无意义的。
标准分制度是根据教育统计与测量学原理,按一定规则把原始分数转化为具有相同意义、相同单位和共同参照点并能刻画考生分数在总体位置的分数制度,与原始分相比,标准分最直接的意义是它给出离平均数的距离。
标准分的应用价值很大,它可以比较两组不同的数据,因此,就可以解决上面我们所提出的问题。
张月同学语文91分,物理83分,如果全班语文平均89分,物理平均72分,实际上物理比语文考得好。
这是通过标准分得到的结论,它给出了91和83在同一单位(标准差)下共同参照点(平均分)的位置。
又如张月同学两次考试分别得83分和76分,也不能说明他成绩下降了,因为两次的参照点单位不统一。
在选拔考试中(如高考),要求分数能准确清晰地反映考生之间的水平差异。
作为选拔依据,原始分有很大局限性,不能反映考生分数相对团体的位置,不同科目的可比性较差。
在原始分中“1分”的含金量表面上是相等的,但实际是不等值的,例某同学高考中英语和物理得分各为104分、87分和87分、104分,原始分两项之和相等地,但由于英语平均分为86,而物理平均分为75,两者的参照点不同,两科的“1分”,实际是不等值的,物理的“1分”比英语的“1分”表现的水平要高,但录取时是按等值处理的。
使用标准分就可以使各科的“1分”达到等值。
二.标准分的计算和转换
1.平均分:
平均分能够准确地反映数据的集中程度,也是我们选取的参考点,大家共同以平均分为参考点进行比较。
计算公式:
设样本总数为N,样本个体得分为x则
=∑x/N
2.标准差:
标准差能反映数据相对平均分的离散程度,是一组被测试的全体与平均值差的一个平均数,我们把它叫做标准差,也就是我们所取的单位,大家都以标准差为同一单位进行量度。
计算公式:
标准差S=
个人得分减去平均分差的平方,与所得总分的积除以卷面总分后开平方。
这里与“得分率差”异曲同工。
3.标准分:
标准分是以标准差为单位来度量考分与参考点平均分之间的离差,即考分距平均分相差了多少个单位。
计算公式:
标准分Z=
(也叫Z分数)与均分差除以标准差
如果把平均分作为坐标原点,S作为单位长度,则可用数轴表示:
-3S -2S -S 0 S 2S 3S
可以很形象地表示出某同学在这个团体中的位置,也就是考分距平均分的位置,因此,标准分适合用于对被试进行排队比较。
4.标准分的转换:
Z分数有正负或等于零,为了避免负数和零的出现,我们常选择一个固定的平均值(基础分)和新的测定单位来对原标准分(Z分数)进行转换。
通常使用的平均值为50,标准差为S’=S/10。
转换后的分数叫T分数,所有被测的分数在50分上下浮动。
50分为一般成绩,大于50分越多,则成绩越好,小于50分越多,则成绩越差。
转换公式:
若卷面分为100分制,
设样本总数为N,样本个体得分为x则 平均分
=∑x/N
标准差S=
标准分Z=(样本--
))/S
则
-3S’ -2S’ -S’ 50 S’ 2S’ 3S’
T分数仍然保持了Z分数的基本特性。
三.标准分的应用
标准分数,不仅可以说明一个学生的测验分数在团体中所处的相对位置,而且可以在各学生之间进行比较,更可以比较同一学生在不同各科成绩上的优劣。
例如张月和李娜两同学的数理化三科成绩如下表:
考试科目
姓名
年级平均分
年级标准差S
T分数
张月
李娜
张月
李娜
数学
67
73
65
4
55
70
物理
76
86
74
6
53
70
化学
86
70
71
12
62.5
49
总分
229
229
170.5
189
平均分
76.3
76.3
51
63
如果按照我们常用的实际分值,这两个人的总分相同,在年级排队的位置一样。
但是,换算成了T分数后,李娜的成绩显然优于张月的。
原因是在原始分中,数学的1分和物理、化学的1分的值是不等的,即含金量是不同的。
这样的分相加后的可比性就比较差,常会出现很大的误差。
从以上的T分数也可以看出各学科的贡献率。
总分都是229,张月的数学贡献率较物理的大(数学在总体的位置靠前),李娜的数学和物理的贡献率一样大(这两科在总体的位置一样)。
教学工作考核中使用标准分,主要应用于:
1、发展性评价。
教师和学生的现在与以往比较,即纵向比较。
2、相对评价。
对同一团体,不同的学科之间进行比较,即横向评价。
考试成绩统计分析中的理解和思考之五
考试成绩统计指标
“标准均值分”的设计与研究
一、问题的提出
1、教学质量或者考试成绩的评价必须通过量化指标来实现,而这些量化指标所组成的评价方式所反映是我们持有的什么样的质量观。
义务教育阶段的教学质量评价必须以促进全面贯彻教育方针,面向全体学生,全面实施素质教育为目的,所以在采用或设计这些量化指标的时候,就必须有长远意识和科学的质量意识。
2、现阶段,在教学管理中,往往通过“得分率”、“合格率”、“优秀率”、“特优率”、“低分率”等统计指标来进行评价。
如前文所述,这些统计指标具有“静态”的特点,由于学科、命题难度不同,试卷总分不一,因而对分数解释比较困难,导致学科之间、年级之间不能纵向、横向比较,不能简单明确地说明不同学期的教学质量是进步了,还是退步了,无法进行“推进率”的计算,尤其是“合格率”、“优秀率”、“特优率”、“低分率”不能全面反映“面向全体学生,促进学生全面发展”。
3、我们需要这样一个考试成绩指标,既能兼顾传统统计指标的特征,又能克服其静态特点的不足,通过它,反映评估对象(不是针对某一个学生的,而是以班级、学校作为统计样本)的学习水平,为诊断教学质量提供服务。
为此,根据教育统计学原理,对现有统计指标进行“相关性”统计分析,在揭示其规律的基础上,提出“标准均值分”统计指标。
二、对传统统计量的“相关性”的分析
我们知道,用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。
在正相关中,当一个变量增加时,另一个变量也在增加,当一个变量减少时,另一个变量也在减少;在负相关中,情形与正相关正好相反。
相关系数的绝对值越大,影响程度就越显著。
那么,在过去传统的统计量中,班级学科成绩的得分率、及格率、优分率、低分率、标准差、标准分等等量之间,它们的相关程度究竟如何?
哪些量在统计中更具有显著的作用?
通过对大量成绩数据的分析,笔者得出得分率、合格率、标准分、班级标准分(“班级标准分”是班级学生成绩“标准分”的算术平均数)等统计量的“相关性”结论。
结论之一:
“得分率”与“班级标准分”完全相关。
所有测试成绩统计显示,班级成绩“得分率”与“班级标准分”相关系数为1。
换句话说,班级“得分率”高的,“班级标准分”也高,反之亦然。
既然“得分率”与“班级标准分”完全相关,这为我们设计一个新的统计量提供了理论依据。
得分率或均分,它反映了数据的集中趋势,是对数据的最佳估计值,是最富有代表性的集中量数,因而被各类教育统计广泛使用。
但是,均分具有静态特点。
由于各科命题难度不同,各科不同年级的班级均分不能直接比较,造成分数解释上的困难。
标准分,是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的一批分数中的相对位置,换算后的标准分与试卷的难度系数、学科无关,因而具备动态的特点,为不同学科、不同时期的成绩比较提供了可能。
有人可能认为,标准分最大的特点是排位,义务教育阶段不允许对学生的成绩进行排序,其实这也不矛盾。
我们统计学生的“标准分”,不是为了给学生排位,是为统计班级成绩的“班级标准分”服务,为诊断教师教学质量服务的。
结论之二:
“标准差”与“得分率”、“合格率”等量负相关,与“低分分率”正相关。
多批次调研考试成绩统计表明,“标准差”与“得分率”、“合格率”高度负相关,与“低分率”正相关。
“标准差”是差异量数,反映了数据分布的离中趋势。
一组成绩的标准差小,表明成绩很“整齐”,反之,反映学生成绩两极分化严重。
为什么“标准差”越大,“得分率”、“合格率”就越差?
我们的教育统计是以班级授课制下的一种常态统计。
一个班级两极分化比另一个班级严重,往往说明前一个班级在管理上、学生的学风上比后一个差,或者是教师的教法、提优补差缺位等因素造成的。
试想,在一个两极分化相对严重的班级教学,教学组织的难度就相对比较高,效果就比较差,如果教师再缺少敬业精神,提优补差又无有效的措施,成绩相对落后也就不足为奇了。
通过大量数据统计表明,一些班级成绩不理想,其中一个深层原因是班级学生两极分化严重生成的。
然而,现阶段在教学质量分析中,往往重视对“得分率”、“合格率”、“优秀率”、“低分率”升降的分析,但对“标准差”数据的分析运用,并没有给予应有的重视。
素质教育要求我们关注每一个学生,关心每一个学生成长。
在教学管理中,我们应通过“标准差”的升降,找到问题出现的重要原因。
因此,在设计新的教育统计量时,要兼顾“标准差”,使其发挥一定的导向作用。
结论之三:
其它一些成绩统计量的相关性分析如下:
“全科合格率”与“总分”、“得分率”与“合格率”、
“班级标准分”与“合格率”、“优秀率”、“得分率率”与“前20%优分率”呈正相关或极显著的正相关。
这说明,对于以上几个量,要想提高某一个数值,关注其它几个量均可产生明显的效果。
例如,要想提高班级总分的成绩,我们应关注学生的“全科合格率”,关注“全科合格率”,符合国家教育方针,应给予足够的重视。
同时,提高“全科合格率”,“总分”的提高也就“水到渠成”。
以上分析对设计“标准均值分”提供了理论依据。
三、“标准均值分”设计
通过对以上统计量的研究分析,“标准均值分”中包含着标准分、得分率的统计思想,通过“标准均值分”的高低变化,更直接,更客观地反映教师的教学质量,为学校教学管理、教师自我诊断提供分析依据。
1、设计原则
在“标准均值分”评价方案设计时,遵循以下原则:
可比性原则、相对科学原则、可操作性原则。
可比性原则主要体现在,“标准均值分”要可以进行不同学年、不同学期的成绩比较,统计的量值要能反映教师的教学工作是提高了还是落后了。
为此,在统计中,首先将学生成绩转换成标准分,再对标准分进行处理;另外,为了使不同学科、不同分值考试的标准差可比,统计“相对标准差”,即将成绩的标准差除以均分。
相对科学原则主要体现在,新的评价要集中得分率(均分)、标准差、标准分的评价功能。
从上面“相关性”研究的结论中,我们已看到,由于“得分率”与“班级标准分”完全相关,因此,设计新的统计量时,用“班级标准分”代替“得分率”,它既能反映数据的集中趋势,又能使不同学科、不同学期的教学成绩进行比较评价。
导向作用体现在,教师要关注全体学生,尤其是不放弃“学困生”。
为了促进教师关注全体学生,防止两极分化,引入了“分化差”的概念,如“班级相对标准差”小于“总体相对标准差”,说明分化小于整体情况,应加分,否则要减分。
可操作性原则主要体现在,可以通过程序计算。
“标准均值分”,为学校、教师进行横向、纵向对比分析提供了可能。
“标准均值分”,是对班级学生学习的整体评价,它为教学管理、为教师教学诊断服务。
2、统计原理
第一步:
计算学生成绩的“标准分”:
(学生成绩-均分)/标准差。
第二步:
统计“班级标准分”:
班级标准分=班级学生的“标准分”的均值。
第三步:
计算“分化差”:
分化差=(班级标准差-总体标准差)/总均分*100
第四步:
计算“标准均值分”:
标准均值分=班级标准分-分化差。
四、对“标准均值分”评价方案的进一步论证
1、“标准均值分”对成绩的反映更客观,更准确。
①均分所反映的数据特征高低,“标准均值分”也能反映。
正如上面所述,由于“均分“与“班级标准分”完全相关,上面现象必将发生。
②不同学科,均分无法比较好坏时,“标准均值分”一目了然。
“学校E”,如果我们光从均分来看,英语均分72.11,物理均分67.55,化学均分47.53,似乎英语比物理好、物理比化学好,但如果从“标准均值分”来看,英语35.58物理62.61,化学54.67,它反映英语是最差的!
原来,英语在全区倒数第一!
而“标准均值分”更能反映不同学科成绩的优劣。
通过标准均值分,分管教学校长可以一下子看到问题所在,应深入到英语教研组,关注英语教学工作。
2、“标准均值分”为计算不同学期成绩的“推进率”提供了依据。
数据源:
**年中考成绩及这批学生八年级时调研成绩。
纵向比较:
以前,不同学期的成绩是不好进行量的比较的。
但引进了“标准均值分”,为计算不同学期的成绩“推进率”提供了依据。
语文
2013年3月联考
2013年中考
学校
班级标准分
分化差
标准均分值
班级标准分
分化差
标准均分值
A
45.61
-8.67
54.28
51.55
-2.36
53.91
B
47.97
-3.89
51.86
49.08
1.96
47.12
C
50.57
-4.35
54.92
51.76
-6.59
58.35
A
50.10
-1.01
51.11
50.17
-0.33
50.50
B
56.75
1.33
55.42
46.40
4.67
41.73
C
55.67
0.82
54.85
50.08
-4.53
54.61
A
48.18
8.69
39.49
50.47
2.76
47.71
B
52.38
-2.43
54.81
51.47
-6.63
58.10
数学
2013年3月联考
2013年中考
学校
班级_标准分
分化差
标准均分值
班级_标准分
分化差
标准均分值
A
52.09
0.86
51.23
53.91
-4.77
58.68
B
46.54
-1.52
48.06
47.11
3.62
43.49
C
52.70
-7.43
60.13
50.17
-3.23
53.40
D
51.42
-0.98
52.40
50.49
0.34
50.15
E
48.35
-1.48
49.83
48.14
-2.33
50.47
F
46.53
-7.87
54.40
48.98
-3.07
52.05
G
52.09
5.86
46.23
51.06
-2.41
53.47
H
48.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考试成绩 统计分析 中的 理解 思考