完整版标准分在教育评价中的应用以我国高考分数评分法为例毕业设计.docx
- 文档编号:12756802
- 上传时间:2023-04-21
- 格式:DOCX
- 页数:27
- 大小:34.53KB
完整版标准分在教育评价中的应用以我国高考分数评分法为例毕业设计.docx
《完整版标准分在教育评价中的应用以我国高考分数评分法为例毕业设计.docx》由会员分享,可在线阅读,更多相关《完整版标准分在教育评价中的应用以我国高考分数评分法为例毕业设计.docx(27页珍藏版)》请在冰豆网上搜索。
完整版标准分在教育评价中的应用以我国高考分数评分法为例毕业设计
湖南科技大学
毕业设计(论文)
题目
标准分在教育评价中的应用
——以我国高考分数评分法为例
作者
刘晴晴
学院
教育学院
专业
小学教育
学号
指导教师
向东春
二〇一四年5月20日
湖南科技大学
毕业设计(论文)任务书
院系(教研室)
系(教研室)主任:
(签名)年月日
学生姓名:
学号:
专业:
1、设计(论文)题目及专题:
2、学生设计(论文)时间:
自年月日开始至年月日止
3设计(论文)所用资源和参考资料:
4设计(论文)应完成的主要内容:
5提交设计(论文)形式(设计说明与图纸或论文等)及要求:
6发题时间:
年月日
指导教师:
(签名)
学生:
(签名)
湖南科技大学
毕业设计(论文)指导人评语
指导人:
年 月 日
指导人评定成绩:
湖南科技大学
毕业设计(论文)答辩记录
日期:
学生:
学号:
班级:
题目:
提交毕业设计(论文)答辩委员会下列材料:
1设计(论文)说明书共页
2设计(论文)图纸共页
3指导人、评阅人评语共页
毕业设计(论文)答辩委员会评语:
答辩委员会主任:
委员:
答辩成绩:
总评成绩:
摘要
众所周知,无论是我国还是世界其他国家,都在尽力使教育评价更趋向于公平、科学、全面,而考试作为教育评价的一种普遍方式,使其达到公平、科学、全面尤为重要。
在我国,高考被视为一场全民的公平性的考试,然而我国的高考的公平性却是相对的,不同的因素也将影响高考公平性。
目前,我国高考实行分数制,分数的高低直接决定考生的录取情况。
因此,高考分数尤为重要。
然而,不同的高考高考分数评分法,将引发不同的结果,是将致使高考在一定程度上出现不公平性。
应用何种高考高考分数评分法就存在很大的争议。
当前,除海南省外,我国大部分省市对高考分数都采用原始分数的评分方法。
由于不同学科的性质不同,机械地把各科分数相加求总和的原始分数的评分方法,显然存在一定程度上的不科学性,也在一定程度上削弱了高考的公平性,致使高考并没有实现教育评价的目的。
本文将以教育评价的目的为出发点,对高考分数的两种不同的评分法:
原始分数、标准分数,进行分析和比较,说明原始分数评分法存在的弊端以及标准分数评分法的科学性,进而揭示标准分在教育评价中的优越性。
关键字:
教育评价高考公平性原始分数标准分数
ABSTRACT
Aseveryoneknows,eitherinChinaorothercountriesintheworld,aretryingtomaketheeducationevaluationtendtobefair,scientific,comprehensive,andapopularwayofexaminationastheeducationappraisal,makeitfair,scientific,comprehensiveandisparticularlyimportantto.InChina,thecollegeentranceexaminationisregardedasafairnationalexam,howeverfairnessisourcollegeentranceexaminationrelative,differentfactorswillalsoaffectthefairness.Atpresent,China'suniversityentranceexamtofractions,fractiondirectlydetermineadmissionofcandidates.Therefore,thecollegeentranceexaminationscoresisparticularlyimportant.However,collegeentranceexaminationscoresofdifferentsynthesismethods,willleadtodifferentresults,thecollegeentranceexaminationisnotequaltoacertainextent.Applicationofthe.Applicationofthecollegeentranceexaminationscoresofsyntheticmethodhastheverygreatdispute.Atpresent,exceptHainanProvince,synthesismethodofmostoftheprovincesinChinaareusingrawscoresonthecollegeentranceexaminationscores.Duetothedifferentnatureofdifferentsubjects,thesynthesismethodofmechanicalsubjectscoresforthesumofrawscoresareobviouslyisnotscientific,tosomeextent,weakenedthefairnessofcollegeentranceexaminationinacertainextent,resultinginthecollegeentranceexaminationdidnotachievethepurposesofeducationevaluation.Thispaperwilltakethepurposesofeducationevaluationasthestartingpoint,twodifferentscoresonthecollegeentranceexaminationscores:
rawscore,standardscore,analysisandcomparison,scientificandstandardscoremethodhasdisadvantagesoforiginalscoremethod,whichrevealsthesuperiorityofthestandardsineducationevaluation.
Keywords:
EducationevaluationCollegeentranceexaminationequityRawscoresStandardscore
第一章前言-1-
第二章教育评价概念的界定与其功能-2-
2.1教育评价概念的界定-2-
2.2教育评价的功能-2-
第三章原始分数对教育评价功能的削弱-3-
3.1原始分数单位不具等值性,高校难以辨识考生成绩-3-
3.2原始分数不具可比性,易造成“两难境地”-4-
3.3原始分数不具有可加性,高校难以“择优而录”-4-
3.4原始分数难以判断录取分数线-5-
第四章标准分数体现教育评价的功能-6-
4.1标准分数的定义和性质-6-
4.1.1标准分数的定义-6-
4.1.2标准分数的性质-7-
4.2标准分数的优越性-8-
4.2.1标准分数的可比性有利于高校“择优而录”-8-
4.2.2标准分数的可加性有利于提供更多的信息-9-
4.2.3标准分数的稳定性有利于全面反映考生能力-12-
第五章实行标准分的几点思考及注意事项-13-
参考文献-14-
致谢-15-
附录:
-16-
第一章前言
教育评价中,由于选择的参照点不同,解释结果也不相同,常将它们分为标准参照评价和常模参照评价,又称绝对评价和相对评价。
高考作为教育评价的一种重要方式,属于选拔性考试,是以考生团体作为常模团体的常模参照性考试,根据考生团体的平均分和标准差等标准来解释考生的分数。
而现阶段在中国和国际上普遍参照两种分数评分法:
原始分数以及标准分数来解释高考分数。
原始分数单位不具有等值性且不具有可比性,可加性,而标准分数具有可比性、可加性、稳定性等。
标准分数相对于原始分数的这些优越性,使标准分数更能体现高考是作为常模团体的常模参照性考试,使标准分数更能体现高考的公平性,实现教育评价的目的。
1987年,国家教委公布了《普通高等学校招生全国统一考试标准化实施细则》,并于当年开始在广东、海南试行高考标准分数,之后黑龙江、北京、吉林、河南、云南等省市也纷纷建立省级常模,试行高考标准分。
至2007年,由于高考出现选考科目后,一些省份认为继续采用标准分将会影响高考的公平性,于是放弃高考标准分,转而试用始分数评分法,大部分学者对这种做法持否定态度,他们不认为采用原始分数评分法更体现公平性,相反,他们认为如若对现有的标准分数评分法进行深入转换,将更具有科学性和公平性。
在国外,尤其是在美国,几乎很少采用原始分数评分法,绝大部分使用标准分数评分法。
例如GRE、TOEFL等考试都采用标准分数评分法。
随着社会的发展,科学技术的进步,实现标准化考试,在高考中使用标准分数,已经成为时代的客观需要,也是高考发展的必然趋势。
第二章教育评价概念的界定与其功能
2.1教育评价概念的界定
教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实基础上,作出价值分析和价值判断。
通俗理解为参照一定的标准,对被评价的事物进行评价。
高考作为教育评价的一种方式,其以考生的高考分数为参照点,对考生的高考分数作出价值分析和价值判断。
2.2教育评价的功能
教育评价的功能即教育评价的作用,是对被评价者和评价者所起到的作用。
教育评价的功能有很多,包括鉴定功能、导向功能、激励功能、诊断功能、调节功能、教育功能等。
而高考,这一教育评价方式,主要涉及考生和高校招生单位这一被评价者、评价者,其功能亦是对考生和高校招生单位所起到的作用,包括判断和选拔的功能
一、判断的功能:
判断的功能主要分为事实判断的功能和价值判断的功能,事实判断的功能一方面包解,另一方面包括高校招生单位对考生的高考分数的真实辨识;价值判断的功能是在事实判断的功能的基础之上,参照外在标准,作出的判断。
通过参照高校招生单位的要求,考生可以判断出究竟适不适合所选学校或所选专业,高校招生单位也可以对报考本招生单位的考生作出需不需要这样的考生的判断。
2、选拔的功能
选拔需要依据一定的标准,通过高考进行选拔,也需要一定的标准,通常,这一标准便是高校录取分数线。
如何确定这一标准?
若要确定录取分数线,必将涉及高考分数的统计。
目前,在我国和世界其他国家普遍使用两种分数评分法:
原始分数、标准分数。
下面的内容主要是辨析这两种分数评分法在教育评价中的应用的优缺点。
第三章原始分数对教育评价功能的削弱
原始分数是指考生考试所得的卷面分数,通常用字母X表示,例如某生高考语文110分、数学120分、英语130分,文综230分,这里的110、120、130、230即为原始分数。
现阶段的高考分数的合成,直接将各科原始分数相加,然后求取总和,即得考生总分。
1990年,夏斐事件在中国引起了非常大的反响,给世人留下许多惋惜与思考,其中原始分数的局限性也充分暴露了出来。
原始分数的局限性在一定程度上削弱了高考作为教育评价的功能,也削弱了高考应具有的公平性。
作为教育评价的评价者高校招生单位在招录考生时,通常会考虑两个条件:
一、考生的总分;二、考生的单科分数。
然而,高校招生单位能够直观地从考生的卷面分数即原始分数看出考生的总分比其他考生更优越或者是考生的某一科目比其其他科目更加优秀?
进而能够真正录取其满意的考生?
3.1原始分数单位不具等值性,高校难以辨识考生成绩
众所周知,高考的卷面分数即原始分数的单位是“分”。
虽然各科的分数单位都是“分”,但是语文的100分与数学的100分具有等值性吗?
也就是说语文的1分等于数学的1分吗?
在传统的高考分数评分法中,即以原始分数为依据的评分法中,这两者被视为具有等值性。
在具体分析高考分数的单位“分”是否具有等值性之前,先看看日常生活中经常用到的货币:
美元和人民币,美元和人民币的单位都是“元”,然而人民币100元并不等于美元的100元,这已是公认的事实。
显然,即使人民币和美元的单位都是“元”,它们的单位也不具有等值性。
究其原因,美元的100元的参照点是1美元,而人民币的100元的参照点是人民币的1元,因此两者的参照点是不同的。
根据教育测量学的相关知识,参照点不同的两个测量,即使单位一致,其结果的价值也完全不同。
现在再回过头来看原始分数意义上的语文的100分和数学的100分,它们的单位不具有相等的价值,其原因同人民币的100元和美元的100元具有不等值性是相似的,即语文的100分的参照点是语文的1分,数学的100分的参照点是数学的1分,语文和数学的性质是不同的。
原始分数单位不等值,这是其缺陷之一。
然而,在实际高考招录中,由于考生的各科原始分数的单位都是“分”,高校招生单位自然而然的将考生的原始分数的单位视作等值的,直接把考生的语文的100分,数学的100分等看作等值的。
原始分数的表面的等值性迷惑了高校招生单位,使高校招生单位无法真正辨识考生的成绩,作出真实且恰当的判断,无法做到公平的教育评价。
3.2原始分数不具可比性,易造成“两难境地”
我国高考是择优而取的选拔性教育评价方式,需要对考生的分数进行比较。
但是,如何比较考生的分数呢?
可以直接对考生的原始分数进行比较吗?
先看如下两组数据:
天山一中两考生的原始分数
姓名
考生号
语文
数学
理综
英语
徐冰
108
127
237
128.1
王然
114
126
227
122.5
从表中可知,徐冰的语文是108分、数学是127分、理综是237分、英语是128.1分,能否得出这样的结论:
徐冰的语文考的最差,理综考的最好?
根据实际情况,这样的结论是错误的。
因为语文总分是150分,而理综总分是300分,两者的总分的权重各不相同,若机械地进行直接比较,将极有可能得出错误的结论。
那么能够说王然的数学比语文考得好吗?
现行高考,语文和数学的总分都是150分,两者目标分数的权重是一样的,但是,还是不能得出王然的数学比语文考得好。
由于二者的题目的难易程度我们是无法直接确定的,无法直接比较两者的大小。
原始分数不具可比性在现行高考中却被忽略,直接对原始分数进行比较,容易给招生单位带来迷惑性,不能切实招到具有某些优势的考生。
一方面,招生单位可能没有录取到具有某方面优势的考生;另一方面,考生的某一方面的优势可能无法得到相应的认可,造成高校招生单位没能找到其想要的考生,考生也没能进入其想要去的领域继续学习的两难境地,致使一些类似这样相对不公平现象的出现,在一定程度上削弱了高考作为教育评价所应有的价值判断的功能。
3.3原始分数不具有可加性,高校难以“择优而录”
生活中常常会听到“我今年考了××分”、“我俩总分相差××分”如此之类的总分数的比较,但是,将原始分数直接求算术和可行吗?
高考原始分数是否具有可加性?
教育测量与评价中,如若求多个测量量的和必须满足两个条件:
1、求和的多个测量量应具有相同的单位;2、求和的多个测量量应该具有相同的价值,即参照点需相同。
如上所述,在第一节中,已经分析了原始分数的单位不具有等值性,参照点也不相同,因此,根据教育测量与评价的相关知识,不能将原始分数直接相加求算术和,即求取高考的总分。
目前,我国高考统计总分却采用原始分数相加直接求和,显而易见,这是不科学的。
高校招生单位却依据考生的原始分数的总和进行“择优而取”,其所择的“优”是实际的优吗?
以上内容已经分析出原始分数不具有可加性,而现行的高考总分却是直接由原始分数相加而得,严重的误导了高校招生单位,导致高校招生单位很可能并没有招录到真正的优秀考生,并没有达到高考作为教育评价的目的。
3.4原始分数难以判断录取分数线
第1章中已经说明高考作为教育评价所具有选拔的功能,要实现高考的选拔功能,必须借助于高考录取分数线这一标准。
在我国,各校的录取分数线都不一样,但是分数线划定的标准都是一样的,都是按照今年实际报考本校的考生分数,和他们要招收的学生人数来确定。
例如,今年浙大要在重庆招10个人(假设),而重庆有100个人报名,这一百个人中,排在第十名的考生考了600分,那么今年浙大在重庆的录取分就不会低于600;但如果重庆只有两名考生报考浙大,浙大在重庆市的招生人数不变,依然是10人,那么这个分数线就会下调。
所以说考生仅从原始分数以及自己在所有考生中的绝对排名是无法判断被高校招生单位录取的可能性的大小。
这样易造成资源浪费,一方面,考生可能由于没能被自己所喜欢的学校或专业录取,而选择复读或虽然到被录取的学校继续读书,但毕业后选择与自身专业不相关的行业从事工作;另一方面,高校招生单位反复调整录取分数线,大大降低了工作效率。
以下表为例:
天山一中高考前十名成绩(原始分数)
班级
姓名
语文
理数
理综
英语
总分
名次
2
刘昊岩
102
145
266
117.5
630.5
1
2
徐冰
108
127
237
128.1
600.1
2
1
屈春晖
103
136
242
118.1
599.1
3
1
周欣宇
91
138
255
114.4
598.4
4
1
汪煜涛
113
122
231
128.1
594.1
5
2
于洪磊
108
124
240
121.9
593.9
6
1
王然
114
126
227
122.5
589.5
7
1
刘丹
97
140
231
120
588
8
2
许丽琪
112
128
221
126.3
587.3
9
2
丛泽龙
116
117
221
127.5
581.5
10
若某一大学的往年录取分数线都在580分(原始分数)以下,且今年只在该省招录8个人,以天山一中高考成绩作为样本来表示总体(内蒙古自治区理科考生总体分数),即假设今年该校在天山一中招录8人。
从表中原始分数可知,这10个人全部都过了这一大学的往年录取分数线,但如排在第九名、第十名的许丽琪、丛泽龙究竟能否被这一大学录取以及录取的可能性是多少?
从表中的原始分数数据只能了解到许丽琪、丛泽龙两位考生可能被录取的信息,但录取的可能性是多少,却无从得之。
第四章标准分数体现教育评价的功能
原始分数存在如此多的局限,没有发挥出高考应有的教育评价功能,有必要对现行高考分数评分法进行改进,采用标准分数的评分法。
什么是标准分数?
标准分数是如何更加体现高考作为教育评价的功能?
4.1标准分数的定义和性质
4.1.1标准分数的定义
标准分数(standardscore),是以标准差(S)为单位表示一个原始分数在总体中所处的相对位置的量数,通常简称为Z分数(Z—score)或基分数。
离差,即原始分数距离平均数有多远,表示原始分数在平均数以上或以下几个标准差的位置,从而明确该原始分数在总体中的相对地位的量数。
标准分数依据原始分数对平均数的相对地位、该原始分数所在总体分数的离中趋势(一般用标准差S来表示数据的离散性,即离中趋势)两个方面来表示原始分数的相对位置。
标准分数的计算公式:
或
注:
X为原始数据;
X为一组数据中的平均数;
为一组数据所在总体的平均数;
S为标准差;为一组数据所在总体的标准差;
为一组原始数据X的总和;
为一组原始数据X的平方的总和;
N为原始数据的数量。
但在应用标准分数时,一般将标准分数经过线性转化成T分数、标准十分、标准九分等。
例如,在我国,通常将原始分数转换后的Z分数再进行线性转化为C分数(C=500+100*Z),在一定程度上避免了标准分数较小或出现负数的现象(高考成绩一般为正)。
4.1.2标准分数的性质
1、Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对位置量。
标准差是不具有实际意义的单位。
当原始分数低于平均值时,Z分数为负数,反之则为正数。
如下图:
标准分数正态分布图
从图中可以清楚看到当原始分数低于平均值时,Z分数为负,反之,则为正。
例如:
2013年湖南省全体文科考生的语文的平均分是90分,标准差是10分。
两名2013届湖南省文科考生的语文原始分数分别是100分、80分,根据标准分数的计算公式可知,其转换后的标准分数分别是1、-1(;),即语文原始分数是100分的考生在全体2013届湖南省文科考生语文平均分(90分)以上1个标准差的相对位置;而语文原始分数是90分的考生处于全体2013届湖南省文科考生语文平均分(90分)以下1个标准差的地位;
2、规定标准分数的标准差为1,保证了不同性质的分数在总分数中的权重是一样的。
且只有呈正态分布(参照上面正态分布图)的原始分数才能转换成标准分数,不呈正态分布的原始分数须经进一步的转换呈正态分布的分数。
在教育统计学中,随机变量一般呈正态分布,考生高考成绩亦是如此,因此,高考原始分数分布一般呈正态分布。
4.2标准分数的优越性
在教育评价中,教育评价的主体可以分为两类:
个体评价和社会评价。
个体评价又包括个体自我评价和他人评价,简称为“自评”和“他评”;社会评价是依照社会的外在标准进行的评价。
而高考这一教育评价的主体主要是个体评价,即是考生参照自身高考分数而获得一些信息的自我评价和高校招生单位参照考生的高考分数作出抉择的他人评价。
因此,无论是“自评”还是“他评”都需要参照高考分数。
现阶段主要的两种高考分数的评分法:
原始分数和标准分数,以上内容已说明原始分数在教育评价应用中的一些劣势,那么,标准分数相对于原始分数在教育评价应用中具有哪些优越性?
4.2.1标准分数的可比性有利于高校“择优而录”
标准分数的最大特征是相对性,是个体相对于总体所处的位置。
标准分数以团体平均分作为比较的基准,以标准差为单位。
跟一般意义上的数量单位不同,其单位不具实际意义(无实际单位),因此不同科目的原始分数一经转换为标准分数,就可以直接进行比较,从而可以确定某一考试成绩在该总体考试成绩中的相对位置,实现高考的事实判断和价值判断的教育评价功能,明确辨识真正的优秀考生。
标准分数的可比性,一方面,可以比较同一考生不同考试成绩优劣;另一方面,还可以比较不同考生不同考试成绩优劣。
这样招生单位不仅可以根据某一考生各科考试成绩的相对优劣性,准确判断出这一考生究竟是最擅长哪一方面的学习,而且还可以在多位考生成绩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 标准 教育 评价 中的 应用 我国 高考 分数 评分 毕业设计