《教育统计与评价》资料.docx
- 文档编号:3871353
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:17
- 大小:61.05KB
《教育统计与评价》资料.docx
《《教育统计与评价》资料.docx》由会员分享,可在线阅读,更多相关《《教育统计与评价》资料.docx(17页珍藏版)》请在冰豆网上搜索。
《教育统计与评价》资料
《教育统计与评价》测试一
填空
1.描述性评价的主要特点是:
计算综合指标。
2.标准分数的作用是把各类原始分数统一在高于或低于平均数多少的标准上衡量的。
3.显著性水平指的是显著时犯错误的可能性。
二、选择题1.对两个独立总体的比较即是何种比较?
.横向
2.一般来说,复习次数与遗忘程度是何种相关情形?
负相关
3.欲比较学生德、智、体、美四个方面是否均衡发展时,应使用何种综合指标?
.标准差
4.欲研究辅导是否有效的问题,分别对学生辅导前后进行同一难度不同题目的测验,这时对测验分数的检验方法是哪种?
t检验 5.欲研究考试结果能否反映学生的真实水平时,应作何种分析?
信度
6.若统计检验结果在0.05的水平上显著,则在0.01水平上是否也是显著?
.不一定
三、应用题
1.某高三教师自编一套英语测试题,用来预测学生的高考英语成绩,问:
据下列测验结果能否说明自编测验对高考有预测效果?
分析效标关联效度,应计算积差相关系数并且检验。
2.据某题数据资料计算难度并给予评价。
按主观题难度系数公式计算,再判断属难易或适中
四、简述题
1全面说明等级平均数的作用。
根据等级平均数适用的数据及评价对象进行思考
2应用哪些统计方法可以全面评价教学实验后学生的学业成绩?
独立总体和相关总体平均数差异分析结合。
《教育统计与评价》测验二
一、填空题
1定量评价的主要特点是从量的方面说明教育问题。
2标准差是反映现象内部差异的一个综合指标。
3显著性水平愈小,叫推断结果犯错误的可能性愈小。
二、选择题
1.设计调查问卷时,应尽可能采用何种问卷形式?
限制式
2.欲全面评价个人或集体时,宣使用何种平均数?
评分平均数
3.欲评价某事物的水平时,应使用何种综合指标?
平均数
4欲研究某校干部和教师对该校某一改革方案的看法是否一致的问题,属何种检验情形A两个独立总体比例
5欲研究性格与性别的关系问题,应使用何种检验方法?
检验
6欲研究某班统计学考试成绩是否存在显著的性别差异,应使用何种表?
t分布表
三、应用题
1.试比例下列两学生某科两次考试总绩哪个优?
其中学生第二次考试是否退步?
甲、乙生两次成绩分别转为标准分数再相加或比较
2.试对下列某校办二厂两个班组职工的月收入情况予以比较,并说明理由。
(单位:
元)甲组:
672,672,666,660,654,648,648乙组:
690,684,672,660,648,636,630综合应用平均数和标准差比较
四、简答题
1如何理解一个人的测量结果只是他的真实水平的估计值?
据随机误差进行思考
2应用哪些统计方法可以全面评价教学实验后学生的学习兴趣情况?
独立主体和相关总体比例差异分析结合
教育统计学:
教育统计学是应用统计学的一个分支,是统计学与教育学的一门交叉科学。
它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学。
教育评价:
教育评价是按照一定的教育性质、教育目标,采用定量和定性等手段对教育客观事物进行测量、分析、价值判断以及提供决策有用信息的一个过程。
描述统计:
对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标。
借助于这些综合指标,进行比较并作出结论。
推断统计:
根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。
在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知。
横向评价:
是将评价对象与其他对象进行比较。
它的特点是在评价时不考虑评价对象的背景情况和今后的发展趋势,只是考察评价对象在特定的时间和特定的空间中的现实状态,所以又称静态评价。
纵向评价:
是对评价对象的过去和现在进行比较,即考察其历史情况,注意其发展的潜力和发展趋势,所以又称动态评价。
绝对评价:
是将病人对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价。
相对评价:
是将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序。
相对评价也称常模参照性评价。
定性评价:
是对教育客观事物的性质进行分析,即从质的方面说明教育问题。
定量评价:
是对教育客观事物的数量方面进行分析,即从量的方面说明教育问题,或者说对教育问题的说明提供数量的依据。
安置性评价:
是采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等。
即为作出某种安排,一般在教育教学活动前进行。
诊断性评价:
是采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施。
即为发现问题,一般在教育教学活动前或中进行。
形成性评价:
旨在改进和发展正在进行着的教育教学活动或方案,即为揭示存在的问题,及时反馈信息,及时进行调控管理。
即为提供过程中的信息,一般在教育教学在活动中进行。
终结性评价:
是在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明。
即为作出某种鉴定,一般教育教学在活动终进行。
限制式问卷:
是对提出的问题,根据测评的需要以及实际情况,事先安排好答案,由对方从中选择适当的答案。
即找出问题后安排答案,让对方从中选择。
限制式问卷又分为单选、多选和排序三种。
开放式问卷:
是对提出的问题不事先安排答案,而留出空位,让对方自由回答。
即找出问题后不安排答案,让对方自由回答。
半限制式问卷:
找出问题后既安排答案,也有自由回答。
类别量表:
表示事物的分类。
(统计人数)
顺序量表:
表示事物的顺序。
(排名次)
等距量表:
既可表示事物的分类、顺序,也有相等的计量单位和相对零点。
比率量表:
既可表示事物分类、顺序,也有相等的计量单位和绝对零点。
一般来说,类别量表测量得到的数据库的类别数据;顺序量表测量得到的数据称为顺序数据,等距量表和比率量表测量得到的数据均称为测量数据。
描述性评价:
是对数据资料计算综合指标值,然后根据综合指标值对教育客观事物给予评价。
综合指标:
指的是从教学方面综合说为事物特征的指标。
常用的综合指标有绝对数、相对数、平等数和标准差。
集中趋抛:
指大多数数据比较趋近的水平。
通常把集中趋势的量数称为集中量数,平均数是最常用的一种集中量数。
离中趋势:
指数据之间变异程度或离散程度。
通常把描述离中趋势的量数称为差异量数,标准差是最常用的一种差异量数。
标准分数的作用:
把各种不同类型的分数统一在高于或低于集体平均分多少的标准上衡量。
标准分数的具体应用
1.正确评价同一学生科目的成绩,如前面例子。
2.正确评价同一学生同一科目不同阶段的成绩。
如前面例子。
3.正确评价不同学生多科总成绩。
例如p129表8-10。
高考标准化考试报告的分数是已经对z进行了线性变换,即y=500+100Z,这并不会改变原来z的排序,线性变换避免了负数的出现,且有利于选拔。
推断性评价:
对数据资料进行统计检验,然后依据统计检验的结果并以一定的置信度对教育客观事物给予评价。
统计检验:
数据资料进行统计检验
独立总体:
两个总体的对象不同,对它们的差异评价,也可称为横向评价。
相关总体:
两个总体的对象相同,对它们的差异评价,也可称为纵向评价。
t检验:
独立总体和相关总体的检验都应用了t分布表,这种应用t分布表进行统计检验的方法,通常称为t检验。
显著性水平:
效度是考试的有效性。
内容效度:
考试内容与预定要考内容一致性程度。
内容效度的分析方法:
利用双向细目标进行分析。
注意编制双向细目表的步骤和要求。
效标关联效度:
考试结果与效标的一致性程度。
效标关联程度的分析方法:
主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。
信度:
考试的可靠性。
再测信度:
用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。
再测信度的分析方法:
主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且进行显著性检验。
再测信度的不足之处:
前后两次考试的时间间隔不易把握。
分半信度:
有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。
这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。
需理解的问题
1、四种收集资料方法及各自所适用的情况观察法
(1)、观察法的主要特点是到现场观察,特别适用于行为表现方面的评价。
(2)、问卷法的主要特点是填答问题表格,主要适用于内隐的心理活动方面的评价,比如思想性、认识性比较强的问题。
(3)、访问法的主要特点是直接交谈,特别适用于深入了解情况以及不具备填答问卷能力的对象。
(4)、测量法的主要特点是具体测试。
2、选用问卷种类的原则
(1)、能比较简明扼要表达答案意思的可用限制式问卷。
(2)、所比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用来限制式问卷。
(3)、对于复杂的一些探讨性的问题。
可采用开放式问卷
3、对测量结果的正确理解(重要)
鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p55第五段。
我们不能把测试结果看作一个确定的点,而是具有一定分布范围的或带状的。
一个人测试的结果只是他的真实结果的估计值。
一个人测试的结果只是他的真实结果的估计值。
认识到这一点,我们即可避免对两次测试结果之间小的差别作过分的解释,或不会将两位被测者之间分数不甚大的差别当作有意义的事情看待。
4、各种综合指标的作用
绝对数说明事物的规模。
相对数说明事物的程度或幅度。
平均数说明事物的水平。
标准差说明事物或现象内部差异情况的一个指标。
5、对标准差的解释
标准差的值愈大,则说明差异愈大,否则说明差异较小。
但究竟标准差大好还是小好?
这不能一概而论需要具体问题具体分析。
6、等级平均数:
是对总体中各个体根据一定的标准、条件赋予不同等级并按等级归类汇总以后再计算加权平均数的方法。
公式:
X为代表各等级编号,f为代表各等级次数,N代表总次数。
等级平均既可用于总体的评价,也可用于对个体的评价。
标准分数:
标准分数的解释
1.Z>0时,该成绩高于集体平均水平。
2.Z<0时,该成绩低于集体平均水平。
3.Z=0时,该成绩就处于集体平均水平。
4.Z值愈大,该成绩愈好。
相关系数是反映两事物之间的联系方向和程度的一个量数。
通常用表示,它的取值范围限于。
分半信度的分析方法:
先计算两部分结果的相关系数,再代入分半信度计算公式,即
客观题的应达到0.9以上,主观题的应达到0.8以上。
难度:
试题的难易程度。
难度系数的计算
主观题:
公式p=x/w。
x为某题平均得分,W为该题满分值。
难度系数的解析:
1)P>0.7时较易
2)P<0.3时较难3)时较适中
客观题:
公式p=k/N。
K为某题答对人数,N考生总人数。
一般来说,全卷的平均难度应在0.45-0.55之间。
全卷的题目难度分配一般为易:
中:
难=3:
5:
2。
当然结合考试目的灵活处理。
区分度:
试题的鉴别能力。
区分度分析:
1.相关法:
计算学生试题得分与试卷总分的相关系数并且进行显著性检验。
2.两端分组法
①两端分组法区分度(D)的计算公式;D=
其中分别为学生高分组和低分组中的难度。
注意高分组和低分组各取27%的学生。
②两端分组法区分度D的解释
1)当D时区分度属好
2)当时区分度比较好
3)时区分度还可以
4)
计算公式及应用
一、独立总体差异检验规则
若
则认为两个比例差异不显著,否则认为差异显著。
可查正态分布(附表一)得到。
例1:
某方案的态度:
80教师70赞成,100学生74赞成
则P1=70/80=0.875P2=74/100=0.74n1=80n2=100
计得Z=2.360
查得Z1-0.05/2=0.975=1.96
因l2.360﹥1.96故该方案的态度存在显著差异
例2:
某市甲校参加课外活动的学生占64%,忆校占58%。
解:
本题属于“独立总体比例的差异分析”情形。
但本题缺少条件:
假定甲120人,忆110人。
1、算也z值,将数据代入公式
算得Z=0.94
2、检验:
因为Z=0.94﹤Z1-0.05/2=0.975=1.96
所以可以认为两校参加课外活动的人数比例没有差异。
二、相关总体差异检验规则
若
则认为两个比例差异不显著,否则认为差异显著。
公式中的b、c是看法不一致的两类人数。
例如100人对两个方案的表态有下面四种情况:
①a=55②b=5③c=15④d=25
其中第②、③两类人数即为b和c
以上关于比例的差异分析,无论是独立总体还是相关总体的检验都应用了正态分布表,这种应用正态分布表进行统计检验的方法,通常称为u检验。
例1解:
1、算出Z值,将数据代入公式,计得Z=2.24
2、检查:
因为Z=22.4﹥Z1-0.05/2=Z0.975=1.96
说明教师对两个方案的态度存在显著差异,方案2比方案1容易接受
例2100青年作两个实验。
结果:
两个都通过有45人,实1通过而实2未通过有23人,实1未通过而实2通过有5人,两个实验都不通过有27人。
解:
本题属“相关总体比例的差异分析”情形
1、算出Z值,将数据代入公式,计得Z=3.4
2、检查:
因为Z=3.4﹥Z1-0.01/2=Z0.9995=3.29
说明两个实验的成绩结果相差非常显著,方案1比方案2简单得多。
三、检验(两事物均为类别数据)
x21(0.05)=3.841x21(0.02)=5.412x21(0.01)=6.635x21(0.001)=10.827
2×2的检验规则(均为二分型的类别数据)
若
则认为两事物关系不显著,否则关系显著
例1参加公益态度:
积极:
男20女30
消极:
男25女16
解:
本题属“检验”情形
1、算出x2值
将各数据代入公式x2==3.17
2、检验:
df=(r–1)(k-1)=(2-1)(2-1)=1
查表x21(0.05)=3.841
因为x2=3.17﹤x21(0.05)=3.841,所以学生参加公益活动与性别不存在显著关系
(青年的地区来源对电影的评价态度没有差异)
作业1:
数学成绩是否存在显著差异?
男:
96-72-83-67-78-92-89-54-87-74-74-68-71-63
女:
95-76-88-81-68-77-47-72-83-62-67-59-74-85-87-76
解:
本题属于:
独立总体平均数的差异分析”情形.
1、算标准差
代入数据,算得S1=11.91
同理,算得S2=12.25
2、算t值
算得t=0.333
3、检验:
df=n1+n2-2=14+16-2=28
查表得t(28)0.05=2.048
因为|t|=0.333﹤t(28)0.05=0.05
所以该班男女生的数学成绩不存在显著差异。
作业2:
教师宣称,他的学生在期中和期未考试成绩相似,为检验他所宣称的是否属实,随机抽取九名学生考察,结果如下,这些资料是否证实教师所宣称的结果是事实?
学生号123456789
期中66-67-80-83-92-54-89-67-85
期未81-82-73-84-87-68-97-76-91
解:
本题属于“相关总体平均数的差异分析”情形
1、求数据差的平均数Xx1-x2(期未为1、期中为2)
代入数据算得Xx1-x2=5
2、求配对数据差的标准差Sx1-x2
代入数据算得Sx1-x2=7.4833
3、算得t值
4、检验:
df=9-1=8查表得t(8)0.05=2.306
因为|t|=2.004﹤t(8)0.05=0.05
所以期中、期未考试成绩不存在差异。
该教师所宣称的结果属实
作业3:
下列学生的历史、地理成绩,能说明学生的历史、地理成绩有显著的关系吗?
学生号123456789------15
历史81-86-73-81----------77-78
地理80-84-80-72----------77-72
解:
本题属于“积差相关”情形
1、算出标准差。
可算出Sx=5.26,Sy=5.99Sx-y=7.3
2、计算相关系数r
将以上的数据代入公式r=
3、检验df=15-2=13
查p381的附表得r(13)0.05=0.5139,r(13)0.01=0.641
因为r=0.163﹤r(13)0.01=0.641
所以认为历史与地理成绩差异不显著。
作业4:
20名同龄青年的身高,能说明身高与性别有显著的关系吗?
性别女男女男女男女男女男女男
身高153155146156--------------------------------156169
解:
本题属于“点双列相关”情形:
1、分别算得X指标Xp=158.839(男生)Xq=151.25(女生)P=0.6q=0.4Sx=6.72
2、算出相关系数rpq=
3、检验df=20-2=18
查表r(18)0.05=0.444,r(18)0.01=0.5614
因为rpq=0.553﹥r(18)0.05=0.444
所以身高与性别有显著差异。
第一讲教育统计学:
应用统计学的一个分支,是统计学与教育学的一门交叉科学.它是运用统计学的原理和方法,研究和把握教育现象数量方面的一门方法论科学教育评价:
包含评价依据、评价技术和评价作用三部分;是一个系统的综合性的活动过程。
强调定量分析判断与定性分析判断的结合。
贯穿于一切教育活动之中。
描述统计:
对调查获得的数据资料进行整理、概括或计算出能够反映教育现象的综合指标.借助于这些综合指标,进行比较并作出结论推断统计:
根据样本提供的数据资料特征并以一定的置信度推断或预测总体的有关情况。
在教育研究以及教育实际工作中,往往所要调查的总体很大,不能或难以进行全面调查,这时往往运用推断统计的方法,由局部(样本)推论总体,由已知推论未知横向评价:
将评价对象与其他对象进行比较,不考虑评价对象的背景情况和今后的发展趋势只考察评价对象在特定的时间和特定的空间中现实状态,又称静态评价纵向评价:
对评价对象的过去和现在进行比较,即考察其历史情况注意其发展的潜力和发展趋势,又称动态评价.绝对评价:
将评价对象与评价对象总体外的某一客观标准进行比较,又称目标参照性评价.(毕业考、年轻教师合格课).相对评价:
将评价对象与评价对象总体内的特定元素进行比较,或者对评价对象放在评价对象总体内排序,也称常模参照性评价.定性评价:
对教育客观事物的性质进行分析,即从质的方面说明教育问题.定量评价:
是对教育客观事物的数量方面进行分析,即从量的方面说明问题,或者说对教育问题的说明提供数量的依据安置性评价:
采用摸底测验的形式,了解学生已具备的知识基础与技能,以便决定教育教学的起点或者作出某种安排等(新生实施摸底测验、在教育教学活动前进行)诊断性评价:
采用诊断测验的形式,研究和发现学生学习中存在的问题和实际困难,以便采取恰当的补救措施.(专项如口算测验、阅读测验、写作测验在教育教学活动中进行)形成性评价:
旨在改进和发展正在进行着的教育教学活动或方案,即及时揭示存在的问题,及时反馈信息,及时进行调控管理.(平时的测验、单元测验在教育教学活动中进行)终结性评价:
在教育教学活动的终止时,对成果的核定、鉴定,或对评价对象作出某种资格证明(毕业考、年终考核、评选优秀工作者在教育教学活动结束时进行)教育统计学的作用1.教育统计学是教育科学研究中定量分析的重要工具,唯物辩证法告诉我们,任何客观事物都有其质与量的两个方面,教育现象作为客观存在的一种事物也不例外,因此,教育教学必须对事物进行全面的分析,不要有质的研究分析,也要有量的研究分析.2教育统计学是教育评价技术中的重要方法,在众多的教育评价技术中,定量评价是很重要的一个方面,而教育统计方法又是定量评价中分析资料的重要方法。
3教育统计学有助于增强教育决策的科学性。
教育统计学中收集资料、分析资料的科学方法以及科学的推断,都可以为教育决策提供依据,提供资料,从而增强教育决策的科学性,提高管理的科学水平。
4教育统计学有助于培养科学的思维方式在新的时期,思维应具有科学性。
在教育统计学内容中,无论是描述统计或是推断统计,都可以培养人们的统计思维,学会科学的推论与思考问题的方法,形成实事求是地对待一切事物的辩证唯物主义态度。
教育评价的作用:
1导向作用2.管理作用3.激励作用4.诊断作用5.鉴定作用教育统计与教育评价的联系与区别:
教育统计与教育评价既有联系,也有区别。
联系:
教育统计是教育评价技术中的重要方法,而教育评价是教育统计的深化,它是在统计基础上进一步对事物作出价值判断。
区别:
教育统计①主要目的:
数据分析②技术特点:
数量化③活动特点:
单一性活动;教育评价①主要目的:
价值判断②技术特点:
定量与定性结合③活动特点:
综合性活动第二讲指标:
狭义的概念:
被评价的因素。
广义的概念:
包括因素、数量、标准和文字描述。
指标体系:
被评价的全部因素的集合设计指标体系的六个原则1.方向性(思想)2.一致性(思想)3.系统性(技术)4独立性(技术)5.可测性(操作)6.可接受性(操作)指标体系在评价中的作用1对评价对象的行为起质的导向作用。
2有助于评价反馈功能的发挥。
3有助于提高评价的客观性和精确性。
4有助于增强评价结果的可比性。
总的来说,指标体系即是评价工作的基础,也是评价工作的核心,它对评价起着统揽全局的作用。
第三讲权重:
每一指标在指标体系中的重要性程度。
布鲁姆“分类学”中认知领域的作用及分类①特点:
对教育目标分解为认知领域、情感领域和动作技能领域。
认知领域又分为记忆、理解、应用、分解、应用、分解、综合、评价六个方面。
②适用:
重点是认知领域的分类,它主要用于学业方面的评价,如学科考试的命题可灵活运用认知领域的分类,例如P332表12-2,P50表3-1以及P28表2-3。
对照配权法确定权重的步骤:
由评价者对评价指标中的每两个指标进行对照比较赋分,然后分别计算各个指标的得分和,最后将每个指标的得分和除以全部指标的总得分,所得结果即为每个指标的权重。
咨询法确定权重的步骤①让每个被咨询者对指标排序,重要至次要的序数从大到小排列(如表2-7)②把众多被咨询者排序结果放在一个表(如表2-8)③计算每个指标的总序数④将每个指标的总序数除以全部指标的总序数即为每个指标的数量。
(见p35表2-8)
第四讲限制式问卷:
对提出问题根据测评的需要以及实际情况,事先安排好答案,让对方从中选择。
限制式问卷又分为单选、菜单式多选和排序式三种。
开放式问卷对提出问题事先不安排答案,让对方自由回答。
半限制式问卷对提出问题事先既有安排好答案,也有自由回答。
类别量表(主要用来测,分等级如统计人数情感、品德、非智力因素,得到类别数据)表示事物的分类。
顺序量表:
表示事物的顺序(排名次)等距量表、比率量表(又统称测量数据因为都有计量单位学业、年龄、分数)等距量表:
既可表示事物的分类、顺序,也有相等的计量单位和相对零点。
比率量表:
既可表示事物分类、顺序,也有相等的计量单位和绝对零点。
1四种收集资料方法及各自所适用的情况
2选用问卷种类的原则①能比较简明扼要表达答案意思的可用限制式问卷。
②能比较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可用半限制式问卷。
③对于一些复杂的探讨性的问题,不易简明扼要提安排答案的,可采用开放式问卷
3对测量结果的正确理解:
误差不能把学生的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育统计与评价 教育 统计 评价 资料