论文统计在教育科研中的运用.docx
- 文档编号:27215998
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:19
- 大小:66.65KB
论文统计在教育科研中的运用.docx
《论文统计在教育科研中的运用.docx》由会员分享,可在线阅读,更多相关《论文统计在教育科研中的运用.docx(19页珍藏版)》请在冰豆网上搜索。
论文统计在教育科研中的运用
第十章统计在教育科研中的运用
一教学目的
1、了解推断统计的基本方法
2、掌握描述统计的基本方法
2、学会合理运用统计方法为教育研究服务
二教学重点
掌握描述统计的基本方法
三教学难点
了解推断统计的基本方法
四教学时数:
2学时实践学时
五操作练习
结合自身的研究项目或有关文献理解统计方法的运用
六教学反思
第十章统计在教育科研中的运用
运用了各种各样的研究方法进行研究以后,必定会获得各种各样的研究资料与信息。
如何对这些资料进行科学的分析与处理从而使这些资料显得更有意义,这是本章研究的重点。
数据的分析与处理主要采用统计的方法,分为描述统计与推断统计两大类。
第一节描述统计
描述统计是指在研究者实施了研究设计,收集到大量的研究数据后,对其进行初步整理、归纳和分组,简缩成易于处理和理解的形式,计算所得数据的各种统计量,并用图表或概括性的数字来描述和总结有关事物或现象的分布情况、波动范围和关系程度等,以揭示其特点和规律。
描述统计主要涉及集中量数、差异量数、地位量数和相关量数等内容。
一、集中量数
集中量数是用来描述数据分布集中趋势的统计量,它是一组数据的代表值,代表着研究对象的一般水平。
常用的集中量数包括算术平均数、中位数和众数。
1.算术平均数(Mean,
)
算术平均数通常称平均数,又称均数或均值。
它是衡量资料集中趋势的统计量,是一组性质相同的数值的代表值。
算术平均数的定义是:
一定数目的观测值的总和,除以该数目所得的商。
用公式表示:
=
(1)
其中,
表示x1+x2+…+xn
n表示观测值的数目。
例1,甲组5位学生的教育科学研究方法成绩分别为100、99、60、21、20,乙组5位学生分别为65、63、60、57、55。
那么,
算术平均数是根据全部观测值计算得来的,能代表整体,较少受到抽样变动的影响,简明易懂,计算方便,是最严密、最可靠、最简单、应用最广泛的一种集中量数。
但是,有时它会受到少数极端值的影响而大大改变其数值,削弱其代表性。
2.中位数(Median,Mdn)
中位数就是把次数分布区分为两部分的一个点,其两边各有相同的观测值个数。
观测值为奇数且无重复数值时,当中的一个数值即为中位数;如观测值的个数为偶数,那么中间两个数值的均数就是中位数。
中位数是根据全部观测值数目确定的,简单明了,计算方便。
但它不如平均数那样容易被人理解,其用处也不如平均数那么广泛。
3.众数(Mode,Mo)
在一组数据中出现次数最多的那个数值就是众数,通常众数只用来对一组数据的分布情况作粗略的了解。
例如,53,64,53,64,80,64,81这一组分数中,64出现了三次,它就是众数。
众数不受极端数值的影响,易于理解。
二、差异量数
差异量数是用来描述数据分布差异情况或离散程度的统计量。
差异量数可反映集中量数的代表性:
差异量数越大,集中量数的代表性越小;差异量数越小,集中量数的代表性越大。
例如,如下两组数据:
甲组5075100
乙组657585
甲组差异量数较大,程度参差不齐,平均数75的代表性比较小;乙组差异量数较小,程度较齐,平均数75的代表性较大。
常见的差异量数有全距(R)、平均差和标准差(StandardDeviation,S)。
全距是表示数据分布离散程度最简单的方式,即一组数据中最大数与最小数之差,所以又称两极差。
如某班学生数学成绩最高为98分,最低为50分,则全距R=98-50=48。
平均差表示各量数离差(X-
=x)的平均数。
在统计分析中,经常应用的是标准差。
标准差是一组数据离差平方和的均方根。
其计算公式是:
(2)
其中,Σ表示相加求和,X表示各数据,
表示算术平均数,N表示数据个数。
按公式
(2),可算出例1中甲组标准差为S甲=35.3,乙组标准差为S乙=3.7,这就说明:
甲组同学分化现象比较严重,乙组同学差异不大。
虽然两组的均数都是60,但乙组标准差仅为3.7,均数60能代表该组,具有典型意义;甲组的标准差高达35.3,差异十分显著,均数60分没有典型性。
标准差是最重要、最完善的差异量数,常与平均数一起使用,以便比较确切地描述数据分布的整体状况。
它是统计推断中常用的统计量数。
三、地位量数
在教育测量后得到的分数,通常以百分制表示,一般称为原始分。
原始分存在两大缺陷。
一是不能反映各分数在总体中的地位,同样是80分,可能在总体中名列前茅,也可能名附榜尾。
二是不同学科或不同考次的分数具有不同的价值,不能简单相加求其总和来确定位次。
因此,仅仅用原始分的总分来判别学习成绩的高低,显然是不够公正不够科学的。
为了解决原始分的上述缺陷,就得引进地位量数。
地位量数是描述或确定某一个观测值在全体数据中所处位置的统计量数。
常用的地位量数是标准分数(StandardScore,Z)。
标准分数又称Z分数,是以标准差为单位来表示一个分数在团体中所处位置的量数。
所以也叫相对位置量数。
用公式表示:
(3)
其中,X为各原始数值,
为各原始数值的平均数,S为标准差。
例3,某生在班级第一次考试中得到70分,该班平均分为64.2,标准差为16.3。
该生在班级第二次考试中得到81分,这次考试的平均分为78.5,标准差为11.3,经计算得到标准分为0.22。
从上述计算中可以看出,虽然该生第二次考试的分数比第一次提高了11分,但是该生在班级中的实际相对地位却下降了。
例4,在某考试中,甲乙两生语文、数学、外语三科原始总分都是253分,限于名额,只能录取一名。
请转化为标准分再决定录取结果。
成绩分布如下表:
表10.1甲乙两生考试成绩
语文
数学
外语
总分
甲
76
92
85
253
乙
88
80
85
253
平均分
70
85
81
标准差
12.5
3.1
5.5
计算:
(1)甲生语文标准分Z语=
=0.48
甲生数学标准分Z数=
=2.26
甲生总标准分Z甲总=0.48+2.26=2.74
(2)乙生语文标准分Z语=
=1.44
乙生数学标准分Z数=
=-1.61
乙生总标准分Z乙总=1.44+(-1.61)=-0.17
Z甲总-Z乙总=2.91,因此,应录取甲生。
标准分数不仅能说明原始分数在分布中的地位,而且因为它是以标准差为单位的等距量表,故经把原始分数转化为标准分数,可以在不同分布的各原始分数之间进行科学的比较,因此,标准分数比较多的是用于成绩评定和录取新生工作上。
由例4可知,甲乙两生的原始分是相同的,但是,转化为标准分以后,甲生明显优于乙生。
原因在那里?
主要原因就在于标准分考虑到了三门学科的“分值”是不同的,渗透了相对地位概念。
四、相关量数
相关是指两列变量之间的相互关系。
例如身高与体重、知识与能力、语文学习与外语学习、班级人数与教学效率的关系等。
相关系数是用来表示相关程度的数量指标,用r表示。
相关系数的取值范围应是:
–1≤r≤1。
当0<r≤1时为正相关,是指一个变量也随着增加。
当-1≤r<0时为负相关,其意义与正相关恰好相反。
而r=0时叫零相关,表示两变量的变化互不相关。
根据相关系数的不同数值,教育统计上分别给予相应的程度名称,如下表:
表10.2 不同相关系数的描述
相关系数
0.0-0.3
0.3-0.5
0.5-0.8
0.8-1.0
程度
低度
普通
显著
高度
应该说明的是,当两个变量相关时,只表明它们之间存在某种联系而已,并不意味着它们之间必定存在某种因果关系;当表中数值为正数时,则表示相应的正相关程度,又称正相关;当表中数值为负数时,则表示相应的负相关程度,又称负相关。
下面介绍两种基本相关系数及其计算方法。
(一)积差相关系数(Product-momentCoefficientofCorrelation,r)
当测算的两类变量是用分数或数量表示时,一般用积差相关进行计算。
用公式表示:
(4)
其中,(i=1,2,…,n)是n个第一类变量,
(i=1,2,…,n)是n个第二类变量,
是第一类变量的均数,
是第二类变量的均数。
使用公式时,两类变量的对数n要超过30(n>30),否则计算它们的积差相关系数就失去有效意义。
例5,某小学在统考中随机抽取30名考生的语文与数学成绩,试计算它们的相关系数。
语文成绩:
606253576259484146585155787460625357625948414658515578746062
数学成绩:
628077656467535867656868695888628077676561586568686958886280
代入计算公式(4),得r=0.32,说明30位考生的语文成绩与数学成绩呈普通相关。
(二)等级相关系数(RankCorrelation,rR)
在实际工作中,如果所掌握的资料不是用分数表示,而是用等级表示的,就需要用等级相关来计算相关系数。
用公式表示:
rR=1-
(5)
其中,di表示两类变量每对数据等级的差数
n表示变量的对数。
等级相关对n的多少不作要求。
例6,某校10名教师,教龄与教学能力评定等级如下表,试分析两者的相关程度。
表10.3教龄与教学能力评定等级
教学人员
教龄
教龄等级
教学能力等级
等级差数d
差数平方d2
一
3
10
二
8
3
三
2
9
四
10
5
五
6
8
六
6
6
七
12
2
八
9
4
九
5
7
十
7
1
合计
计算时,先按教龄长短排出教龄等级,写在相应栏目内,最长为1级,余依次类推。
教龄相同的,给予平行的等级,如序号“五”“六”两位教师都定级为6.5级(此时无7级)。
表中的“等级差数d”等于“教龄等级”减去“教学能力等级”。
详参表10.4:
表10.4
教学人员
教龄
教龄等级
教学能力等级
等级差数d
差数平方d2
一
3
9
10
-1
1
二
8
4
3
1
1
三
2
10
9
1
1
四
10
2
5
-3
9
五
6
6.5
8
-1.5
2.25
六
6
6.5
6
-1.5
2.25
七
12
1
2
-1
1
八
9
3
4
-1
1
九
5
8
7
1
1
十
7
5
1
4
16
合计
33.50
代入公式(5),得r=0.80。
由此可见,教龄与教学能力呈高度正相关。
第二节推断统计
推断统计就是用概率数字来决定某两组(或若干组)数字之间存在某种关系的可能性,并由样本特征来推断总体特征的统计方法。
常用的推断统计是统计假设检验,即差异显著性检验。
一、差异显著性检验的基本思路
差异显著性检验的基本思路是用反证法来检验所要获得的结论,是推断统计中最重要、应用最普遍的统计方法。
其基本做法是:
首先,建立虚无假设“HO:
µ1=µ2”,即假设被比较的样本均数没有显著差异。
这种假设在统计学上叫做“零假设”,用HO表示。
接着,分析推断“零假设”成立的可能性,用P表示。
共有以下四种水平,前三种水平是:
若P≤0.001,拒绝HO,差异非常显著。
P≤0.01,拒绝HO,差异十分显著。
P≤0.05,拒绝HO,差异显著。
根据概率论中“小概率事件在一次试验中实际不可能发生”的情况,可以拒绝“零假设”,从而确认被比较的各数值之间的差异确实存在着实验因素的影响。
可以确认存在差异显著。
第四种水平是:
P>0.05,接受HO,差异不显著。
如果“零假设”成立的概率P>0.05,就应接受“零假设”,也就是说,被比较的各数值之间所存在的差异,仅属于随机误差所致。
这在统计学上称为差异不显著。
二、几种常用的检验方法
(一)Z检验
Z检验适用于大样本(n>30)的均数差异分析。
具体有两种方式:
单总体的Z检验与双总体的Z检验
1.单总体的Z检验
如果要对来自一个总体(单总体)的大样本平均数差数进行显著性检验,用单总体的Z检验。
用公式表示:
Z=
(6)
其中,
表示样本平均数;
uo表示总体平均数;
s表示总体标准差;
n表示样本的容量.
例7,某市一次外语考试成绩平均为80分,某校49名考生均分为90分,标准差20。
问该校学生的外语成绩是否优于市水平?
检验步骤为:
1建立虚无假设
HO:
u=uo
2计算Z值
Z=
=3.5
3查Z值表,确定检验水平的临界值,Z0.001=3.30。
4比较统计量与临界值
P=3.50>3.30,从Z值表查出P<0.001,拒绝虚无假设HO.所以,可以认为该校外语考试均分非常显著地高于市平均分。
2.双总体的Z检验
如果要对两个全然无关的组别随机抽取的样本均数进行显著性检验,而且n>30,用单总体的Z检验。
用公式表示:
Z=
(7)
例8,从某校某年级中随机抽取男生40名,女生40名,分别计算其数学成绩的平均数和标准差(表10.6),问男女生的数学成绩是否存在显著性差异?
表10.5
性别
人数(n)
平均数(
)
标准差(S)
男(样本1)
40
72.07
18.15
女(样本2)
40
80.07
15.32
检验步骤:
①建立虚无假设
HO:
u1=u2
②代入公式(7)计算出Z值
Z=2.12
③Z=2.12>Z0.05=1.96,
P<0.05,拒绝虚无假设HO.所以,可以认为该年级男女生数学成绩存在显著差异。
(二)t检验
t检验适用于小样本(n<30)的均数差异分析。
进行t检验,牵涉到“自由度”概念。
所谓自由度,是指用来估计表现总体的某方面性质的变量值独立自由变化的数目,用df表示。
这好比4个人去旅游,下火车后行李没地方存放,只好留下1人照看,其余3人则可自由活动。
这时,自由活动只能在4-1=3的范围内进行,所以其自由度为3。
但是,自由度并非都为n-1,它会随着受限制的因子个数的变化而变化。
比如,在检验两个班级学生的成绩差异时,因每个班级都有一个受限制的参数,其自由度就会出现df=n-2的情况。
t检验的方法与Z检验基本相同,也分为两种:
单总体的t检验与双总体的t检验。
1.单总体t检验
如果要对来自一个总体(单总体)的小样本平均数差数进行显著性检验,用单总体的t检验。
用公式表示:
t=
(8)
例9,某班学生外语期中考试成绩平均为73分,标准差17。
期末考试后,随机抽取20人,其平均成绩为79.2分。
问该班学生的外语成绩是否有显著进步?
检验步骤为:
①建立虚无假设
HO:
u=uo
②代入公式(8)计算出Z值
Z=
=1.63
③自由度:
n-1=20-1=19
④查表得t0.05(19)=2.093
t<t0.05(19),P>0.05
接受虚无假设HO.说明该班级学生的外语成绩进步不显著。
2.双总体的t检验
用公式表示:
t=
(9)
自由度df=n1+n2-2
例10,某项教学改革在实验班与对照班各10名同学中实施。
改革前实验班的均数是58,标准差为5.47;对照班均数为56.8,标准差为4.57。
改革后实验班的均数是63.6,标准差为5.28;对照班均数为56.7,标准差为6.10。
应当如何评价这项教学改革?
分析:
评价教学改革的成效,也就是评价改革后与改革之前相比是否存在显著性差异。
这至少要从两个方面进行比较:
一是改革前两个班的情况是否相仿,应该要求两个班的均数不存在显著性差异;二是看改革后两个班的均数是否有了显著差异。
为此,就得分两步进行检验。
(1)实验前两班均数的差异性检验:
1假设HO,即两班成绩无显著差异。
2将有关数据代入公式(9),计算后得:
t1=0.51
3自由度df=10+10-2=18
④查t表得:
t0.01(18)=1.734,0.51=t<t0.01=1.734,P>0.1。
接受HO,即两班不存在显著性差异,换句话说,两个班级的原始基础大致相当。
(2)实验后两班均数的差异性检验:
①假设HO,即两班成绩无显著差异。
②将有关数据代入公式(9),计算后得:
t2=2.56
③自由度df=10+10-2=18
④查t表得:
t0.05(18)=2.10,2.56=t2<t0.05=2.10,P>0.05。
拒绝HO,即两班均数存在显著性差异,换句话说,实验班显著优于对照班。
综合上述两次检验,可以确定地说该项教学改革是有成效的。
(三)X2检验(读作卡方)
前面所说的z、t检验,使用对象都是数量方面的资料,是计算数据的样本或总体。
在教育科研中,还常常出现属于品质方面的计数资料,统计的只是属于某些类别的人数、次数(频数)等,例如老、中、青三类教师的人数,考查成绩优、良、及格、不及格的人数等数等。
这时,就可以采用X2检验。
它是用来比较实际调查或实际观察次数(实得次数)与理论次数(期望次数)差异的最有效的方法之一,也是教育科学研究中作统计推断较为适用的方法。
所谓X2变量,是观察所得次数(实得次数)与按某一假设所期望的频数(期望次数)之差的平方,并除以期望频数,再求其总和。
计算公式为:
X2=
(10)
其中,fo为实际观察所得频数(实得次数)。
fe为按某一假设所期望的频数(理论次数)。
X2检验也是一种假设检验。
在“零假设”Ho下,计算X2值;然后与一定的检验水平,即概率的临界X2值比较(可查X2数值表,方法类同t值表),再确定是否接受假设Ho。
X2检验的基本步骤:
首先,作虚无假设Ho
其次,计算统计量
X2=
自由度df=(k-1)(r-1)×(k、r是组数)
第三,查X2分布表,得临界值
、
、
第四,判断结果。
例11,为了了解师范一年级男女生对某事件的看法,对一个班级的48名同学进行了调查。
结果如表10.6。
请问,不同性别对事件的看法有没有显著性差异?
表10.6
赞成
反对
中立
男生
18(15.3)
9(8.7)
5(8)
32
女生
5(7.7)
4(4.3)
7(4)
16
23
13
12
48
检验步骤:
①作虚无假设Ho
②计算理论次数。
男生赞成格的理论次数:
48×
×
=15.3
男生反对格的理论次数:
48×
×
=8.7
……
女生中立格的理论次数:
48×
×
=4.0
③代入公式(10),计算统计量
X2=
+
+……+
=4.83
Df=(3-1)×(2-1)=2
4查X2表得临界值
,
X2=4.83<
,P>0.05
因此,接受Ho,性别对事件的看法没有显著差异。
第三节统计在教育科学研究中的应用
统计在教育研究中的应用主要体现于三个方面:
一是在有关研究方法设计中的应用,二是在数据整理中的应用,三是在数据处理中的应用。
一、在有关研究方法设计中的应用
在教育科学研究中运用统计方法,体现在观察、调查、实验和测量的设计之中。
因为它们大都包括对象的选择、样本容量的确立、调查及实验条件的控制以及结果统计方法的选择和设计等内容,而且一般是在实际工作开始之前进行的,这就使教育统计在教育科学研究的起始环节发挥其应有的作用。
例如,要挑选实验班和对照班,该如何选?
人们大多是从现行平行班中“随机”选择,但是,这种方法通常不能符合随机抽样的要求。
因此,我们可以通过对几个平行班学生的学年成绩、智力水平、某项研究前测等进行统计检验,在得出无显著性差异后方可确定。
可见教育调查或教育实验设计的优劣是决定统计分析成功与否的关键,反之,一项好的设计也必须符合教育统计方法的要求。
二、在教育科学研究数据整理中的应用
实施各种研究方法之后,往往会获取一大堆原始数据,在整理之前,这些数据往往是杂乱无章的。
为了使数据有序排列,方便进一步的统计处理,就应该对这些原始数据进行初步的整理。
在整理的过程中,往往要通过制作统计图表来完成,所以,统计图表是数据整理的基本表达方式,可以有效保证原始数据的有序排列,完成对研究数据的初步描述。
三、在教育科学研究数据处理中的应用
教育科学研究往往通过测验、调查或其他途径取得各种数值性数据。
经过对这些原始数据的初步整理,其基本特征和性质已经粗略地反映出来。
这样,人们可以根据数据分布形态选择对数据的教育统计方法。
例如,对数据集中趋势的度量可以用算术平均数、中数和众数三种集中变量数。
当数据呈正态分布时算术平均数为最好,而当呈偏态分布时选众数最佳。
同时,人们可以根据数据类别,选择对数据的教育统计方法。
例如,当数据为类别变量时可选X2检验;当数据为等距变量时可选积差相关、Z检验、t检验等统计方法进行分析。
通过对数据计算求出一些样组的统计量数,可以说明数据的集中趋势、离散趋势、分布情况和相关程度等特征,为探索教育规律提供可靠的材料。
总之,统计方法是教育科学研究的重要工具,统计方法在教育科学研究中的应用,极大地促进了教育科学的发展。
在教育科学研究中运用统计方法,要注意从观察、调查、实验和测量中获得详实可靠的数据资料,进行定量分析以说明结果做出结论,这是教育科学研究方法的主要趋势。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 论文 统计 教育 科研 中的 运用