教育统计篇大纲教育学专业Word文件下载.docx
- 文档编号:17091418
- 上传时间:2022-11-28
- 格式:DOCX
- 页数:19
- 大小:85KB
教育统计篇大纲教育学专业Word文件下载.docx
《教育统计篇大纲教育学专业Word文件下载.docx》由会员分享,可在线阅读,更多相关《教育统计篇大纲教育学专业Word文件下载.docx(19页珍藏版)》请在冰豆网上搜索。
(一)教育统计学是教育科学化管理的工具
(二)教育统计学是教育研究的重要技术手段
(三)教育统计学为教学质量分析提供了有效的定量方法
三、教育统计的特点
(一)观察必须达到一定的数量
(二)观察的结果必须有数量表示
(三)着重比较
(四)重视差异研究
第二节教育统计中的变量与误差类型
一、变量与变量值
变量是指可以定量并能取不同数值的事物的特征。
变量值是指变量的具体数值。
二、变量的分类
(一)类别变量、顺序变量、等距变量和比率变量
1.类别变量:
又叫名称变量,它是指其数值只用于区分事物的不同类别,而并不表示事物数量大小关系的一种变量。
2.顺序变量:
又称等级变量,它是指其数值是用于排列不同事物的等级顺序的变量。
3.间隔变量:
又称为等距变量,它是指其数值可以用于表明事物距离差异大小的变量。
4.比率变量:
是指其数值不仅能反映数字之间的间隔大小,还能说明数字之间比率关系的变量。
(二)随机变量与非随机变量
1.随机变量是指表示随机现象各种结果的变量。
2.非随机变量是指表示非随机现象各种结果的变量。
三、随机误差与非随机误差
随机误差是指由于某些事先难以控制的偶然因素造成的误差。
非随机误差是指由某些事先可以控制的因素造成的误差。
第二章教育统计中的常用量数
第一节集中量数
集中量数是反映一组数据的一般水平的量数。
它是一组数据一般水平的代表值。
根据数据的特点,集中量数的统计计算可以采用多种表达形式,教育统计中常用的集中量数有算术平均数、中数、众数和几何平均数。
一、算术平均数(ArithmeticalMean,Average)
(一)概念
算术平均数是一组观测数值的总和除以观测数值个数所得的商。
算术平均数常简称为平均数,一般用符号“
”(读作“X吧”)或希腊字母“μ”表示。
(二)计算方法(Excel——fx——统计——AVERAGP)
公式:
=(X1+X2+…+XN)/N
(三)加权平均数(fx——数学与三角函数——SUMPRDUCT)
加权平均数可以看成是算术平均数的推广,在算术平均数中,对于每个观测数据都是同等对待的,即每个观测数据对算术平均数有同等的重要性。
而在加权平均数中,对于每个观测数据是区别对待的,即需要用权重系数或权数的大小来表明各个观察数据在整体中的重要性。
加权平均数的可以采用以下两种形式
1.权重系数以正小数表示
假设X1,X2,…,Xn为n个观测值;
a1,a2,…,an为n个权重系数;
并且0<ai<1,Σa=1(i=1,2,…,n)。
那么,加权平均数就可以表示为
=a1X1+a2X2+…+anXn
2.权数以任意正数表示
W1,W2,…,Wn为n个正权数。
=(W1X1+W2X2+…+WnXn)/(W1+W2+…+Wn)
二、中数与众数
(一)中数(MEDIAN)
中数又称中位数,指按大小顺序排列的一组数据中,位于正中间的数。
中数的符号是Mdn。
中数的计算方法:
先将数据按大小顺序排列。
若数据的个数是奇数N,则第(N十1)/2个数目的数值便是这组数据的中数。
若数据的个数是偶数,一般应以中间两个数值的平均值作中数,即以位于第N/2和第(N/2)十l位置上的两个数值的平均数为中数。
(二)众数(MODE)
众数是一组数据中出现次数最多的那个数值。
三、几何平均数(GEOMEAN)
N个数值连乘积的N次根,叫做几何平均数,用符号Mg表示。
第二节差异量数
差异量数是描述一组数据离差异程度的量数。
常用的差异量数有许多种,如全距、平均差、标准差、差异系数等。
一、全距(RANGE)
全距是一组数据最大值与最小值之差,用符号R表示。
(R=XMAX-XMIN)
二、平均差(AVERAGEDEVEATION)
平均差是一组数据中的每一个数与该组数据的算术平均数(或中数)差的绝对值的算术平均数,用符号AD表示。
公式为:
(AVEDEV)
三、标准差(STANDARDDEVIATION)
标准差是一组数据中的每一个数与该组数据的算术平均数之差的平方的算术平均数的算术平方根,用符号σ表示。
(STDEVP)
式中,σ是希腊小写字母,读作“西格玛”,代表标准差;
为该组数据的算术平均数;
N为观测值的个数。
四、差异系数(COEFFICIENTOFVARIATION)
差异系数是绝对差异量数与相应的集中量数之比而形成的百分比。
CV=绝对差异量数/相应的集中量数×
100%
特别标准差系数的计算公式为:
CVσ=σ/
×
100%
式中,CV为差异系数;
σ为标准差;
为算术平均数。
第三节地位量数
地位量数是描述个体在总体中相对地位的量数。
常用的地位量数有名次、百分等级和标准分数。
一、名次(RANK)
名次是数据按大小排列的顺序。
二、百分等级(PERCENTILERANK,PERCETRANK)
百分等级指在一个总体中小于某个数据X的频数占总频数的百分数,用符号PRx表示。
三、标准分数(STANDARDIZEDSCORE,STANDARDIZE)
1.标准分数的含义
标准分数又称Z分数,是一个数与它所在的总体的平均数之差除以总体的标准差所得的商。
Z=(X-
)/σ
式中,Z代表标准分数;
X为一观测数据;
代表平均数;
σ代表标准差。
2.标准分数的应用
3.标准分数的线形转换
Z’=AZ+B
第四节相关量数
一、相关的含义(CORRELATION)
相关是指变量间量的伴随关系。
二、线性相关的类型
1.正相关:
两个变量的变化方向一致。
2.负相关:
两个变量的变化方向相反。
3.零相关:
两个变量值变化方向无一定规律。
三、相关系数的含义极其特点
1.相关系数的含义
相关系数是反映变量间相关程度和方向的量化指标,常用符号r表示。
2.相关系数的特点
(1)有界性
-1≤r≤1
(2)方向性
r<0,表示负相关;
r=0,表示零相关;
r>0,表示正相关。
四、积差相关系数(PEARSON,CORREL)
为了描述相关关系,人们使用多种数学方法。
积差相关法是计算直线相关的常用方法,是20世纪初英国统计学家皮尔逊(Pearson)提出的,也称皮尔逊相关。
由积差相关法计算出来的相关系数叫积差相关系数,用r表示。
公式表示如下:
五、等级相关系数(Spearman)
等级相关法是对等级数据或以等级变量表示的数据求相关的一种计算方法,它由统计学家斯皮尔曼(Spearman)提出,又称斯皮尔曼相关法。
由等级相关系数求出的系数是等级相关系数。
式中,rR表示等级相关系数;
D表示两个变量每对数据等级之差;
N表示成对数据的个数。
六、点二列相关系数(POINT-BISERIAL)
点二列相关法是对一个变量是连续变量,另一个变量为二分类变量求它们之间相关的一种计算方法。
由点二列相关法求出的系数称为点二列相关系数。
式中,rpb表示等点二列相关系数;
p表示二分类变量中某类事物所占的比例;
q表示二分类变量中另一类事物所占的比例;
p表示p类事物连续变量数据的平均数;
q表示q类事物连续变量数据的平均数;
σt表示全部连续变量数据的标准差。
第三章正态分布
第一节一般正态分布
一、正态分布的含义(NORMALDISTRIBUTION)
正态分布又称常态分布,从直观上看,它是一种中间频数较多,往两边逐渐减少的,呈古钟形的频数分布形态。
正态分布曲线的一般方程是:
式中,f(x)为纵线高度;
N为总次数;
X为自变量;
μ为平均数;
e为自然对数之底,约为2.71828;
π为圆周率,约为3.14159。
二、正态分布的特点
(1)曲线以X=μ处为最高点,因为e的指数为负值,(X—μ)2/σ2越小,Y值越大,X=μ时,(X—μ)2/σ2最小,Y值最大。
(2)曲线以为X=μ为中心轴对称分布。
正、负(X一μ)/σ值,都产生相同的Y值。
(3)曲线的两尾缓慢下降,逐渐接近基线,但终不能与基线相交。
(4)曲线两侧在X=μ土σ处的两个点叫做拐点,即两侧弯曲的转折点。
也就是说,当曲线由中央向两侧逐渐下降,到拐点处时改向外弯。
第二节标准正态分布(UNIT-NORMALDISTRIBUTION)
一、标准正态分布(STANDARDIZEDNORMALDISTRIBUTION)曲线的一般方程
二、正态分布的初步应用
1.依Z值求相应正态分布的面积(NORMSDIST)
只要知道正态分布下一定区间的临界值Z,就可以计算出正态分布在相应区间的面积。
2.依正态分布的面积求相应的Z值(NORMSINV)
只要知道正态分布下一定区间的面积,也可以计算出正态分布在相应区间的临界值Z。
第四章统计假设检验的原理
第一节抽样方法
一、抽样(SAMPLING)的意义
(一)抽样的作用
正确使用抽样方法可以节省人力、物力和财力并能获得有意义的一般性结论,但若对抽样方法使用不当、则会使研究工作事倍功半,甚至得出不恰当的结论。
(二)总体、个体、样本和样本容量
总体、个体、样本和样本容量是与抽样有关常用术语,它们相互之间有较为密切的关系。
总体是根据统计任务确定的同一类统计事物的全体。
个体是指构成总体的每一个基本单位。
样本是从总体中随机抽取的一部分个体。
样本容量是样本所包含的个体数,一般用拉丁符号n来表示。
(三)统计量和参数
一般把反映样本数据特征的量数称为样本统计量,简称统计量。
统计量一般用拉丁符号来表示。
比如,样本的算术平均数、标准差、相关系数、比例等统计量,可以分别用
、S、r、p等英文符号表示。
一般把反映总体数据特征的量数称为总体参数,简称为参数。
参数一般用希腊字母来表示。
比如,总体的算术平均数、标准差、相关系数、比例等参数,可以分别用希腊字母μ、σ、ρ、π等来表示。
二、随机抽样方法
我们从总体中抽取样本有各种各样的方法,一般可将它们分为随机抽样和非随机抽样两大类。
非随机抽样主要依据主观判断来选择个体组成样本,而随机抽样则是根据事物客观存在的随机规律来选择个体组成样本,所以也更能较真实地反映总体的特征。
(一)简单随机抽样(SIMPLERANDOMSAMPLING)
简单随机抽样就是保证总体中每个个体被抽取机会相等的抽样。
INT(RAND()*10)
(二)机械抽样(SYSTEMATICSAMPLING)
机械抽样也称为系统抽样,它是利用总体中所有个体已有的顺序编号,按一定的距离对个体进行等距抽取的随机抽样方法。
(三)分层抽样(STRATIFIEDSAMPLING)分层抽样是按照某种特征将总体分成有限的几组或几层,然后采用简单随机抽样的方法从各层中抽取一定个体构成样本的随机抽样方法。
(四)整群抽样(CLUSTERSAMPLING)
把总体中的群体而不是个体作为抽样单位,进行随机抽样,然后把所抽群体中的全部个体作为研究对象的方法,称为整群抽样。
第二节抽样分布
一、抽样分布的意义
推断统计的一个基本思想就是利用样本的分布规律,来对量数之间的差异作出统计判断。
我们知道,一般样本统计量与总体参数之间有一定的差异,样本统计量与样本统计量之间也会存在差异。
如果样本统计量之间的差异较大,那么,用不同样本统计量推测总体参数产生的差异也较大;
反之,样本统计量之间的差异较小,那么,不同样本统计量推测总体参数的差异也较小。
因此,研究样本统计量之间的差异情况,对于了解推断统计的原理有重要的意义。
样本统计量的抽样分布可以划分为许多类型,这里仅介绍一种关于平均数抽样分布的类型,作为理解统计假设检验基本原理的基础。
当样本容量无限增大时,无论总体分布是否正态,都有如下几个结果:
第一、样本平均数的抽样分布逐渐接近正态分布。
第二、平均数抽样分布的平均数μx等于原总体的平均数μ。
第三、平均数抽样分布的标准误SEx等于原总体的标准差σ除以样本容量n的平方根。
第三节统计假设检验的基本原理
一、统计假设检验的基本思路
统计假设检验的基本思路包括三个要点:
采用反证法的推理方式;
利用抽样分布的规律;
作出概率意义上的判断。
统计假设检验的基本思路可以转化为统计假设检验的四个步骤。
即:
(1)建立虚无假设H。
;
(2)构造一个合适的统计量并计算其值;
(3)选择显著性水平,查表获得临界值;
(4)作出统计判断。
四个步骤的具体内容随统计量数的类型不同而会有所变化。
二、差异的显著性与显著性水平
反映统计量数之间的差异是随机误差造成的,还是由非随机因素造成的本质上的差异,通常用差异的显著性来描述。
如果量数之间的差异是随机误差造成的,就称量数之间的差异不显著;
否则,就称量数之间的差异显著。
所以,差异的显著性被认为是专门用于反映量数差异性质的术语。
显著性水平是统计假设检验中的一个极重要的术语。
同样的样本和总体资料,由于选择了不同的显著性水平值,有时可能得出截然相反的结论。
显著性水平和抽样分布有密切的关系。
在抽样分布中,由于次数出现极少的统计量的值在一次抽样中被抽到的机会极小,因此被认为几乎抽不到,这种统计量的值被抽取机会极小的概率值就称为显著性水平,常用符号“α”或者“P”来表示。
第五章量数差异的显著性检验
平均数差异的显著性检验要解决两个问题:
第一个问题是,检验已知样本平均数为
的总体平均数μ是否等于已知的总体平均数μ0?
即检验已知样本平均数
与已知总体平均数μ0的差异是否显著?
因为这种检验仅考察一个未知总体参数μ,所以称为单总体检验。
第二个问题是,检验已知样本平均数分别为
1和
2的两个未知总体平均数μ1和μ2是否相等?
即检验两样本平均数
2的差异是否显著?
因为这种检验考察了两个未知总体参数μ1和μ2,所以称为双总体检验。
根据统计量抽样分布形态的特点,平均数差异的显著性检验可分为Z检验和t检验两种情况。
一、Z检验
Z检验是利用标准正态抽样分布的Z统计量进行的统计假设检验。
检验过程中需构造一个Z统计量,并且要使用标准正态分布表。
(一)平均数的单总体Z检验
当需要检验某已知样本平均数
与某已知总体平均数μ0差异是否显著时,只要下面两种条件之一能得到满足,就可以应用平均数的单总体Z检验。
其一,当样本X1,X2,…,Xn来自正态分布的总体,而且总体的标准差已知,这时无论样本容量多大,都可以采用平均数的单总体Z检验。
其二,如果样本X1,X2,…,Xn来自未知或者非正态的总体,只要样本容量充分大(一般要求n>30),也可以近似采用平均数的单总体Z检验。
平均数的单总体Z检验的步骤如下:
(1)建立虚无假设:
H。
:
μ=μ0
(2)计算Z值:
式中,
为已知样本的平均数;
μ0为已知总体的平均数;
σ为已知总体的标准差;
n为已知样本的容量。
(3)选择显著性水平α,查标准正态分布表取得临界值Zα。
(4)作出统计判断;
如果|Z|<Zα,则接受虚无假设Ho;
如果|Z|>Zα,则拒绝虚无假设H。
。
(二)平均数的双总体Z检验(工具——数据分析——Z检验)要检验两相互独立的样本平均数
1与
2是否差异显著,只需要下面两条件之一能满足,就能进行平均数的双总体的Z检验。
其一,两相互独立样本分别来自已知总体标准差为σ1与σ2的正态总体,无论两样本容量大小如何,都能进行平均数的双总体Z检验。
其二,两相互独立样本的容量充分大(一般要求大于30),无论两样本来自的总体的分布形态是否正态,都可以近似地进行平均数的双总体Z检验。
而且当两总体标准差σ1与σ2未知时,可以用两样本标准差S1与S2来替代。
平均数的双总体Z检验的步骤如下:
Ho:
μ1=μ2
式中,
1与
2为两样本的平均数;
σ1与σ2为两总体的标准差;
n1与n2为两样本的容量。
(3)确定显著性水平α,查标准正态分布表得临界值Zα。
二、t检验
t检验是利用抽样分布为t分布的t统计量来进行统计假设检验。
检验过程中需计算t统计量和查t分布表。
t分布和标准正态分布不同之处在于,标准正态分布曲线只有一条,因此其临界值仅由显著性水平α所确定;
而t分布曲线却有无数条,因此其临界值由指定曲线的自由度df和显著性水平α共同确定。
平均数差异显著的t检验也分为两类,平均数的单总体t检验和平均数的双总体t检验。
(一)平均数的单总体t检验
当需要检验某已知样本平均数
与某已知总体平均数μ0差异是否显著时,如果满足条件:
样本来自正态分布的总体,而且总体标准σ未知,这时就可以采用平均数的单总体t检验方法。
平均数的单总体t检验的一般步骤为:
(2)计算t值:
为样本平均数;
n为样本容量;
S为样本标准差,即
(3)确定显著性水平,自由度df=n—l,查t分布表得临界值tα(df)。
TDIST(t值,df,侧数)
(4)作出统计判断:
如果|t|>tα(df),则拒绝H。
如果|t|〈tα(df),则接受H。
(二)平均数的双总体t检验(TTEST返回t检验的概率值,TINV返回给定概率值和自由度的t值)
当需要检验两个来自正态分布的总体的样本的平均数
2差异是否显著,而且两总体的标准差σ1与σ2未知时,可以采用平均数的双总体t检验。
根据两样本是否相关,平均数的双总体t检验又可分为两相互独立样本的t检验和两相关样本的t检验。
1.两相互独立样本的t检验
设两个平均数分别为
2的样本,来自平均数分别为μ1与μ2,标准差分别为σ1与σ2的相互独立的两个正态分布总体,当检验
2的差异是否显著时,可以采用两相互独立样本的t检验。
这种t检验需要根据两总体的方差σ
与σ
是否相等来选择相应的检验公式。
σ
是否相等的推断方法将在本章的第三节中介绍。
如果两总体方差σ
=σ
,那么,两相互独立样本t检验的步骤如下:
(方差相等的两样本的t检验)
(2)计算t值:
2分别代表两样本的平均数;
n1与n2分别代表两样本容量;
S1与S2分别代表两样本的标准差。
(3)确定显著性水平α,自由度df=n1十n2一2,查t分布表得临界值tα(df)。
如果t>tα(df),则拒绝H。
如果|t|〈tα(df),则接受H0。
2.两相关样本的t检验(成对观察值的t检验)
在平均数的双总体t检验的假设前提下,如果要检验两相关样本的平均数
2的差异是否显著,可以采用两相关样本的t检验方法。
检验步骤如下:
式中,D为两样本对应数据之差,即D=X1-X2;
为两样本n对应数据之差D的平均数,即
=D/n。
(3)确定显著性水平α,自由度df=n—l,查t分布表得临界值tα(df)。
(4)作出统计判断:
两相关样本的t检验一般用于同一组统计对象实验前后测验结果的比较;
同一组学生两等值测验成绩的比较;
按照成绩或者能力等条件将学生一一配对分成两组测验成绩的比较等。
一、方差齐性的显著性检验(方差齐性的F检验,FTEST返回单尾概率值,FINV返回给定单尾概率值和自由度的F值)
在上一节两相互独立样本的t检验中,曾对两总体方差σ
是否相等,作过不同的假设。
方差σ
=σ
或者σ
≠σ
的假设实际上可以通过统计假设检验来决定,这种对两正态总体方差的统计假设检验称为方差齐性的显著性检验。
检验两总体方差是否相等,需要利用样本方差S12与S22,其中
假设两样本相互独立,且分别来自方差相等的两正态分布总体,那么,样本方差S12与S22的比称为F统计量,记为F=S12/S22。
F统计量构成的抽样分布称为F分布。
利用F统计量的F分布就可以对两正态分布总体的方差齐性进行显著性检验。
(2)计算F值:
实际应用中,为了查F分布表方便起见,特别将S12与S22中的较大者作为分子,记为S2大,较小者作为分母,记为S2小。
所以,常用的F统计量的形式为
F=S大2/S小2
(3)确定显著性水平α,分别计算分子和分母的自由度df大和df小,查F分布表得临界值Fα(df大,df小)。
如果F>Fα(df1,df2),则拒绝H0;
如果F<Fα(df1,df2),则接受H。
第七章Χ2检验
第一节χ2检验的基本原理
一、χ2检验的概念
(一)χ2检验的含义
χ2检验是决定一组实际观察得到的次数与有关总体的理论次数是否一致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计 大纲 教育学 专业