教育统计与测量文档格式.docx
- 文档编号:19095453
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:18
- 大小:65.52KB
教育统计与测量文档格式.docx
《教育统计与测量文档格式.docx》由会员分享,可在线阅读,更多相关《教育统计与测量文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
(2)要学会对统计结果进行解释。
这里的“解释”有两个含义:
(1)相对大多数人的相对结果;
(2)获得这一统计结果的具体情景,不能任意扩大结果应用范围。
三、教育统计的内容
1、实验设计的一般模式
例1:
分散学习方式与集中学习方式对学习效果的影响
✧总体中抽取样本
✧自变量
✧因变量
✧统计:
比较差异
✧因果推论
2、描述统计
(1)数据分组(最考察一个人的研究智慧的,在研究中谁与谁比是要整体规划的)
(2)编统计表
(3)绘统计图是一篇文章的窗口要画的规范、清晰、明了,让人家一看就懂
(4)特征量计算
✧集中量-平均数
✧差异量-标准差
✧分布形态
✧相关系数
描述一组数所的全貌,目的在于将大量零散杂乱无序的数据进行整理、归纳、简化、概括,使事物的全貌明确清晰地表现出来。
3、推断统计(学习重点)
通过局部数据(样本)所提供的信息,推论总体的情况。
比如要分析一下本校学生的心理健康情况,总不可能让全校学生都来测一遍,所以要挑一小部分学生-样本,测量他们的心理健康水平,这样就有一个根据这一部分人的数据推测全校学生-总体的心理健康情况的问题。
包括总体参数特征值估计、假设检验等内容。
如:
由样本平均数推断总体平均数,由样本标准差推断总体标准差。
一中
二中
焦虑水平测验(50)
78
86
注意:
推论的正确率。
这两组数据是随机的,是样本。
样本平均数据数不能说明两者之间的差异。
不能说二中的比一中焦虑。
●t检验
●方差分析
4、以上三方面的关系
(1)实验设计是基础,描述统计和推论统计都要在良好的实验设计基础及其所提供的真实的数据之上;
(2)描述统计是推论统计的基础;
(3)实验设计必须以统计原理为依据,必须符合统计原理和考虑统计方法的可行性。
第二节 几个基本概念
一、随机变量
1、随机现象
在相同条件下,进行实验或观察,其结果可能不止一个,事先无法确定,这类现象称为随象现象。
先举例:
抛硬币实验
(1)一次试验有多种结果,其所有可能的结果是已知的;
(2)试验之前不能预料哪一种结果会出现;
(3)在相同的条件下可以重复试验。
2、随机现象的每一种结果叫基本随机事件
摸奖:
一口袋中有6只球,其中4只白球,2只红球,从袋中取先后取两次,每次取一只球(放回抽样),可能的基本事件有36种。
3、在统计学上把随机现象称为:
变量、随机变量,用大写字母表示,如身高用X表示,语文考试成绩用Y表示。
✧变量:
数量或质量上可变的事物属性
✧自变量:
由实验者操纵的、对实验对象的反应产生影响的变量。
✧因变量:
实验对象的某种反应。
如父母亲的智力对孩子的影响,父母的智力就是自变量,孩子的影响就是因变量
✧例:
大学生心理健康状况调查,复习时间安排对学习成绩的影响
4、随机事件称之为变量的取值,用X1,X2,X3,……,Xn表示。
随机变量
5、在对随机变量的研究中,可以许多的规律:
(1)随机现象的结果虽然不可预知,但其中有一个规律:
即每个结果都以50%的等概率出现。
(2)智力随年龄的变化规律,散点图。
(3)语文成绩与英语成绩,散点图。
(4)智力的概率分布
二、总体和样本
1、总体:
具有某种特性的研究对象的个体总和。
通过地域、年龄、职业、性别等维度定义一个总体。
有限总体和无限总体。
如《沿海开放地区小学生品德的性别差异》。
本研究范围内,杭州什么区以什么学校为例。
在什么范围内而谈
2、个体:
构成总体的每一个基本元素,不一定是人,如:
产品质量抽查,题库质量分析。
3、样本:
从总体中抽取的作为观察对象的一部分个体。
4、样本容量:
样本中所包含的个体数目,N表示。
N≤30,小样本;
N>
30,大样本。
问卷调查300个
三、统计量和参数
✧统计量相对样本而言
,是描述样本的各种特征的数量
✧参数相对总体而言
,是总体的各种特征的数量。
一般情况下,我们通过分析统计量来对总体参数作出推论。
第二章数据的初步整理
第一节数据的来源、种类用其分类
统计是为了说明总体的属性、特征,或是两个或两个以上总体在某些属性上的差异。
这些属性或其差异的说明最好只用简单的数字或简单的几句话。
比如:
升学率、及格率,配戴眼镜率、平均成绩、成绩分布情况、两个班或两个学校的成绩是否有显著差异、学生的成绩在不同时期的波动情况,上升、下降、起伏不定,而这些简单的结论是在对大量原始数据的整理基础上获得的。
因此,统计工作的第一步是搜集数据,即对客观事物进行量分的过程。
这一过程要坚持实事求是,不能随意更改数据。
在统计分析过程中亦是如此。
获得数据的能力也是综合素质的重要组成部分,在研究目标的指引下,平时要收集数据。
教育实验
一、教育统计资料来源
1、什么是数据
数据是随机变量的观察值,它是用来描述对客观事物观察测量结果的数值。
举例:
抛硬币实验的结果,考试成绩结果。
2、经常性资料:
日常工作记录和统计报表,如师生档案,工资表,成绩表,综合素质考核表,业绩表。
3、专题性资料
(1)教育调查:
在没有预定因子、不施行控制的条件下,对现成的教育方面有关客事实所进行的观察和分析。
✧现情调查:
对当前正在发生的事情或存在事物进行调查,如教师学历的调查。
✧回顾调查:
调查过去发生过和事情或现在已不存在的事物,如青少年犯罪原因调查。
✧追踪调查:
在今后的一段时间内调查对象的发展过程。
实施教改后学生学习态度和学习行为的变化。
(2)教育与心理测量:
测验内容、程序、环境、评分记分、分数解释都有严格的规定。
如智力测验、人格测验。
✧大学生焦虑发展趋势及其诱因变化,焦虑的诱因有学习、未来的工作、谈朋友。
✧小学生焦虑发展趋势及其诱因变化,焦虑的诱因有学习、上辅导班、父母吵架、老师批评、同伴争吵。
(3)教育实验:
在给实验对象施加预定控制因子的影响的条件下,对教育方面的事实进行观察和分析。
A、被试间设计
例1
图被试间设计
B、被试内设计
一个班学生在某学期施行了语文阅读教学改革,学期初与学期末分别进行了一次阅读理解测验,通过比较前后测成绩的变化,可以判断这次教学改革的效果。
例2
处理
张三
李四
王五
赵六
纸张文本阅读
1
2
电子文本阅读
二、数据的种类——选择不同统计方法的依据
1、按来源来分
(1)点计数据:
如人数,班级数,男女数等。
数人数的,班级几人,及格几人,优秀几人,
(2)度量数据:
借助于一定的测量工具或一定的测量标准而获得的,如17.2厘米、58千克、19℃测量工具如尺子,天平。
✧比率数据:
有绝对零点和等距单位,如身高、体重,反应时,感觉阈值等,差、倍数有意义。
(从零点定义的角度来理解)
✧等距数据:
等距,但无绝对零点,如温度,各种能力测验分数等,倍数无意义,只有差有意义。
✧顺序数据:
既不等距,也无绝对零点,如等级定,喜爱等级,品质等级等。
如第一名、第二名如考试成绩。
顺序数据是不能进行任何的加减乘除的
(3)称名数据:
反映事物在组别、种类上的不同。
不说明事物之间的数量差异,中按事物的性质不同,将被观测事物物加以划分。
令男为1、女为0;
职称:
高级2、中级1、初级0。
0、1没有任何数量上意义,只是标记
2、按取值情况来分:
(1)间断型随机变量数据――离散数据:
单位不能再划分成更小的单位,一般取整数,如计数、顺级数据。
电阻箱。
(2)连续性随机变量数据――连续数据,单位可划分无限细小的单位,如等距数据,比率数据。
滑动变阻器。
三、数据的统计分类(分组)
数据的统计分类,是指按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分析时所用统计方法的可能性,将所获得的数据进行分组归类。
将成绩分成男生成绩和女生成绩,将作文成绩分成优、良中、差;
将健康状况分成好、中、差;
按实验处理不同分组。
1、关键点:
分类的标志,如:
心理健康水平,考试成绩。
要求:
明确、前后一致、能将全部数据包含在内、依据对象的本质属性、依据研究目的、依据统计方法
2、分类的标志可分为:
✧性质类别:
按事物的不同性质进行分类,如性别,实验组数据和对照组数据。
✧数量类别:
按数值大小来分组,如成绩分布。
例:
《学生网络问题调查》
问题:
✧我认为“黑客”很能干,我很羡慕他们。
✧互联网比现实生活更具有真实性。
✧我常常为不能控制上网次数而懊恼。
✧上网时我会冒充其他人。
✧考试不及格后,我倾向于上网向网友倾述
✧当我已经在线很久时,对自己说“在玩一分钟”。
分组依据:
✧性别
✧年级
✧地区
✧家庭经济状况
✧父母职业
✧家庭教养方式
第三章集中量
根据次数分布来分析集中量。
经过归组、列表、绘图等初步整理工作,数据分布的面貌、数据特征、集中情况差异情况和一些基本特征已经反映出来了。
但是如果要对这批变量所蕴含的规律性作更进一步的推论和更精确的了解,需要计算出一些有代表性的数据。
集中量就是其中之一。
它描述一组数据的中心“位置”,反映它们向某一点集中的情况。
最常用的集中量就是平均数。
物理:
多次测量、求其平均数。
组中值的作用:
代表一分组中的若干原始数据。
第一节算术平均数
一、算术平均数的概念
1、定义:
算术平均数是所有观察值的总和除以总频数所得之商,又称均数、均值。
用
表示。
公式:
二、算术平均数的应用及其优缺点
1、受抽样变动的影响较小
2、易受极端值的影响
3、单位不同的数据不能计算算术平均数
★算术平均数是数轴上的一个点这个点就是测量的零点
第二节中位数
一、中位数的概念
中位数,简称中数,是位于一定顺序排列的一组数据中央位置的数值,在这一数值上下各有一半频数分布,用Md表示。
二、中位数的计算方法
1、根据原始数据计算
无相同观察值的情况
(1)若总频数为奇数,就以位于中间的数据作为中位数;
eg:
3,5,7,8,9,11,14
(2)若总频数为偶数,则以最中间的两个数据的算术平均数作为中位数。
17,15,14,12,11,10,9,6
从上例中可以看出,中数可以是原始数据中的数,也可以不是原始数据中的一个数。
有相同数据的情况:
见张P64。
二、中位数的应用及其优缺点
1、等级数据的集中量应用中位数计算
1、极少受两极端数据的影响。
第三节加权平均数、几何平均数、调和平均数
一、加权平均数在多元评价中起到作用
加权平均数是不同比重数据(或平均数)的平均数,用
使用它是为了有意突出某些数据的重要性。
P47
期末考试
60%
56
作业
30%
80
平时
10%
90
总评
67
教学
50%
80%
学生管理
10
科研
20%
教学型高校中学科研型高效小学
学生的评价指标:
心理健康、成绩、品德、体育、艺术、社会实践
二、几何平均数
当一个数列的后一个数据是以前一个数据为基础成比率增长时,要用几何平均数求均增长率,常用几何平均数,而不能用算术平均数。
如入学儿童数量增长比率,学校费增加率、教师工资增加率、阅读能力进步率等。
用
表示。
X为倍数!
!
用对数计算上述公式。
P48
三、调和平均数
调和平均数是一组数据倒数的算术平均数的倒数,亦称倒数平均数,用
调和平均数主要用于求平均的工作速度。
如计算速度、识字速度。
P50
联想词数
时间
13
2分
3分
2.5分
第四章差异量
13亿人口与80万亿存款。
差异量的定义:
表示一组数据变异程度或离散程度。
Eg:
甲组:
54637274828899
乙组:
67717376798284
差异量越大,表示数据数值的分布范围越广,越不整齐,集中量的代表性越差;
差异量越小表示数据数值越相互接近,变动范围越小,集中量的代表性越好。
第一节全距与平均差
一、全距
1、一组数据的最大值与最小值之差,又称极差,用“R”(rang)表示。
如上例中:
R甲=45、R乙=17。
2、某组数据已转为频数表,那么根据频次表得到该组数据的全距的方法是:
最大一组与最小组的组中值之差,或最大一组上限与最小一组下限之差。
第二节方差和标准差
一、方差与标准差的概念
1、样本方差的定义:
一组数据离差平方的算术平均数,用
2、样本方差公式:
可用算术平均数和平均差的计算公式导出。
3、样本标准差是指样本方差的平方根,用
4、注意:
方差的单位是原始数据单位的平方。
标准差的单位是原始数据单位。
5、总体方差与样本标准差:
二、计算方法
1、用原始数据计算
原始数据Xi:
83
87
81
88
Xi-
:
离均差
-2
-4
3
(Xi-
)2
4
16
9
Σ(Xi-
平方和
34
方差
34/5=6.8
标准差
2.61
★标准差是数轴上的一段距离:
若X=92,它离平均有几个标准差?
标准差是2
三、方差和标准差的应用及其缺点:
1、方差和标准差的优点:
(1)反应灵敏,随任何一个数据的变化而变化;
(2)严密确定,一组数据的方差和标准差有确定的值;
(3)计算简单,而且可以将几个方差和标准差综合成一个总的方差和标准差;
(4)用样本数据推断总体差异量时,方差和标准差是最好的估计量。
2、与其它差异量相比,方差和标准差应用最为广泛。
当描述一组数据的集中程度用算术平均数表示时,它的离散程度应该用方差或标准差表示。
除此之外,在计算其它统计量时,如差异系数、相关系数、标准分数,也都要用到标准差。
而方差在统计检验和推断中常常会用到。
问:
(1)一个班的某门考试成绩标准差很大,说明什么?
大了好,还是小了好?
(2)一项竞赛的成绩标准大了好,还是小了好?
3、在教育科研中,究竟是标准大好还是标准小好,要看所分析的问题而异。
假如,某班某科考试成绩标准极大,这对教师的教学极其不利,而且该科考试成绩的平均分数也失去了意义。
假如,在选拔性和竞赛性的考试中,某一考题的标准差很小,表明该题对学习好和学习差的学生没有区分能力,是一个质量较差的题目。
四、标准分数
标准分数又称Z分数,是以算术数平均数为中心、以标准差为单位表示一个数据在所在组数据中所处的相对位置的量数。
在正态分布中,相对位置有两个含义:
(1)一个数据以平均数为原点、以标准差为单位所处距离的远近;
(2)数据分布中该数据以上、以下各有多少比例的数据分布着。
将原始分数转化成标准分数,有两方面用意:
(1)更好地反映同一组数据间的差异;
(2)使不同测量结果间有一定的可比性。
2、公式
某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲、乙两人的Z分数。
Z甲=(94.2-90)/3=1.4Z乙=(89.1-90)/3=-0.3
(用原始数据分布图和Z分数分布图表示)
例2:
有一个人语文93分,数学97分,究竟是数学还是语文在各自的分布中较高。
得分
计算
Z
P(百分位数)
语文
93
(93-90)/4
0.75
0.78
数学
98
97
(97-98)/3
-0.33
0.37
语文考的好0.75数学低了0.33
Z:
-3~3
1~9(1对应-3,9对应3)
标准分数就出来标准9分,从1至9.
3、Z分数无实际单位(从公式分析)
4、Z分数的性质(推导)
原始数据
Z分数
统计量
81
0.53
75.10
74
-0.10
11.12
84
0.80
77
0.17
80
0.44
57
-1.63
50
-2.26
83
0.71
5、智力量表的成绩表示
五、百分位数的概念及其计算方法
中位数即第50百分位数。
1、百分位数的概念(需要知道累积百分率分布表)
百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值,一般用Pp表示。
例如,第70百分位数表示有70%的数据小于这个数。
在教育测量中,常通过计算某个原始分数的百分位数来说明、解释、评价它在团体中所处的位置,比如将实际的测验分数转化为百分位数,就可以知道有百分之几的人低于或高于他。
分组
频数
累积频数
累积百分比
98-
280
100
96-
278
99
94-
275
98
92-
8
271
97
90-
12
263
94
88-
251
90
86-
20
235
84-
21
215
82-
22
194
69
80-
29
172
61
78-
26
143
51
76-
24
117
42
74-
33
72-
19
71
25
70-
15
52
19
68-
14
37
13
66-
23
8
64-
5
62-
5
2
60-
0
累积百分比是累积频数除以人数
名次、百分位数、标准分数都是来衡量在团体中所处的位置
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 统计 测量