数学教育测量与评价.docx
- 文档编号:10359915
- 上传时间:2023-02-10
- 格式:DOCX
- 页数:11
- 大小:26.25KB
数学教育测量与评价.docx
《数学教育测量与评价.docx》由会员分享,可在线阅读,更多相关《数学教育测量与评价.docx(11页珍藏版)》请在冰豆网上搜索。
数学教育测量与评价
数学教育测量与评价
专题讲座 第一章均值和方差的检验题 一、参数假设检验的几个基本因素 关于什么是参数假设检验,我们先看一个实际例子。
“某班语文课教学采用研讨式方法后,对其中10名同学测验,平均成绩为85分。
已知这个班过去测验成绩服从正态分布,其均值保持在82分左右,这意味着总体平均分 是给定的,那么现在问采用研讨式方法后,其 平均成绩是否和原来一致?
”如果我们假设采用研讨式方法后的平均成绩和采用研讨式方法前的平均成绩一致,则需要判断这种假设对不对?
如果对,对的把握性有多大?
如果不对,那么平均成绩比原来是增加还是减少?
当然,我们不能只看到85分高于82分就认为比原来高了,这是因为抽取样本时受到随机因素的干扰,我们不能以样本参数对总体参数进行单纯比较而简单地下结论。
这个例子所反映问题的是:
总体分布已知,对总体参数作假设,用统计理论来判断这一假设正确与否,统计学上称为参数假设检验。
一般说来,进行假设检验应重点关注以下几个基本因素:
其一,假设。
假设分为参数假设和非参数假设.参数假设指总体分布已知,关于未知参数的假设,教育研究中用的最多的是已知总体服从正态分布,对总体均值某校五年级学生期末语文成绩 ,方差 ,总体方差 做出假设。
例如, 在过 在原有状况下不变,而均值 去常规教学下为82分。
为了提高教学质量,采用新的教学法后抽测10名同学,其平均成绩为85分,这时我们提出采用新教学法后总体均值称 为原假设或零假设,相对于 为82分的假设,记为 ,还要给出一个备选假设,记为 对这个例子我们不提本均值85大于82。
小于82这样的假设,这是因为这样的假设是没有根据的,原因在于样 其二,假设检验。
对于一个假设,我们关心的是“假设”是否成立。
判断假设成立与否的方法叫假设检验,最简单的检验是显著性检验。
例如,已知 ,对 进行检验。
其三,检验水平。
当原假设正确时,若否定原假设犯错误的概率为=。
,称为检验水平。
一般地, 取值为,和,但常用的是其四,两类错误。
统计学上有两类错误:
第一类错误和第二类错误。
第一类错误是, 实际上,显著性水平 是正确的,但检验的结论却是否定,记其概率为 就是犯第一类错误的概率,取的越大,否定的可能性就越大。
第二类错误是,是不对的,但检验结论却认为 是正确的,记其概率为 犯这两类错误的后果通常是不一样的,如检验某人是否患某种疾病,设:
该人患有此 种疾病,则第二类错误是无病当作有病,但第一类错误却是有病当作无病,有可能使该人延误病情而发生意外。
可见犯第一类错误的后果较第二类错误的后果严重。
最理想的情况是找到一种检验方法使得两类错误的概率都为0,但实际情况是当样本量事先给定的情况下,第一类错误小,第二类错误就大;第二类错误小,第一类错误就大。
也就是说不可能找到一个方法能同时控制两类错误,退而求其次,在样本量给定的情况下,把第一类错误控制在检验水平 以内,尽量使第二类小一些。
其五,检验的一般步骤。
第一步:
建立原假设备选假设=not。
第二步:
构造一个检验统计量布。
,在原假设正确的条件下得到的分 第三步:
观测到的数据可以得到统计量 p=P(| |≥|t|) 的观测值t,计算p值 若p值小于检验水平平 ,则得出的结论是:
原假设是不成立的;若p大于检验水 ,则需要进一步采取别 ,则得出的结论是:
原假设是成立的;若p等于检验水平 的方法来处理一下。
二、总体均值、方差和概率的检验问题总体均值的检验 总体均值的检验方法有两种:
检验和检验,这里我们主要介绍常用的t检验。
利用服从分布的统计量进行的检验叫做检验.检验根据处理问题的不同主要涉及下面的三类检验问题。
第一,单正态总体,总体方差 未知,对总体均值 进行检验。
在实际应用中往往只知道总体服从正态分布,参数本方差 作为 的一个估计,从而构造t检验。
设未知,设假设问题为 是未知的,常用的方法就是用样 为来自正态总体=not . 的一个样本,在 成立条件下,T统计量服从t分布,见如下 () 其中为样本方差,为样本均值,为自度。
再样本数据计算出T统计量 的观测值值,在成立条件下计算p值p=P(|T|>|t|)。
若p值小于检验水平检验水平 ,则得出的结论是:
总体均值 与 与有显著差异;若p值大于 , ,则得出的结论是:
总体均值没有显著差异;若p值等于检验水平 则需要进一步采取别的方法来处理一下。
例1:
已往资料知道某区6岁女童平均体重为,现从某幼儿园抽测10名女童其体重数据为,,,,,,,,,。
问该幼儿园6岁女童平均体重与某区6岁女童平均体重有无显著差异?
。
解:
为样本量,未知,检验问题为=not 则T统计量服从自度为9的t分布。
样本数据计算得 p=P(|T|>|t|)=> . p值大于检验水平说明该幼儿园6岁女童平均体重与本区6岁女童平均体重无显著性差异。
第二,方差,未知,但=,比较两总体均值和。
设样本,记 ,分别来自正态总体,的两个独立 , , 检验问题为=not。
在成立条件下,构造统计量T, () 给定检验水平值 p=P(|T|>|t|)。
,再样本数据计算出T统计量的观测值值,在成立条件下计算p 若p值小于检验水平于检验水平 ,则得出的结论是:
总体均值 和 和有显著差异;若p值大 , ,则得出的结论是:
总体均值没有显著差异;若p值等于检验水平 则需要进一步采取别的方法来处理一下。
特别地,当时,称为配对数据,统计量为 上一页1234下一页 () 专题讲座第一章均值和方差的检验题总体均值的检验例2:
从某中学初三学生中随机选定两个组(每组10人)进行语文教学改革试验。
甲组采用讨论式方法,乙组采用讲授式方法,期末测验甲组平均成绩为78分,方差为15分,乙组平均成绩为73分,方差为16分,问两种方法效果有无差异?
(布。
))(设成绩服从正态分解:
假定两个总体的方差相等。
检验问题为 =not则T统计量服从自度为18的t分布,样本数据计算出T统计量的观测值值为 p值为p=P(|T|>|t|)=|t|)=0 附小三年级学生采用结构教材前后成绩 使用使用结结构构教材教材 后 前70826062857574905872总和 74906864927570956278 484270-454640 04023-4-8102 0160491664104130 解:
设采用结构教材前成绩样本 , ,采用结构教材后。
属同一组对象进行两次实验,故为相关样本。
而差数 为D的均值,于 服从正态分布,样本均值, 未知,故 也未知. ,其中为D的方差, 检验问题为:
=0 =not 在成立条件下,构造T统计量, 则T统计量服从自度为9的t分布,样本数据计算出T统计量的观测值值为 其中样本均值为样本方差为p值为p=P(|T|>|t|)=差没有显著性变化.。
p值大于检验水平说明该幼儿园6岁儿童这项智力测定成绩方检验:
利用均值分布统计量进行的检验叫做,检验。
检验用来检验当两正态总体和。
未知,方差未知时比较两正态总体方差设本,记,分别来自正态总体的两个独立样 我们在检验中进行双正态总体,未知假定=,,独立样本比较两总体均值和时,。
因此在进行这类问题的检验前,首检先要检验两总体方差是否一致,这就要用到验。
检验问题为 =not在成立条件下,构造服从自度为和的F分布的统计量 其中为第一自度,为第二自度。
给定检验水平,再样本数据计算,则得出的出F统计量的观测值f值,在结论是:
总体方差方差和和成立条件下计算p值,若p值小于检验水平有显著差异;若p值大于检验水平,则得出的结论是:
总体没有显著差异;若p值等于检验水平,则需要进一步采取别的方法来处理一下。
例6:
利用例3的数据,检验问题为 =not在成立条件下,构造服从自度为=39和=29的F分布的统计量 样本数据计算出F统计量的观测值f值 在成立条件下计算p值=>。
p值大于检验水平说明男、女新生体重的方差无显著性差异。
上一页1234下一页
,单击[OK],执行操作。
单样本t检验实例应用 某学校统一考试的高等数学的平均成绩为75分,该校经济学院某班的成绩见下表。
请问该班的成绩与全校的平均成绩的差异显 著吗?
编 123456789号成 9782988756896068绩90 编 1011121314151617号 成 9697756092648376绩 编 181920212223242526号成 747055858656716577绩 编号27成绩56 2860 2992 3054 3187 3280 建立SPSS数据文件。
根据该班的高等数学的成绩建立SPSS 数据文件。
One-SampleTTest的操作步骤。
①读取数据文件,点击[Analysis]/[CompareMeans]/[One-SampleTTest],打开单样本t检验对话窗口。
②将成绩变量移入[TestVariable]框中。
③在TestValue后的参数栏中键入总体均值75.④点击[OK],执行操作。
输出结果以及解释单样本t检验的结果输出包括样本的基本描述统计结果与t检验结果。
表1输出的结果从左至右依次为样本的数量、均值、标准差和标准误。
表1One-SampleStatisticsStd.DeviationStd.ErrorMeanNMean成32 绩表2输出的结果从左至右依次为t值、自度、双尾检验的p值、样本均值与总体均值的差值和均值差值的95%臵信区间。
均值插值的95%臵信区间=均值差值〒标准误,即Lower和Upper两项数值的含义。
在此实验结果中,样本均值与总体均值的差值落在两项数值之间的概率为95%。
表2One-SampleTest tdfSig.TestValue=75Mean95%ConfidenceInterval(2-tailed)成绩.46631.645DifferenceoftheDifferenceLower-Upper结果的报告T检验结果显示,这个班的高等数学的成绩与该学校高等数学平均成绩之间的差异不显著,t=,df=31,p>上一页1234下一页专题讲座第一章均值和方差的检验题Independent-SampleTTest的操作选项依次点击[Analysis]/[CompareMeans]/[Independent-SamplesTTest],打开独立样本t检验的对话窗口。
选择检验变量。
从左侧变量列表中选定进行差异检验的变量,单击向右箭头,将其移入[TestVariable(s)]框中。
选择分租变量并定义组别。
从左侧变量列表中选择一个分组变量,单击向右箭头按钮,将变量移入[GroupVariable]框中。
单击[DefineGroups]按钮,打开定义组别的对话窗口。
如果GroupingVariable是分类变量且只有两个值,选择[UseSpecifiedValues]选项栏,在Group后面的参数框中分别键入两组的分类变量值;如果GroupingVariable是分类变量且有多个值,选择[UseSpecifiedValues]选项栏,并在Group后面的参数框中分别键入特定两组的分类变量值,系统只对具有这两个组进行均值比较;如果GroupingVariable是连续变量,选择[CutPoint]选项并在其后面的参数栏中键入一个值,系统会将GroupingVariable按大于等于和小于该值分成两组,然后对它们进行均值比较。
臵信区间与缺失值处理采用系统默认方式。
点击[OK],执行操作。
Independent-SampleTTest应用举例某城市中考成绩出来后,有关教育部门想知道学校a1重点班和学校a2重点班的数学考试成绩是否具有显著性差异。
请用Independent-SampleTTest来进行分析。
数据参见附件。
建立SPSS文件将两个学校重点班学生的数学中考成绩分别输入建立SPSS文件。
Independent-SampleTTest的操作步骤。
①依次点击[Analysis]/[CompareMeans]/[Independent-SamplesTTest],打开独立样本t检验的对话窗口。
②将成绩变量输入[TestVariable]中。
③将学校变量移入[GroupingVariable]框中。
单击[DefineGroup]按钮,在Group后面的参数框中分别键入两组的分类变量值1和2.点击[Continue]按钮。
④点击[OK],执行操作。
输出的结果及解释独立样本t检验的结果输出包括两个独立样本的基本表述统计量和t检验结果,见下表。
表1的输出结果从左到右依次为两个样本的人数、均值、标准差和标准误。
表1
GroupStatistics 学校成绩 802N3 Mean Mean表2输出的结果包括方差齐性检验结果和t检验结果。
方差齐性包括两个假设:
假设方差是齐的以及假设方差是不齐的。
如果方差齐性检验的结果是不显著的,选择EqualVariancesAssumed,报告上面一行的t检验结果:
如果方差齐性检验的结果是显著的,选择EqualVariancesnotAssumed,报告上面的 一行的t检验结果。
表2 IndependentSamplesTest Levene’sTest t-testforEqualityofMeans 95%ConfidenceIntervalofthe Mean SFig. tf dig Std.Error Lower Upper Difference SDifferencDifferenc e e Equa 绩 l ..-6 5534 .- - 593445.626 variancesassumedEqualvariancesnotassumed -5 . - - .630531 结果的报告两个学校重点班数学中考成绩的t检验的结果显示,方差齐性检验显著,即两组的方差不齐。
两校 重点班数学中考成绩不存在显著性差异。
Paried-SamplesTTest的操作程序 依次点击[Analysis]/[CompareMeans]/[Paired-Samples TTest],打开配对样本t检验的对话窗口。
选择配对变量。
从左侧变量列表中选定两个要进行检验的变量,此时,[CurrentSelections]栏下[Variable1]和[Variable2]后面会显示选定的两个变量,然后单击向右箭头按钮,将配对变量移入[PairedVariables]框中。
如果有多组配对 变量,则重复上述操作。
臵信区间和缺失值处理采用系统默认值。
点击[OK],执行操作。
Paried-SamplesTTest应用举例某高校数学与统计学院期末考试成绩出来后,学院教务人员想知道复变函数论和实变函数论两门课之间是否具有显著性差异。
请分析。
建立SPSS文件。
Paried-SamplesTTest的操作步骤①依次点击[Analysis]/[CompareMeans]/[Paired-SamplesTTest],打开配对样本t检验的对话窗口。
②从左侧变量列表中选定\复变函数\和\实变函数\两个变量并将它们移入[Paried-SamplesTTest]框中。
③点击[OK],执行操作。
输出的结果及解释配对样本t检验的输出结果包括配对样本的基本描述统计结果、配对样本的相关系数表和t检验结果。
表1输出结果从左至右依次是\复变函数\与\实变函数\考试成绩的平均值、人数、标准差、标准误。
表1PairedSamplesStatistics Mean Std.Std. NDeviationErrorMean150150 .99817.88063P复79. air1变函数6400 实 78. 变函数2267 表2输出结果从左至右依次为配对样本的人数、相关系数和显著 水平。
表2 PairedSamplesCorrelations N Pair1 复变函数&实变函数 150Correlation.583 Sig..000 表3输出的结果从左至右依次为两个配对样本平均数差值的均值、差值的标准差、差值的标准误、差值均值的95%臵信区间, 以及t值、自度、双尾检验的p值。
表3 PairedSamplesTest Mean PairedDifferences S Std.td. 95%Confidence d Sig. DeviationErrorIntervalofthetf(2-tailed)MeanDifferenceLowerUpper.-.air变413331函数-实变函数864002939512062.63649结果的报告对学生期末考试“复变函数”和“实变函数”成绩进行配对样本t检验的结果表明两门课的考试成绩没有显著性差异。
上一页1234下一页专题讲座第二章方差分析一、单因素完全随机化设计方差分析是英国统计学家Fisher在二十世纪20年代创立的,是
他进行许多田间试验时发明的统计方法,之后这个方法被用于其他的领域,尤其是工业试验数据的分析中。
注:
方差分析处理的数据是经过一定的“设计”得到的试验数据。
下面我们先来介绍方差分析的一种——单因素完全随机化设计。
下面我们通过一个例子来加以说明。
假定某个农业地区原来不曾种植小麦,现在打算种植这种作物,各地已有过一些优良品种,但因本地区并无种植小麦的经验,不知道哪一个品种最适合本地区。
为此进行一个田间试验,取一大块地将其分成形状大小都相同的小块。
设供选择的品种有个。
我们打算其中的小块种植品种1,小块种植品种2,等等,。
的选取并无严格限制。
分配数目定了,接着就要定出哪些小块分给哪些品种。
对此,可以用随机化的方法来定。
做法如下:
取张纸片,上面分别写上数字1,2,,。
把它混乱放入一个盒子里,然后一张一张地依次抽出来。
最先抽出的个号码给品种1,其次抽出的个号码给品种2,以此类推——当然,事先已把上述小块地充1到标了号。
这个例子就是一个典型的单因素完全随机化设计。
所谓单因素完全随机化设计是指具有下面两个特点的实验设计:
第一,重复:
即上述都大于1:
每个品种至少种植在两块土地上。
第二,随机化:
哪些小块土地分配于哪些品种完全凭随机,这种设计称为“完全随机化”。
在本例中,影响感兴趣的指标亩产量的因素只有一个,即种子品种。
种子品种有个。
每一个具体的品种,都称为品种这个因素的一个“水平”,故品种这个因素一共有个水平。
本试验称为单因素水平的试验。
称为水平的“重复度”。
二、单因素完全随机化试验的方差分析设问题中涉及一个因素,有个水平,如上例的个种子品种。
以记第个水平的第个观察值。
如上例,是种植品种的第小块地上的亩产量,是品种的平均亩产量。
关心的问题是是否相同。
如果相同,说明种子的品种对指标亩产量无影响;如果不同,说明种子的品种对指标亩产量有影响。
检验问题是 令 愈大,表示之间的差异愈大。
可分解为两部分,一部分表示随机误差的影响,记为均值,,;一部分表示因素的各水平理论,其中的不同带来的影响,记为 在统计学上通常把上文的的平方和”,称为“总平方和”,称为“因素就称为“误差平方和”。
而分解式称为“方差分析”。
当比值大时,否定;当比值小时,接受。
在正态分布条件下,当成立时,服从自度为k-1和n-k的F分布,即 其中 样本数据可以算出 下,计算p:
p=P~ 项目自度比显著性*,**,或不显著误差——总和———若p值小于,用“**”表示;若p值介于和之间,用“*”表示;若p值大于,表示因素的效应“不显著”。
例1:
设上述品种试验中,包含有个品种,分别重复4、5和3次,数据为品种1:
390,410,372,385。
品种2:
375,348,354,364,362。
品种3:
413,383,408。
全部12个数的算术平均为,总平方和为 其自度为。
3个品种各自数据的算术平均,分别为,和,因此算出误差平方和为 其自度为。
品种平方和 其自度为 因素的比为 查表得,。
。
于是有,可 算出, 因>,故品种效应是高度显著的。
以上计算结果列成方差分析表如下:
自显比1794009.著性**项目品种度2.68
误差总和 19401187.—————检验的结果表明:
不同品种的产量之间的差异,在统计上高度显著。
三、两因素完全试验的方差分析一般情况下,在一个试验中要考虑好几个对指标可能有影响的因素。
例如在一项工业试验中,影响产品质量指标的因素可能有反应温度、反应压力、反应时间和某种催化剂的添加量。
若反应温度有个不同的可能选择,其他三个因素分别有,和种不同的选择,则可供选择的试验组合一共有个试验也就称为一个种,而这试验。
如果每一可能的组合都做一次试验,则试验称为是“完全”的。
若只对一部分组合作试验,则称为“部分实施”。
在实际应用中部分实践很常见,因为完全试验往往规模太大,为条件所不允许,且有时并无必要。
要作部分实施,就有一个如何去选择那些实际进行试验的组合的问题。
为书写简便,这里讨论两因素完全试验的情况。
设有两因素,,分别有,个水平。
的水平与的水平的组合记为,其试验结果记为,,。
表示的水平带来的产量影响,故称为因素的水平的效应,有类似的解释。
令 总平方和SS为 其中,和分别表示因素 和随机误差的影响。
检验问题是:
成立表示因素对指标其实无影响;成立表示因素B对指标其实无影响.同理可得两因素完全试验的方差分析表。
两因素完全试验的方差分析表项目自度比显著性“*”,“**”或不显著— 误——差总———和若p值小于,用“**”表示;若p值介于和之间,用“*”表示;若p值大于,表示因素的效应“不显著”。
例2:
在一个农业试验中,考虑4种不同的种子品种和)。
试验数据为:
品种施肥方法12203040123 29316325 31318317 32318
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 教育 测量 评价