非参数检验提纲.docx
- 文档编号:26672027
- 上传时间:2023-06-21
- 格式:DOCX
- 页数:22
- 大小:825.98KB
非参数检验提纲.docx
《非参数检验提纲.docx》由会员分享,可在线阅读,更多相关《非参数检验提纲.docx(22页珍藏版)》请在冰豆网上搜索。
非参数检验提纲
非参数检验
参数检验方法,尤其是对计量资料,需要对研究的总体作一些比较严格的假定。
例如t检验法要求总体分布是正态分布等。
在实际工作中的许多资料不符合这种要求,因此以上的参数检验方法的使用受到了限制。
近代统计学家发明了对总体分布不必作限制性假定的检验技术,这种技术称为非参数检验(Nonparametrictests)。
非参数检验法是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自相同总体假设的一类检验方法。
由于它的假定前堤比参数检验方法少的多,而且在收集资料方面也十分简单,例如可以用“等级”或“符号”来评定观察的结果等,故这类方法在实际中有着广泛的应用。
第一节两相关样本的显著性检验
1.1符号检验法
在配对实验中,将每对(或同一)实验单位(或先后)给予两种不同的处理,比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。
凡配对计量资料不服从正态分布要求时,可选用符号检验法(Signtest)。
例题1有x,y12对数据,它们的数值及相差符号由表1给出。
表1本例的数据资料
序号
1
2
3
4
5
6
7
8
9
10
11
12
X
3
1
6
3
2
1
4
7
3
8
4
5
Y
2
4
4
7
2
2
2
5
3
6
2
2
差
+
-
+
-
0
-
+
+
0
+
+
+
问这两个序列数值的差异是否具有显著性(α=0.05)?
1.2符号秩和检验法
符号检验中只考虑配对数据xi-yi的符号,计算十分简便,但因没有考虑到xi-yi差值的大小,因此对资料的利用不够充分,检验的灵敏度也不够好。
符号秩和检验法是上述方法的改进,由于关注到了差值的大小,故效果较好。
凡配对计量或计数的资料,可选用符号秩和检验法(Wilcoxon法)。
例题2为研究长跑运动对增强普通高校学生的心功能效果,对某学院15名男生进行实验,经过5个月的长跑锻炼后观察其晨脉变化情况。
锻炼前后的晨脉数据如下。
问锻炼前后晨脉间的差异有无显著性(α=0.05)?
表2长跑锻炼前后的晨脉数、差值及其秩次
序号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
前
70
76
56
63
63
56
58
60
65
65
75
66
56
59
70
后
46
54
60
64
48
55
54
45
51
48
56
48
64
50
54
差值
22
22
-4
-1
15
1
4
15
14
17
19
18
-8
9
16
秩次
14.5
14.5
–3.5
–1.5
8.5
1.5
3.5
8.5
7
11
13
12
-5
6
10
1.3用spss对两相关样本进行非参数检验
spss软件包的NonparametricTests过程为两相关样本通常提供了3种非参数检验方法,它们是:
Sign检验,用于对两相关样本的总体做符号检验。
Wilcoxon检验,用于对两相关样本的总体做符号秩和检验。
McNemar检验,用于对“先后型”相关样本的总体做前后变化的显著性检验。
例题3用spss对例题2中的数据资料做符号检验和符号秩和检验。
操作步骤:
(1)建立数据文件:
录入数据。
给变量命名,令锻炼前的晨脉为“x”,锻炼后的晨脉为“y”。
如要重复使用该文件则可给文件命名,保存文件。
数据文件格式:
图1为两相关样本进行非参数检验建立的数据文件
(2)单击Analyze,出现下拉菜单,单击NonparametricTests,又出现
菜单,如图2所示。
图2两相关样本的非参数过程调用
单击“2RelatedSamples…”,打开“2相关样本”主对话框,使左面变量表中的两个相关变量在CurrentSelections框的Variable1和Variable2中依次出现,单击右面一个右箭头按钮,变量名被移到TestPair(s)List框中。
在TestType框中选择Wilcoxon方法和Sign方法,如图3所示。
图3两相关样本进行非参数检验的主对话框
(3)单击OK程序运行,显示结果。
输出结果:
WilcoxonSignedRanksTest
表3两变量差值秩次的统计量
表4两变量差值的符号秩和检验结果
SignTest
表5两变量差值的频数
表6两变量差值的符号检验结果
表3为秩表,其中第一栏内列出了锻炼前后晨脉差值的秩的不同关系,PositiveRanks是正秩次、NegativeRanks是负秩次、Ties是零差值、Total是正负秩次数目之和,N为频数,MeanRank为平均秩次,SumofRanks为秩和。
表4为两相关样本的符号秩和检验结果,Z为检验统计量,其中Asymp.Sig.(2-tailed)为双侧检验Z=-2.842时基于逼近法的概率,本例概率p=0.004<0.05。
表5为频数表,其中第一栏内列出了锻炼前后晨脉差值的不同关系,PositiveDifferences是正差值、NegativeDifferences是负差值,Ties是零差值、Total是正负差值的数目之和,N为频数。
表6为两相关样本的符号检验结果,其中ExactSig.(2-tailed)为检验时基于精确法的双侧二项分布概率,本例概率p=0.035<0.05。
以上结果显示两种检验方法计算出的P值均小于0.05,故在0.05水平上可以认为锻炼前后晨脉间差异具有显著性。
第二节两独立样本显著性检验
2.1秩和检验法
两样本比较的秩和检验法,是利用两样本观察值的秩来推断两样本分别代表的总体的分布是否相同。
该方法相当于检验两个独立样本平均数之差异的t检验法。
当两个独立样本不符合t检验法的基本假设时,可以选用两样本比较的秩和检验法(Mann-WhitneyU检验)。
例题4采用两种不同教学方法分别对两组学生进行教学后,测得两组学生成绩分数如表8.7,问这两组学生所得成绩间的差异有无显著性(α=0.05)?
表7两组学生的成绩分数编秩表
秩号
1
2
3
4
5
6
7
8
9
10
组I
56
68
72
78
81
85
组II
50
67
72
86
2.2中位数检验法
中位数检验法用来检验两个彼此独立的样本是否来自中位数相等的总体。
该方法相当于检验两个独立样本平均数之差异的t检验法。
当两个独立样本不符合t检验法的基本假设—其总体分布不是正态分布时,可选用中位数检验法(MEDIAN法)。
例题5下表列出两组不同年龄组儿童错觉实验结果,问这两个年
龄组儿童的错觉量差异是否具有显著性(α=0.05)?
表9
序号
1
2
3
4
5
6
7
六岁组(A)
14
13
10
12
15
9
9
十岁组(B)
5
7
6
5
11
8
10
2.3用spss对两独立样本进行非参数检验
spss软件包的NonparametricTests过程为两独立样本通常提供4种非参数检验方法,它们之中常用的3个检验方法是:
Mann-WhitneyU检验,其适用于顺序变量,通过对样品秩的分析
来检验两个独立样本是否来自于分布相同的总体。
Kolmogorov-SmirnovZ检验,用来检验两个独立样本是否来自具
有相同分布的总体。
其检验基于比较两个样本所对应的累计频数分布函数cfn1(x)和cfn2(x),如果两个样本的累积频率分布在许多点上“离得太远”,就意味着这两个样本取自不同总体的可能性很大。
Mosesextremereactions检验,极端反应检验,检验两个独立样
本的观察值的分布范围是否有差异存在;检验两个独立样本是否来自具有同一分布的总体。
例题6用spss对例题4中的数据资料做Mann-WhitneyU检验。
操作步骤:
(1)建立数据文件:
录入数据。
给变量命名,令学生成绩为“Mark”,组别为“Group”。
如要重复使用该文件则可给文件命名,保存文件。
数据文件格式:
图4为两独立样本进行非参数检验建立的数据文件
(2)单击Analyze,出现下拉菜单,单击NonparametricTests,又出现菜单,如图5所示。
图5两独立样本的非参数过程调用
(3)单击“2IndependentSamples…”,打开“2独立样本”主对话框,将左面变量表中的变量名“mark”移到TestVariableList下面的矩形框中;将用来分组的变量名“Group”移到GroupingVariable下面的矩形框中;单击“DefineGroup”按钮,对第一组和第二组的分组变量的值进行标识;在TestType框中选择Mann-WhitneyU方法,如图6所示。
图6两独立样本进行非参数检验的主对话框
(4)单击OK程序运行,显示结果。
输出结果:
Mann-WhitneyTest
表11Mark的秩次统计量
表12Mark的Mann-Whitney检验结果
表11为秩表,其中第一栏列出了学生的组别;N为学生组的人数,MeanRank为平均秩次,SumofRanks为秩和。
表12为两组学生所得的成绩间差异的Mann-WhitneyU检验结果,其中的Asymp.Sig.(2-tailedSig.)为双侧检验Mann-WhitneyU检验统计量U=9.5、WilcoxonW检验统计量W=19.5和标准化了的检验统计量Z=-0.535时基于逼近法的概率,本例概率p=0.593>0.05;ExactSig.[2*(1-tailedSig.)]为基于精确法的双侧概率,本例概率p=0.610>0.05。
以上可结论为在0.05水平上这两组学生所得的成绩间的差异无显著性。
第三节多个相关样本的显著性检验
3.1多个相关样本的非参数检验方法
本讲第一节所提到的显著性检验是对两个相关样本检验,属于多个相关样本检验中的基本形式。
spss软件通常为多个相关样本的非参数检验提供了3种检验方法。
COCHRAN检验又称为Q检验,用来检验K个相关样本的总体分布是否相同。
当数据是定性变量或者是二分类的次序信息时,CochranQ检验特别适用。
FRIEDMAN检验又称双向秩方差分析。
它对K个相关样本的每一次取值排秩(1~K),如果样本容量为N,那么在每个样本中将对N个秩值求和并以此为依据来分析,检验K个相关样本的总体分布是否相同。
KENDALL检验用来检验K个相关样本是否来自同一分布的总体,或者说考查K个评判者对N个对象的观测评分之间是否一致。
该检验计算Kendall和谐系数W,W刻划了样本数据的实际符合与最大可能的符合之间的分歧程度;W值介于0与1之间,W值愈大,表示一致性愈高。
3.2用spss对多个相关样本进行非参数检验
例7八位教师对三位运动员技术水平所作主观评价如表8.12,问这八位教师对这三位运动员技术水平的评价标准是否一致(α=0.05)?
表8.13运动员的技评成绩
运动员
教师
A
B
C
1
5.3
6.2
5.8
2
5.5
6.4
6.0
3
5.1
4.8
5.5
4
5.2
5.0
5.5
5
5.3
6.0
5.6
6
5.2
4.9
5.4
7
5.6
6.7
6.0
8
5.5
6.2
5.9
采用Friedman检验方法和Kendall检验方法进行非参数检验。
检验的原假设:
这八位教师对这三位运动员技术水平的评价标准是一致的。
操作步骤:
(1)
建立数据文件:
录入数据,给变量命名。
如要重复使用该文件则可给文件命名,保存文件。
数据文件格式:
图7为多个相关样本资料进行非参数检验建立的数据文件
(2)单击Analyze,出现下拉菜单,单击NonparametricTests,又出现菜单,如图8所示。
图8多个相关样本资料的非参数过程调用
单击“KRelatedSamples…”,打开“K个相关样本”主对话框,将左面变量表中的变量名移到TestVariables下面的矩形框中;在TestType框中选择Friedman方法和Kendall’sW方法,如图9所示。
图9多个相关样本资料进行非参数检验的主对话框
(3)单击OK程序运行,显示结果。
输出结果:
FriedmanTest
表14运动员技术水平教师主观评价值的平均秩
表15教师主观评价值的Friedman检验结果
Kendall'sWTest
表16运动员技术水平教师主观评价值的平均秩
表17教师主观评价值的Kendall'sW检验结果
表14和表16为秩表,表中列出了这三位运动员技术水平教师主观评价值的平均秩(MeanRank)。
表15为多个相关样本的Friedman检验结果,其中Asymp.Sig.为检验统计量χ2=4.750时基于逼近法的概率,本例概率p=0.093>0.05;表17为多个相关样本的Kendall'sW检验结果,其中Asymp.Sig.为Kendall和谐系数W=0.297和Chi-Square检验统计量χ2=4.750时基于逼近法的概率,本例概率p=0.093>0.05。
以上结果显示两种检验方法计算出的P值均大于0.05,故接受原假设,即这八位教师对这三位运动员技术水平的评价标准在0.05水平上是一致的。
例题8某校想了解学生对几种不同体育项目的兴趣。
在校内随机询问了18名学生,请他们回答对指定的3种体育项目的兴趣(有兴趣的记为1,没有兴趣的记为0),结果如表17,试问学生对这3种体育项目的兴趣是否一样?
(α=0.01)
表18对3种体育项目兴趣的学生应答数据资料
项目
学生
A
B
C
项目
学生
A
B
C
1
0
0
0
10
0
0
0
2
1
1
0
11
1
1
1
3
0
1
0
12
1
1
1
4
0
0
0
13
1
1
0
5
1
0
0
14
1
1
0
6
1
1
0
15
1
1
0
7
1
1
0
16
1
1
1
8
0
1
0
17
1
1
0
9
1
0
0
18
1
1
0
采用COCHRAN检验法进行非参数检验。
检验的原假设:
该校学生对这3种体育项目的兴趣是相同的。
操作步骤:
(1)建立数据文件:
录入数据,给变量命名。
如要重复使用该文件则可给文件命名,保存文件。
数据文件格式:
图10为多个相关样本资料进行非参数检验建立的数据文件
(1)
在多个相关样本资料进行非参数检验的主对话框中的TestType框中选择Cochran’sQ方法,如图11所示。
图11多个相关样本资料进行非参数检验的主对话框
(2)单击OK程序运行,显示结果。
输出结果:
CochranTest
表19学生对体育项目兴趣应答结果的频数
表20应答结果的Cochran’sQ检验结果
表19为频数表,表中列出了学生对三种体育项目兴趣的不同回答的频数。
表20为多个相关样本Cochran’sQ检验的结果,其中Asymp.Sig.为检验统计量Q=16.667时基于逼近法的概率,本例的概率为p=0.000<0.01,故否定了检验的原假设,即该校学生对这3种体育项目的兴趣在0.01水平上是不相同的。
第四节多个独立样本的显著性检验
4.1多个独立样本的非参数检验方法
本讲第二节所提到的成组比较资料显著性检验是对两个独立样本检验,属于多个独立样本检验中最基本的形式。
Spss软件通常为多个独立样本的非参数检验提供了2种检验方法。
Kruskal—Wallis检验用于检验K个独立样本是否来自同一个总体,它所考察的问题类似于单因素多水平的方差分析。
Median检验可用于检验K个独立样本是否来自具有相同中位数的总体。
4.2用SPSS对多个独立样本进行非参数检验
例题9现测得优秀男子排球、体操和游泳三个项目的运动员的纵跳成绩(单位:
厘米)如下:
序号
1
2
3
4
5
6
7
排球
78
75
73
78
76
体操
65
63
65
65
67
62
68
游泳
69
62
66
67
68
70
试检验这三个项目运动员纵跳成绩之间的差异有无显著性(α=0.05)?
采用Kruskal-Wallis检验方法和Median检验方法,进行非参数检验。
检验的原假设是:
这三个项目运动员纵跳成绩之间的差异没有显著性。
操作步骤:
(1)建立数据文件:
录入数据,给变量命名,令运动员的纵跳成绩为“HIGH”,项目分组为“GROUP”,其取值含义为排球组
(1),体操组
(2),游泳组(3)。
如要重复使用该文件则可给文件命名,保存文件。
数据文件格式:
图12为多个独立样本资料进行非参数检验建立的数据文件
(1)单击Analyze,出现下拉菜单,单击NonparametricTests,又出现
菜单,如图13所示。
图13多个独立样本资料的非参数过程调用
单击“KIndependentSamples…”,打开“K个独立样本”主对话框,将左面变量表中的变量名“high”移到TestVariableList下面的矩形框中;将用来分组的变量名“Group”移到GroupingVariable下面的矩形框中;单击“DefineGroup”按钮,对分组变量的值进行标识;在TestType框中选择Kruskal-WallisH检验方法和Median检验方法,如图14所示。
图14多个独立样本资料进行非参数检验的主对话框
(2)单击OK程序运行,显示结果。
输出结果:
Kruskal-WallisTest
表21不同项目运动员纵跳成绩的平均秩
表22不同项目运动员纵跳成绩之间差异Kruskal-Wallis检验结果
MedianTest
表23频数表
表24不同项目运动员纵跳成绩之间差异Median检验结果
表21为秩表,表中列出了三种体育项目运动员的人数(N)和各组运动员纵跳成绩的平均秩(MeanRank)。
表22为多个独立样本的Kruskal-Wallis检验结果,其中Asymp.Sig.为检验统计量χ2=11.556时基于逼近法的概率,本例概率p=0.003<0.05。
表23为频数表,表中列出了各组中运动员纵跳成绩大于中位数(>Median)和小于中位数或等于中位数(<=Median)的频数。
表24为多个独立样本的Median检验结果,本例的中位数(Median)等于67.50厘米;表中Asymp.Sig.为检验统计量χ2=8.571时基于逼近法的概率,本例概率p=0.014<0.05。
以上结果显示两种检验方法计算出的P值均小于0.05,故否定了检验的原假设,即可以认为这三个项目运动员纵跳成绩之间的差异在0.05水平上具有显著性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 检验 提纲