非参数统计十道题.docx
- 文档编号:5532529
- 上传时间:2022-12-18
- 格式:DOCX
- 页数:28
- 大小:150.42KB
非参数统计十道题.docx
《非参数统计十道题.docx》由会员分享,可在线阅读,更多相关《非参数统计十道题.docx(28页珍藏版)》请在冰豆网上搜索。
非参数统计十道题
非参数统计----十道题
09统计学
王若曦
114
一、Wilcoxon符号秩检验
下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:
人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。
数据来源:
《非参数统计(第二版)》吴喜之
手算:
%
建立假设组:
编号
纯酒精数x
D=x-8
|D|
|D|的秩
D的符号
1
,
5
-
2
3
-
《
3
1
-
4
|
2
+
5
4
+
6
\
6
+
7
7
+
/
8
8
+
9
…
9
+
10
10
+
查表得P=<
=,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。
》
SPSS:
操作:
Analyze——NonparametricTests——2-RelatedSampleTest
Ranks
N
MeanRank
SumofRanks
c-x
|
NegativeRanks
7a
PositiveRanks
3b
、
Ties
0c
Total
10
a.c ] b.c>x c.c=x . TestStatisticsb c-x Z -1.886a Asymp.Sig.(2-tailed) .059 ExactSig.(2-tailed) ! .064 ExactSig.(1-tailed) .032 PointProbability .008 a.Basedonpositiveranks. b.WilcoxonSignedRanksTest 由输出结果可知,单侧精确显著性概率P=< =,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。 与手算结果相同。 R语言: … >x=c,,,,,,,,, >(x-8,alt="greater") Wilcoxonsignedranktest data: x-8 V=46,p-value= alternativehypothesis: truelocationisgreaterthan0 由输出结果可知,P=< =,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。 与以上结果一致。 | 二、Mann-Whitney-Wilcoxon检验 下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。 检验亚洲国家和欧美国家的人均国民收入是否有显著差异( =)。 亚洲国家 人均国民收入(美元) 欧美国家 人均国民收入(美元) 中国 1740 美国 ( 43740 日本 38980 加拿大 32600 印度尼西亚 1280 德国 34580 马来西亚 " 4960 英国 37600 泰国 2750 法国 34810 新加坡 27490 意大利 { 30010 韩国 15830 墨西哥 7310 印度 720 巴西 3460 数据来源: 《统计学(第三版)》贾俊平 @ 手算: 设亚洲国家为X,欧美国家为Y 建立假设组: 数值 秩 组别 数值 秩 组别 — 720 1 X 27490 9 X 1280 2 X 30010 ? 10 Y 1740 3 X 32600 11 Y 2750 4 * X 34580 12 Y 3460 5 Y 34810 13 Y ; 4960 6 X 37600 14 Y 7310 7 Y 38980 、 15 X 15830 8 X 43740 16 Y 查表得,Tx=48的右尾概率的2倍为*2=< =,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。 ( SPSS: 操作: Data——SortCases Analyze——NonparametricTests——2-IndependentSamples Ranks 分组 N MeanRank SumofRanks … 收入 亚洲国家 8 欧美国家 8 Total 16 TestStatisticsb 收入 Mann-WhitneyU ¥ WilcoxonW Z Asymp.Sig.(2-tailed) .036 ExactSig.[2*(1-tailedSig.)] .038a ExactSig.(2-tailed) ? .038 ExactSig.(1-tailed) .019 PointProbability .005 a.Notcorrectedforties. b.GroupingVariable: 分组 由输出结果可知,精确双尾概率P=< =,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。 与手算结果一致。 R语言: , >x<-c(1740,38980,1280,4960,2750,27490,15830,720) >y<-c(43740,32600,34580,37600,34810,30010,7310,3460) >(x,y,exact=F,cor=F) Wilcoxonranksumtest data: xandy W=12,p-value= alternativehypothesis: truelocationshiftisnotequalto0 。 由输出结果可知,P=< =,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。 与以上结果一致。 三、两样本的Kolmogorov-Smirnov检验 下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。 非洲 欧洲 @ % 数据来源: 《非参数统计(第二版)》吴喜之 手算: 建立假设组: 《 1 0 1 0 · 0 1 0 2 0 0 - 1 0 3 0 0 1 0 4 0 0 1 0 5 ? 0 0 1 0 6 0 ' 0 0 1 6 1 — 1 0 7 1 1 $ 0 8 1 0 1 8 . 2 1 0 9 2 | 1 0 10 2 > 1 0 11 2 1 ` 0 12 2 0 1 12 ¥ 3 0 1 12 4 、 0 1 12 5 ) 1 0 13 5 1 0 ¥ 1 13 6 1 0 1 13 | 7 1 0 1 13 8 1 、 0 1 13 9 1 # 0 1 13 10 1 0 — 1 13 11 1 0 1 13 > 12 1 0 1 13 13 1 % 1 0 查表得,当mnD=130时,双侧检验的概率P<,所以P< =,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。 SPSS: 操作: Analyze——NonparametricTests——2-IndependentSamples Frequencies 分组 ) N 消费量 非洲地区 13 欧洲地区 13 Total 26 。 TestStatisticsa 消费量 MostExtremeDifferences Absolute .769 Positive ~ .769 Negative .000 Kolmogorov-SmirnovZ Asymp.Sig.(2-tailed) .001 ExactSig.(2-tailed) .000 : PointProbability .000 a.GroupingVariable: 分组 由输出结果可知,双侧精确显著性概率P =,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。 与手算结果一致。 四、CochranQ检验 下面是某村村民对四个候选人(A,B,C,D)的赞同与否的调查(“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。 试分析4位候选人在村民眼中有没有区别( =)。 20个村民对A、B、C、D四个候选人的评价 ; N A 0 1 1 0 0 1 1 1 # 1 1 1 1 1 1 1 1 0 1 《 1 1 16 B 1 1 0 0 0 1 、 1 1 1 1 0 1 1 0 1 1 ) 0 0 0 0 11 C 0 1 1 1 ` 1 0 0 0 0 1 0 0 0 1 ( 1 0 1 0 1 0 9 D 0 0 — 0 0 1 1 0 0 1 0 0 0 $ 0 1 0 1 1 0 0 0 6 L … 1 3 2 1 2 3 2 2 3 3 : 1 2 2 3 3 3 2 1 2 1 … 42 数据来源: 《非参数统计(第二版)》吴喜之 手算: 建立假设组: 查表得 ,因此在5%的显著性水平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。 SPSS: 操作: Analyze——NonparametricTests——KRelatedSamples @ Frequencies Value 0 1 A 4 16 B @ 9 11 C 11 9 D 14 6 TestStatistics 。 N 20 Cochran'sQ df 3 Asymp.Sig. .025 ExactSig. .025 … PointProbability .006 a.0istreatedasasuccess. 由输出结果可知,Q=,精确的显著性概率P=< =,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。 与手算结果一致。 R语言: >x=("f: /") >n=apply(x,2,sum) >N=sum(n) >L=apply(x,1,sum) ) >k=dim(x)[2] >Q=(k*(k-1)*sum((n-mean(n))^2))/(k*N-sum(L^2)) >Q [1] >pvalue=pchisq(Q,k-1,low=F) >pvalue [1] 由输出结果可知,Q=,P=< =,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。 与以上结果一致。 五、\ 六、Friedman检验 一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。 三种方式为: 在商店内等待,在门口销售和当面表演炒制茶叶。 对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。 试问三种不同的销售方式是否有显著差异( =)。 销售方式 购买率(%) 商店内等待 20 25 29 18 17 ~ 22 18 20 门口销售 26 23 15 30 26 32 { 28 27 表演炒制 53 47 48 43 52 57 49 — 56 数据来源: 《非参数统计(第二版)》吴喜之 手算: 建立假设组: 三种方式购买率等级 销售方式 购买率 合计 商店内等待 《 1 2 2 1 1 1 1 1 10 门口销售 ~ 2 1 1 2 2 2 2 2 14 表演炒制 ~ 3 3 3 3 3 3 3 3 24 > 查表得 ,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。 SPSS: 操作: Analyze——NonparametricTests——KRelatedSamples Ranks MeanRank 商店内等待 门口销售 ! 表演炒制 TestStatisticsa N 8 Chi-Square df ! 2 Asymp.Sig. .002 ExactSig. .000 PointProbability .000 a.FriedmanTest 由输出结果可知, ,精确的显著性概率P<,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。 与手算结果一致。 ; R语言: >d=("f: /") >(d)) Friedmanranksumtest data: (d) Friedmanchi-squared=13,df=2,p-value= 由输出结果可知, ,P=< =,因此拒绝原假设,即认为三种销售方式有显著差异。 与以上结果一致。 % 七、K个样本的卡方检验 在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。 年龄段 商场1 商场2 商场3 总和 <30 83 ( 70 45 198 30—50 91 86 15 192 >50 41 ) 38 10 89 总和 215 194 70 479 数据来源: 《非参数统计》王星 手算: 建立假设组: 分组 | <30 83 70 45 198 ( 30—50 91 86 15 192 ' >50 41 38 10 89 】 合计 215 194 70 - 479 查表得 ,因为Q=> ,因此拒绝原假设,即认为人们去三个商场的概率不同。 $ SPSS: 操作: Data——WeightCases Analyze——DescriptiveStatistics——Crosstabs Chi-SquareTests Value df Asymp.Sig.(2-sided) ExactSig.(2-sided) ExactSig.(1-sided) * PointProbability PearsonChi-Square 18.651a 4 .001 .b LikelihoodRatio # 4 .001 .001 Fisher'sExactTest .001 & Linear-by-LinearAssociation 5.110c 1 .024 .026 .013 .003 NofValidCases # 479 a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis. b.Cannotbecomputedbecausethereisinsufficientmemory. ¥ c.Thestandardizedstatisticis. 由输出结果可知,卡方统计量为,精确双尾检验概率P=< =,因此拒绝原假设,即认为人们去三个商场的概率不同。 与手算结果一致。 八、Kruskal-Wallis检验 》 某制造商雇用了来自三个本地大学的雇员作为管理人员。 最近,公司的人事部门已经收集信息并考核了年度工作成绩。 从三个大学来的雇员中随机地抽取了三个独立样本。 制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。 雇员 大学A 大学B 大学C 1 25 60 50 2 ; 70 20 70 3 60 30 60 4 85 15 ) 80 5 95 40 90 6 90 35 70 7 ~ 80 75 数据来源: XX文库SAS讲义 手算: 建立假设组: 各雇员的成绩等级 雇员 大学A — 大学B 大学C 1 3 9 7 2 12 2 12 : 3 9 4 9 4 17 1 5 20 . 6 6 5 12 7 14 : 秩和 95 27 88 因为出现同分的情况,应对H进行校正,校正系数 查表得,在 的显著性水平上, =,由于H=> =,因此拒绝原假设,即三个总体的考核成绩分布不同。 SPSS: 操作: Analyze——NonparametricTests——KIndependentSamples Ranks | 分组 N MeanRank 成绩 大学A 7 大学B — 6 大学C 7 Total 20 ( TestStatisticsa,b 成绩 Chi-Square df 2 Asymp.Sig. .011 ! ExactSig. .006 PointProbability .000 a.KruskalWallisTest b.GroupingVariable: 分组 由输出结果可知,KW统计量为,精确概率为,远远小于显著性水平,因此拒绝原假设,即三个总体的考核成绩分布不同。 与手算结果一致。 九、列联表卡方检验 一种原料来自三个不同的地区,原料质量被分成三个不同等级。 从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。 ¥ 一级 二级 三级 合计 地区1 52 64 24 140 [ 地区2 60 59 52 171 地区3 50 65 74 189 & 合计 162 188 150 500 数据来源: XX文库统计学教程PPT 手算: 建立假设组: 地区 等级 1 1 52 1 ] 2 64 1 3 24 42 2 … 1 60 2 2 59 2 ; 3 52 3 1 50 3 【 2 65 3 3 74 合计 — 查表得, ,由于Q=> ,因此拒绝原假设,即认为地区与原料质量相关。 SPSS: 操作: Data——WeightCases Analyze——DescriptiveStatistics——Crosstabs ! 地区*等级Crosstabulation 等级 Total 一级 { 二级 三级 地区 地区1 Count 52 64 24 140 ExpectedCount 地区2 Count - 60 59 52 171 ExpectedCount — 地区3 Count 50 65 74 189 《 ExpectedCount Total Count 162 188 150 } 500 ExpectedCount Chi-SquareTests < Value df Asymp.Sig.(2-sided) ExactSig.(2-sided) ExactSig.(1-sided) PointProbability PearsonChi-Square 19.822a 4 .001 ? .b LikelihoodRatio 4 .000 .000 : Fisher'sExactTest .000 Linear-by-LinearAssociation 13.963c 1 ( .000 .000 .000 .000 NofValidCases 500 … a.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis. b.Cannotbecomputedbecausethereisinsufficientmemory. c.Thestandardizedstatisticis. , 由输出结果可知,检验统计量为,精确双尾显著性概率P远远小于显著性水平,因此拒绝原假设,即认为地区与原料质量相关。 与手算结果一致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 十道题