卡方检验.docx
- 文档编号:6581424
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:12
- 大小:84.51KB
卡方检验.docx
《卡方检验.docx》由会员分享,可在线阅读,更多相关《卡方检验.docx(12页珍藏版)》请在冰豆网上搜索。
卡方检验
第九章
检验
[教学要求]
掌握:
单个样本分布的拟合优度检验;独立样本2×2列联表资料的2检验;独立样本R×C列联表资料的2检验;配对2×2列联表资料的2检验。
熟悉:
配对R×R列联表资料的2检验;四格表资料的Fisher确切概率法。
了解:
连续型随机变量的2分布;分类数据2检验的基本思想。
[重点难点]
第一节
分布和拟合优度检验
一、2分布
基本概念:
2分布是一种连续型随机变量的概率分布,如果
是v个相互独立的标准正态分布随机变量,则
的分布称为服从自由度为
的2分布。
分布的概率密度曲线的形状依赖于自由度
的大小。
二、拟合优度2检验的基本思想
拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理论分布。
值反映了样本实际频率分布与理论分布的符合程度。
三、2检验的基本公式
大样本时检验统计量
近似地服从2分布,自由度为
=k-1-(计算Ti时利用样本资料估计的参数个数)
其中,Ai和Ti分别为实际观察频数和
成立时的理论频数,k为频数分布的类别总数。
四、拟合优度2检验注意事项
1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。
2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为
第二节独立样本2×2列联表资料的2检验
一、2×2列联表资料2检验目的
两独立样本率差异的比较。
即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。
二、统计量计算公式
可直接使用2检验基本公式也可使用等价的专用公式或校正公式。
专用公式
校正公式
自由度
=1。
三、2×2列联表资料2检验的注意事项
1.使用专用公式要求:
n不小于40,T不小于5;
2.在n≥40时,如果有某个格子出现1≤T<5,需用校正公式;
3.当n<40或T<1时,用Fisher确切概率法检验。
第三节独立样本R×C列联表资料的2检验
一、R×C列联表资料2检验目的
1.多个独立样本率的比较:
根据R个独立样本的频率分布,检验R个二项分布总体的概率是否相同。
2.多个独立样本频率分布的比较:
根据R个独立样本的频率分布,检验R个总体分布是否相同。
二、统计量计算公式
自由度
=(R-1)(C-1)
三、R×C列联表资料2检验的注意事项
1.对于多个率或频率分布比较的2检验,结论为拒绝
时,仅表示多组之间有差别,并不是任2组之间都有差别。
若要明确哪两组间不同,还需进一步作多组间的两两比较;
2.R×C列联表2检验要求理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1;
3.2检验不适用于有序分类资料的比较分析。
第四节配对设计资料的2检验
一、配对2×2列联表资料的2检验
1.配对2×2列联表资料2检验目的:
通过配对设计的两样本资料来推断两方法的阳性概率有无差别。
2.统计量计算公式
当
时,
=1
当
时,需对公式进行校正,校正公式为
二、配对R×R列联表资料的2检验
1.配对R×R列联表资料2检验目的:
通过样本资料来推断两个变量的总体概率分布是否相同。
2.统计量计算公式
自由度
=
。
第五节2×2列联表资料的确切概率法
(一)当2×2列联表资料出现以下情况时,需用确切概率法直接计算概率以作判断:
①样本含量n<40;
②理论频数T<1;
③2检验后所得概率P接近检验水准。
(二)确切概率计算法的基本思想和步骤
1.在四格表边缘合计固定不变的条件下,计算表内4个实际频数变动时的各种组合的概率Pi
式中a、b、c、d为四格表中的四个频数,n为总例数,其和
。
2.按检验假设计算单侧或双侧的累计概率P。
3.把P值与检验水准比较,做出是否拒绝H0的结论。
第七节案例讨论
案例9-1某地对区级医院2001~2002年医疗质量进行总体评价与比较,按分层抽样方法抽取两年内某病患者1250例,2001和2002两年间患者年龄构成与病情的差别没有统计学意义,评价的三项指标分别为疗效、住院日、费用。
规定很好、好、一般、差的标准见表9-14,病人医疗质量各等级频数分布见表9-15。
表9-14很好、好、一般、差的标准
指标
很好
好
一般
差
疗效
治愈
显效
好转
无效
住院日
≤15
16~20
21~25
>25
费用(元)
≤1400
1400~1800
1800~2200
>2200
表9-15两年病人按医疗质量等级的频数分配表
指标
年份
很好
好
一般
差
疗效
01年
02年
160
170
380
410
20
10
40
60
住院日
01年
02年
180
200
250
310
130
120
40
20
费用
01年
02年
130
110
270
320
130
120
70
100
用
检验分别对疗效、住院日、费用三项指标的分布做两年之间的比较,结果为
疗效
=6.786
0.079
住院日
=12.568
0.006
费用
=9.613
0.020
故不能认为两年的疗效不同;而两年的住院日和费用的差别均有统计学意义。
根据调查所得平均住院日和平均费用可以认为平均住院日2001年比2002年长,而费用2001年低于2002年。
请讨论以上检验方法是否正确?
如果不正确,问题出在什么地方?
案例9-2某研究对140名乙型肝炎患者和HBsAg携带者的唾液中乙肝病毒的前S1抗原与HBsAg、HBeAg和前S2抗原检出率进行差别分析,见表9-16。
表9-16唾液中乙肝病毒的前S1抗原与HBsAg、HBeAg和前S2抗原的关系比较
指标
前S1
2
P
+
-
HBsAg
+
31
55
53.02
<0.005
-
0
54
HBeAg
+
20
3
4.57
<0.050
-
11
106
前S2
+
21
2
5.33
<0.050
-
10
107
其中,前S1抗原与HBsAg比较:
前S1抗原与HBeAg比较:
前S1抗原与前S2抗原比较:
以上三个2值对应的P值见表9-16,请讨论以上检验方法是否正确?
[案例讨论参考答案]
案例9-1原检验方法不正确。
该例疗效、住院日、费用均按规定划分为很好、好、一般、差四个等级,根据要求比较两年各指标的总体差异,如果用
检验只能推断每个指标两年不同等级的频率分布是否有差别,而频率分布有差别不能代表两年该指标的总体水平有差别。
案例9-2原检验方法不正确。
1.前S1抗原与HBsAg比较:
因为b+c=55>40,可不校正,但原方法却进行了校正。
不校正时2值为55,P<0.005。
2.前S1抗原与HBeAg比较:
因为b+c=14<40,一定要校正,但原方法却没有校正。
校正后2值为3.5,P>0.05,校正后得出的结论与原方法得出的结论相反。
3.前S1抗原与前S2抗原比较:
因为b+c=12<40,一定要校正,但原方法却没有校正。
校正后2值为4.08,P<0.05。
思考与练习
一、简答题
1.简述本章2检验的用途。
2.比较两个独立样本频率分布的2检验,和比较两个配对样本频率分布的2检验在设计方法、资料整理、假设检验等方面的差别是什么?
3.如果实验效应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用2检验?
试举例说明。
4.为什么有些四格表(或R×C表)必须要计算确切概率?
二、分析与计算题
1.某医院收治186例重症乙型脑炎患者,随机分成两组,分别用同样的方剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表9-17所示。
表9-17加人工牛黄治疗乙型脑炎效果
疗法
治疗效果
合计
治愈
未愈
不加人工牛黄
26
45
71
加人工牛黄
68
47
115
合计
94
92
186
问加人工牛黄是否增加该方剂的疗效?
2.某研究人员观察了其他基本情况相似的60岁以上老人126名,其中患冠心病的52名,未患冠心病的74名,询问他们食盐的情况,其结果见表9-18。
表9-18冠心病患病与食盐情况
冠心病
食盐情况
合计
超标
未超标
有
36
16
52
无
42
32
74
合计
78
48
126
问患冠心病和未患冠心病的老人食盐超标的概率是否不同?
3.为比较三种方剂治疗胃溃疡的效果,将200名病情类似的患者随机分到三个治疗组,疗效见表9-19,分析三个方剂的治疗效果有无差别?
表9-19三种方剂治疗胃溃疡的效果
治疗方法
治疗效果
合计
有效
无效
甲方剂
42
18
60
乙方剂
38
27
65
丙方剂
56
19
75
合计
136
64
200
4.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表9-20。
问两组肝波型的差异有无统计学意义?
表9-20急性黄疸型肝炎与正常人的超声波波形
组别
波型
合计
正常
可疑
较密
黄疸型肝炎组
12
43
232
287
正常人组
277
39
11
327
合计
289
82
243
614
5.某研究人员随机抽查110名早期乳腺癌患者,同时用甲乙两种简易方法对各位患者进行检查,将检查结果整理成表9-21的形式。
问这两种简易方法对早期乳腺癌的检出概率有无差别?
表9-21甲乙两种方法检查乳腺癌患者的情况
甲方法
乙方法
合计
检出
未检出
检出
未检出
42
30
8
30
50
60
合计
72
38
110
6.配对比较两种方法治疗扁平足的疗效,100对患者的疗效记录见表9-23,问两种方法的概率分布有无差异?
表9-23两种方法治疗扁平足的疗效
甲法治疗结果
乙法治疗结果
合计
好
中
差
好
39
3
2
44
中
0
24
8
32
差
3
4
17
24
合计
42
31
27
100(固定值)
[思考与练习参考答案]
一、简答题
1.
检验常用于分类变量资料的统计推断。
主要包括单样本的拟合优度检验;推断两个和多个独立样本率或独立样本频率分布之间有无差别;分析配对设计下得到的两个样本频率分布有无差异。
2.前面针对的是“两独立样本”,行合计是事先固定的;而后者实质上是一组样本,即使可以看成两个样本,也是“两个互不独立的样本”,样本含量都是
,是固定的,而行合计与列合计却是事先不确定的。
前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。
检验统计量,前者用教材中公式(9-5)和(9-7),而后者用公式(9-9)和(9-10)。
3.关键在于此时
检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。
4.因为只有在大样本时检验统计量
才近似地服从2分布,样本含量不够大时,如果
40,且
1尚可以校正;如果样本含量更小,2检验就不适用了,只能计算确切概率。
二、分析与计算题
1.属于独立样本2×2列联表资料的2检验问题,用基本公式或四格表专用公式。
2=8.899,
0.005,加人工牛黄可以增加该方剂的疗效。
2.属于独立样本2×2列联表资料的2检验问题,用基本公式或四格表专用公式。
2=2.015,
0.10,不能认为患冠心病和未患冠心病的老人食盐超标的概率不同。
3.属于独立样本R
C列联表资料的2检验。
2=4.36,v=2,
0.05,不能认为三个方剂的治疗效果有差异。
4.属于独立样本R
C列联表资料的2检验。
用R
C表2检验公式算得2=443.456,v=2,P<0.005,在=0.05水平上拒绝H0,两组肝波型的差异有统计学意义。
5.属于配对2×2列联表资料的2检验,b+c<4,需用校正公式。
2=11.61P<0.005,可以认为两种方法对乳腺癌的检出概率有差别,乙法检出率高。
6.属于配对R×R列联表资料的2检验。
用公式(9-13)进行差异性分析。
算得T=0.73,v=4,
,在=0.05水平上不拒绝H0,差异无统计学意义,不能认为两种方法治疗结果的概率分布不相同。
[补充练习题]
A1型选择题:
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.下列不能用2检验的是。
A.多个均数比较B.多个率比较C.多个构成比比较
D.单样本分布的拟合优度检验E.两个频率分布的比较
2.以下关于2检验的自由度的说法,正确的是。
A.拟合优度检验时,
(n为观察频数的个数)
B.对一个3×4表进行检验时,
C.对四格表检验时,=4
D.若
,则
E.样本含量减1
3.2值的取值范围是。
A.
B.
C.
D.
E.
4.三个样本频率比较,
,可以认为。
A.各总体频率不等或不全相等B.各总体频率均不相等
C.各样本频率均不相等D.各样本频率不等或不全相等
E.各总体频率相等
[补充练习题参考答案]
1.A2.D3.C4.A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验