卡方检验Word下载.docx
- 文档编号:19595179
- 上传时间:2023-01-08
- 格式:DOCX
- 页数:12
- 大小:84.51KB
卡方检验Word下载.docx
《卡方检验Word下载.docx》由会员分享,可在线阅读,更多相关《卡方检验Word下载.docx(12页珍藏版)》请在冰豆网上搜索。
四、拟合优度2检验注意事项
1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。
2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为
第二节独立样本2×
2列联表资料的2检验
一、2×
2列联表资料2检验目的
两独立样本率差异的比较。
即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。
二、统计量计算公式
可直接使用2检验基本公式也可使用等价的专用公式或校正公式。
专用公式
校正公式
自由度
=1。
三、2×
2列联表资料2检验的注意事项
1.使用专用公式要求:
n不小于40,T不小于5;
2.在n≥40时,如果有某个格子出现1≤T<
5,需用校正公式;
3.当n<40或T<1时,用Fisher确切概率法检验。
第三节独立样本R×
C列联表资料的2检验
一、R×
C列联表资料2检验目的
1.多个独立样本率的比较:
根据R个独立样本的频率分布,检验R个二项分布总体的概率是否相同。
2.多个独立样本频率分布的比较:
根据R个独立样本的频率分布,检验R个总体分布是否相同。
自由度
=(R-1)(C-1)
三、R×
C列联表资料2检验的注意事项
1.对于多个率或频率分布比较的2检验,结论为拒绝
时,仅表示多组之间有差别,并不是任2组之间都有差别。
若要明确哪两组间不同,还需进一步作多组间的两两比较;
2.R×
C列联表2检验要求理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1;
3.2检验不适用于有序分类资料的比较分析。
第四节配对设计资料的2检验
一、配对2×
1.配对2×
2列联表资料2检验目的:
通过配对设计的两样本资料来推断两方法的阳性概率有无差别。
2.统计量计算公式
当
时,
=1
时,需对公式进行校正,校正公式为
二、配对R×
R列联表资料的2检验
1.配对R×
R列联表资料2检验目的:
通过样本资料来推断两个变量的总体概率分布是否相同。
=
。
第五节2×
2列联表资料的确切概率法
(一)当2×
2列联表资料出现以下情况时,需用确切概率法直接计算概率以作判断:
①样本含量n<
40;
②理论频数T<
1;
③2检验后所得概率P接近检验水准。
(二)确切概率计算法的基本思想和步骤
1.在四格表边缘合计固定不变的条件下,计算表内4个实际频数变动时的各种组合的概率Pi
式中a、b、c、d为四格表中的四个频数,n为总例数,其和
2.按检验假设计算单侧或双侧的累计概率P。
3.把P值与检验水准比较,做出是否拒绝H0的结论。
第七节案例讨论
案例9-1某地对区级医院2001~2002年医疗质量进行总体评价与比较,按分层抽样方法抽取两年内某病患者1250例,2001和2002两年间患者年龄构成与病情的差别没有统计学意义,评价的三项指标分别为疗效、住院日、费用。
规定很好、好、一般、差的标准见表9-14,病人医疗质量各等级频数分布见表9-15。
表9-14很好、好、一般、差的标准
指标
很好
好
一般
差
疗效
治愈
显效
好转
无效
住院日
≤15
16~20
21~25
>
25
费用(元)
≤1400
1400~1800
1800~2200
2200
表9-15两年病人按医疗质量等级的频数分配表
年份
01年
02年
160
170
380
410
20
10
40
60
180
200
250
310
130
120
费用
110
270
320
70
100
用
检验分别对疗效、住院日、费用三项指标的分布做两年之间的比较,结果为
疗效
=6.786
0.079
住院日
=12.568
0.006
费用
=9.613
0.020
故不能认为两年的疗效不同;
而两年的住院日和费用的差别均有统计学意义。
根据调查所得平均住院日和平均费用可以认为平均住院日2001年比2002年长,而费用2001年低于2002年。
请讨论以上检验方法是否正确?
如果不正确,问题出在什么地方?
案例9-2某研究对140名乙型肝炎患者和HBsAg携带者的唾液中乙肝病毒的前S1抗原与HBsAg、HBeAg和前S2抗原检出率进行差别分析,见表9-16。
表9-16唾液中乙肝病毒的前S1抗原与HBsAg、HBeAg和前S2抗原的关系比较
前S1
2
P
+
-
HBsAg
31
55
53.02
<
0.005
0
54
HBeAg
20
3
4.57
0.050
11
106
前S2
21
2
5.33
10
107
其中,前S1抗原与HBsAg比较:
前S1抗原与HBeAg比较:
前S1抗原与前S2抗原比较:
以上三个2值对应的P值见表9-16,请讨论以上检验方法是否正确?
[案例讨论参考答案]
案例9-1原检验方法不正确。
该例疗效、住院日、费用均按规定划分为很好、好、一般、差四个等级,根据要求比较两年各指标的总体差异,如果用
检验只能推断每个指标两年不同等级的频率分布是否有差别,而频率分布有差别不能代表两年该指标的总体水平有差别。
案例9-2原检验方法不正确。
1.前S1抗原与HBsAg比较:
因为b+c=55>
40,可不校正,但原方法却进行了校正。
不校正时2值为55,P<
0.005。
2.前S1抗原与HBeAg比较:
因为b+c=14<
40,一定要校正,但原方法却没有校正。
校正后2值为3.5,P>
0.05,校正后得出的结论与原方法得出的结论相反。
3.前S1抗原与前S2抗原比较:
因为b+c=12<
校正后2值为4.08,P<
0.05。
思考与练习
一、简答题
1.简述本章2检验的用途。
2.比较两个独立样本频率分布的2检验,和比较两个配对样本频率分布的2检验在设计方法、资料整理、假设检验等方面的差别是什么?
3.如果实验效应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用2检验?
试举例说明。
4.为什么有些四格表(或R×
C表)必须要计算确切概率?
二、分析与计算题
1.某医院收治186例重症乙型脑炎患者,随机分成两组,分别用同样的方剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表9-17所示。
表9-17加人工牛黄治疗乙型脑炎效果
疗法
治疗效果
合计
未愈
不加人工牛黄
26
45
71
加人工牛黄
68
47
115
94
92
186
问加人工牛黄是否增加该方剂的疗效?
2.某研究人员观察了其他基本情况相似的60岁以上老人126名,其中患冠心病的52名,未患冠心病的74名,询问他们食盐的情况,其结果见表9-18。
表9-18冠心病患病与食盐情况
冠心病
食盐情况
超标
未超标
有
36
16
52
无
42
32
74
78
48
126
问患冠心病和未患冠心病的老人食盐超标的概率是否不同?
3.为比较三种方剂治疗胃溃疡的效果,将200名病情类似的患者随机分到三个治疗组,疗效见表9-19,分析三个方剂的治疗效果有无差别?
表9-19三种方剂治疗胃溃疡的效果
治疗方法
有效
甲方剂
18
60
乙方剂
38
27
65
丙方剂
56
19
75
合计
136
64
4.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表9-20。
问两组肝波型的差异有无统计学意义?
表9-20急性黄疸型肝炎与正常人的超声波波形
组别
波型
正常
可疑
较密
黄疸型肝炎组
12
43
232
287
正常人组
277
39
11
327
289
82
243
614
5.某研究人员随机抽查110名早期乳腺癌患者,同时用甲乙两种简易方法对各位患者进行检查,将检查结果整理成表9-21的形式。
问这两种简易方法对早期乳腺癌的检出概率有无差别?
表9-21甲乙两种方法检查乳腺癌患者的情况
甲方法
乙方法
检出
未检出
检出
30
8
50
72
6.配对比较两种方法治疗扁平足的疗效,100对患者的疗效记录见表9-23,问两种方法的概率分布有无差异?
表9-23两种方法治疗扁平足的疗效
甲法治疗结果
乙法治疗结果
中
44
24
8
4
17
100(固定值)
[思考与练习参考答案]
1.
检验常用于分类变量资料的统计推断。
主要包括单样本的拟合优度检验;
推断两个和多个独立样本率或独立样本频率分布之间有无差别;
分析配对设计下得到的两个样本频率分布有无差异。
2.前面针对的是“两独立样本”,行合计是事先固定的;
而后者实质上是一组样本,即使可以看成两个样本,也是“两个互不独立的样本”,样本含量都是
,是固定的,而行合计与列合计却是事先不确定的。
前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。
检验统计量,前者用教材中公式(9-5)和(9-7),而后者用公式(9-9)和(9-10)。
3.关键在于此时
检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。
4.因为只有在大样本时检验统计量
才近似地服从2分布,样本含量不够大时,如果
40,且
1尚可以校正;
如果样本含量更小,2检验就不适用了,只能计算确切概率。
1.属于独立样本2×
2列联表资料的2检验问题,用基本公式或四格表专用公式。
2=8.899,
0.005,加人工牛黄可以增加该方剂的疗效。
2.属于独立样本2×
2=2.015,
0.10,不能认为患冠心病和未患冠心病的老人食盐超标的概率不同。
3.属于独立样本R
C列联表资料的2检验。
2=4.36,v=2,
0.05,不能认为三个方剂的治疗效果有差异。
4.属于独立样本R
用R
C表2检验公式算得2=443.456,v=2,P<
0.005,在=0.05水平上拒绝H0,两组肝波型的差异有统计学意义。
5.属于配对2×
2列联表资料的2检验,b+c<
4,需用校正公式。
2=11.61P<
0.005,可以认为两种方法对乳腺癌的检出概率有差别,乙法检出率高。
6.属于配对R×
R列联表资料的2检验。
用公式(9-13)进行差异性分析。
算得T=0.73,v=4,
,在=0.05水平上不拒绝H0,差异无统计学意义,不能认为两种方法治疗结果的概率分布不相同。
[补充练习题]
A1型选择题:
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.下列不能用2检验的是。
A.多个均数比较B.多个率比较C.多个构成比比较
D.单样本分布的拟合优度检验E.两个频率分布的比较
2.以下关于2检验的自由度的说法,正确的是。
A.拟合优度检验时,
(n为观察频数的个数)
B.对一个3×
4表进行检验时,
C.对四格表检验时,=4
D.若
,则
E.样本含量减1
3.2值的取值范围是。
A.
B.
C.
D.
E.
4.三个样本频率比较,
,可以认为。
A.各总体频率不等或不全相等B.各总体频率均不相等
C.各样本频率均不相等D.各样本频率不等或不全相等
E.各总体频率相等
[补充练习题参考答案]
1.A2.D3.C4.A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验