一致性检验.docx
- 文档编号:8193265
- 上传时间:2023-01-29
- 格式:DOCX
- 页数:25
- 大小:61.97KB
一致性检验.docx
《一致性检验.docx》由会员分享,可在线阅读,更多相关《一致性检验.docx(25页珍藏版)》请在冰豆网上搜索。
一致性检验
一致性检验
配对四格表的一致性检验Vo.312No.42100文章编号:
0443(000—36010—3721)408—2中图分类号:
R1;22131O1.文献标识码:
A・方法评介・配对四格表的一致性检验赵莹上海210)023(海中医药大学中药学院上摘要:
给出了一种对配对四格表进行一致性检验的检验方法。
关键词:
配对四格表;一致性;一致最优势检验di1.99.sn043.000.0o:
036/Ji.1043721.403s计数资料的配对设计常用于两种检验方法、断方法的诊比较,同一批病人以两种方法作检查或诊断,如同一批样品用上,致性非常好。
一两种方法做检测等,其特点是对样本中各观察单位分别用两种方法处理。
配对设计的计数资料的数据形式往往表示为配对四格表,表1示。
如所表2不同方法细菌检验结果表1配对设计的配对四格表这个例题若用Mcma检验,Ner<O0,.1得出阳性率不一致的结论。
之所以会出现这样的矛盾,那是因为McmrNea检验只考虑了检验结果不一致的两种情况(6和C本例的1,2和2,)而没有考虑样本含量和两法结果一致的两种情况(口和1检验方法d,例的11和11)本0107。
本文的方法可以用于对这种、、ab较大时配对四格表资料进行一致性检验。
从另一方面看,我们得到了不一致率p.5这样的结论,出现这种不一致<00即的情况只是一个小概率事件,以我们不能用Mcer所Nma检验去检验阳性率的一致性。
在对配对四格表资料的分析中,一个直观想法就是用一表示不一致率,1即一p一表示一致率。
我们知道,于给定的a单边假设检验问题HoP对,:
≥OH<存在一致最优势检验,的UMP":
S它T拒绝域为w3小结{≤r其中z为不一致的次数,z},我们可以直接计算检验的①本文的方法可以用于对配对四格表资料进行一致性检P值,=P{ ̄b}∑p(-p)。
若户a则拒绝px+c一1o…≤,=验。
原假设H0认为不一致率<,夕a,不拒绝原假设,若>则H0不能认为一致率p,<。
2例题②本文的方法可以用于检验配对四格表资料是否可用Mcma检验。
Ner例:
甲、用乙两法进行细菌检验,比较两法的检验效果,为将每份样品分成两份,分别用两种方法进行检验,到24得02个样品的检验结果,如表2所示,问两种检验方法的检验结果有无差别?
解:
:
≥O0U1pO0Hop.5"H:
<.5S=P{1}∑o001.5∞一O00≤4一4.5(一O0)2.0参考文献1茆诗松,王静龙,濮晓龙.高等数理统计.北京:
高等教育出版社,19,89817~129.2刘仁权.sSPS统计软件.北京:
中国中医药出版社,078 ̄8.20,123茆诗松,程依明,濮晓龙.概率论与数理统计教程.京:
北高等教育出版社,04393120,4 ̄5.p.1,a.1的水准单侧检验拒绝原假设H0不<O0以=00,一致率小于00,.5即两种检验方法的一致率达到了9以5收稿日期i000—821-40・386・教理医药学杂志文章编号:
0443(000—37010—3721)408—1中图分类号:
P2T33文献标识码:
B21年第2003卷第4期・方法评介・高级计算器四格表资料卡方检验的计算程序毕永文春艳康秀春,(陕西省子长县疾病预防控制中心子长770)130di1.99jin0443.000.0o:
036/.s.10-3721.404sCSOx10AIf-8P及同类功能计算器,使用比较普遍,笔者利用K寄存器输入变量,编制了卡方检验的计算程序,出值得后,可在KK、、寄存器分别读取、4、2为下一、2K6T、T,步的校正计算提供了条件,合理、简单、方便。
现介绍如下:
1公式11.一ZOT)/T(-6n48KiP1显示3.399显示3.58O(P)1MODE0INVPCLP1LN状态R程序存储器清零进入程序P区122程序.Kotl+Kot2+Kin6Kot3Ki+1+uun5KiunKot4Ki+2一Ki÷5Kot1Ki×5un一6KiunnunKot5Kin一12.一三OTI05(}--.)/T2写入程序1I/+Kotn一2NV1Z+KulI/NV1uKi6I/otNV1z21准备与计算.袭1两种类型胃溃疡内科疗法治疗结果[]+Kot2Ki一4NV1X—Ki3MRn一4Kot4unI/nKiuINVKi ̄3otnKu3(38步显示3.274199600)23退出.M0DE・~}DE72参M0DE・INVKAC考文献RUN状态K寄存器清零M寄存器清零输入校正系数输入变量1金丕焕,主编.医用统计方法.第1.上海:
版上海医科大学出版社,931919,5.INVM/n(:
.NMi令05IVn)令:
3Kn16i1n27Ki3n31Ki2徐泱,倪永斌,金正均.医学资料卡方检验的快速计算程序.上海第二医科大学学报,002(5:
5.20,00)493杜佐华.卡方检验的计算器编程运算.数理医药学杂志,95819,():
5.433CosseyTetohieuflbenitncsftePardForodTalZanhoYig(prmetfMahmainyishnhiUiesyoaioahnsdcn,DeatntetsadPhsc,SaganvrifTrdtnlCieeMeieoctiiSaga023hnhi210)AbtatThspprpoietootshossecftepieorodtbesrciaervdsamehdtettecnitnyohardfuflal.Kerspieorodtbeossecywodardfuflal ̄cnitny;uiomlotpweflnfrymsoruTEST收稿日期:
091~520—22*陕西省子长县中医院・37・8弹道一致性检验判据论文弹道一致性检验判据论文摘要:
在对弹道进行一致性检验过程中,若不考虑检验过程中散布的影响,就有可能在非正态分布检验过程汇总出现错误判断。
因此要想对弹药的弹道一致性做出正确的判断,需要从多个方面入手,从不同角度分析,综合判断之后才能做出最终是否满足弹道一致性的判断。
1检验判据来源分析在目前所用的一致性弹道检验准则中,若对两种散布密集度先沟通呢的两种武器系统进行检验,均采用T检验方式予以裁定。
但是在实际的研发过程中,这种假设很难实现,尤其对一些新跑单的配置上,即便是尽力将其弹道同老弹保持一致,但是由于使用的是旧的发射平台,新弹药无论在生产水平还是工艺上都有所提高和改进,在射击密集度上新弹都要具有一定的优势,这也是战绩指标要去的必然结果。
正因如此,在进行判断的过程中必须满足相应的建设条件,一次保证检验判据的正确,如若不然就会导致结果出现误差,从而对决策以及设计造成影响,为了避免资源的浪费,必须对判断依据进行严格的条件限制。
从检验判别式中可以分析出,若m=1,d0=0时,两个式子完全一致,所以可以将样本的均值差异检验作为弹道一致性检验的依据;对自由度进行调整以及对综合标准差进行计算时,根据T检验方法就能够得出标准弹道的检验判据。
所以,这种判据是间接应用了配对样本的均值差异检验。
但是无论是直接还是间接的应用,在建设条件的确定中需要考虑的内容包括以下几点:
(1)在检验中,配对样本值的差是不是能够看做为独立的随机变量,是不是服从正态分布。
(2)一致性检验中,配对样本相关性是否显著。
(3)对于检验功效,样本容量是否会对其造成影响。
(4)对于配对样本差值,需要判断各组的差值能否归属为统一正态总体。
(5)论证d0=0是否合理。
从独立样本均值的差值检验以及分组检验式检验中可以分析出,当m=1,d0=0时,两个式子相同,所以,在此基础上对一致性检验进行判断的依据可以直接应用独立样本的均值之差;当m≠1,d0=0,如果两样本各组来自同一样本总体,根据多组样本t检验原理,计算综合标准差和调整相应自由度,应用独立样本均值差异t检验法就可以得出弹道一致性分组检验多组情况下的检验判据。
因此,该情况下是独立样本均值差异t检验方法的间接应用。
不论是直接应用还是间接应用,对照独立样本均值差异t检验的假设条件,进行弹道一致性分组法检验需考虑以下几点:
(1)同一弹各组试验样本是否服从正态分布,且来自同一正态总体。
(2)两弹对应各组样本的独立性情况。
(3)样本容量对检验功效的影响。
(4)d0取值是否为零的论证。
2散布对现判据的影响分析某火炮系统配备的两种弹,分别为
(1)和
(2),某靶距Y方向上的3组弹道一致性配对试验数据(已经过标准化),每组各10发,试验数据如表1所示。
取置信水平α=5%,采用国家军用标准弹道一致性检验方法对该方向上的两弹进行弹道一致性分析。
计算分析结果如下:
表1某火炮系统配用的两弹弹道一致性试验数据因为所以根据对应的判定标准,第一组满足弹道一致性,其他两组均不满足弹道一致性。
从上面的计算结果我们发现,。
虽然第一组平均弹着点的距离是第二组与第三组的1.2743倍和1.2749倍,并且第一组的散布偏差分别是第二组与第三组的1.5227倍和1.6194倍,但判定结果是第一组满足弹道一致性,而第二组与第三组不满足弹道一致性。
由此可知弹道一致性检验结果受弹丸散布的影响较大,有时可能导致平均弹着点接近的试验数据其检验结果不满足弹道一致性,平均弹着点相对较远的试验数据其检验结果却满足弹道一致性,换而言之,提高了射击命中率,弹道一致性反而不满足,从射击理论角度考虑这是不合理的。
一方面弹道一致性检验判据不能充分反映实际射击效果的物理意义,故由一组试验数据计算结果判定弹道一致性是否满足一致性是片面的,如果三组中有一组不满足弹道一致性而判定不满足弹道一致性要求也试欠妥的;另一方面,应当综合考察并分析引起射击准确度和密集度的组之间差异显著性原因,或许检验不通过是由试验本身的误差因素造成的,故通过单纯的试验计算结果比较来确定是否满足弹道一致性是不客观的。
大量检验结果表明:
(1)在检验过程中两弹样本虽然服从正态分布,但是其均值之差有肯能不服从;而其样本值之差不符合正态分布特点是由于方差的差异所致,若是采用多组实验,情况更是如此;这两种情况同检验基本假设均不符合,不能够直接予以应用。
(2)同一弹种在不同组的检验中由于散布所引起的均值存在显著差异,因而同多组检验时的基本假设不符,所以使用多组检验的方式有可能出现判断失误。
3结束语由上述论述中可以得出,在对弹道进行一致性检验过程中,若不考虑检验过程中散布的影响,就有可能在非正态分布检验过程汇总出现错误判断。
因此要想对弹药的弹道一致性做出正确的判断,需要从多个方面入手,从不同角度分析,综合判断之后才能做出最终是否满足弹道一致性的判断。
参考文献[1]徐明友.弹道一致性试验准则中的问题[D].南京理工大学动力工程学院,2003.[2]吕延龙,游宁.平均弹道一致性试验评定方法研究[D].弹箭与制导学报,2002.[3]国防科工委军标出版发行部.GJB3197-98.炮弹试验方法[S].1998.[4]王中原,张领科.弹箭通用射表及弹道一致性检验方法[M].北京:
科学出版社,2008.[5]翁佩英,任国民,于骐.弹药靶场试验[M].北京:
兵器工业出版社,1995.无金标准条件下的诊断试验一致性检验・76・无金标准条件下的诊断试验一致性检验北京大学医学部生物数学教研窒(100083)安金兵曹波王强正确地评价诊断试验在临床上的作用对于现代医学有着重要的意义。
对诊断试验的分析评价通常都借助于灵敏度、特异度、预测值以及ROC曲线下的面积等指标进行评价1,2)。
不过,这些指标在实际应用中考虑到患病率是直接与诊断对象相联系的不可控的外部参数,而诊断试验的结果通常只有在给定诊断对象是否患病的条件下才有实际的意义,本文假定如下的条件独立性:
P(A±,B±ID±)=P(A±lD±)・P(B±lD±)(1)存在比较大的限制。
首先,上述指标的确定往往要求有金标准的参考。
而在实际中金标准往往很难获得,或者由于具有较大的创伤性等原因而不被接受。
针对这一问题,Joseph等人提出利用贝叶斯推断的方法来进行无金标准条件下的诊断试验评价3。
但这种方法在选择先验概率的类型以及设定先验分布所对应的参数时存在较强的主观性。
其次,这些指标的估计容易受到诸如患病率以及诊断对象的异质性等因素的影响,即使同一个诊断试验在推广到不同诊断对象时其结果也有可能存在较大的差异。
针对上述缺陷,本文主要以诊断试验的一致性检验问题为例,介绍在无金标准的条件下对诊断试验进行分析评价的一种新思路。
考虑到诊断试验在无金标准条件下信息不足的特点,本文并没有直接对患病率、灵敏度、特异度等参数的真值进行估计,而是借助于一致性假设来建立可求解的方程并获得在一致性假设成立的条件下特征参数的估计,进而得到检验统计量。
统计方法为方便起见,本文将诊断对象是否患病分别用D+或D一来表示,对于某诊断试验的检测结果则分另一方面,由于灵敏度和特异度等特征参数体现了诊断试验的内在特征,与诊断对象的患病情况无关,从而基于灵敏度和特异度对诊断试验所做的分析评价也将更为可靠,所以本文针对两种诊断试验的一致性检验问题给出了如下的判决条件:
fP(A+ID+)=P(B+|D+)P(A一1D一)=P(B—ID一),、、’进而将两种诊断试验的一致性检验表述为如下的假设检验问题:
心:
诊断试验A与诊断试验B的诊断结果是一致的,即有(2)式成立。
H,:
诊断试验A与诊断试验B的诊断结果是不一致的。
首先,在原假设成立的条件下,当两种诊断得出的结论不一致时,诊断试验A以及B将各有1/2的概率做出错误的判断;反之,则要么同时正确判断,要么同时错误判断。
从而,利用条件独立性假设(1),诊断试验A及B的误判数目近似成立如下的两个多项式:
fN[P(A+ID一)p(D一)]:
(6+。
)/2+NP(A+ID一)2P(D一)孽哩翌考曼然孽氅仑.夸曼曼字翼慧量粤譬为黑Nt别用+和一来表示。
那么,(A+,B+ID+)就表示某性,其他的符号有类似的含义。
现假设,对诊断试验A以—————__墨三』苎型兰粪≥壁皇型壁墨————一B进行配婴验:
黧篓黧委黧擎l。
以得;磊;晶磊苯釜耘衾≤妄i~一’。
糍锚高警鼎套式的近似计算公式,可.1N[PCA_fD+)p(D+)]:
(6+。
)/2+(3)。
j‘。
‘Chin—e—se——Journal—o—fHealthStatistic...s.....,.Feb2—0—07,Vo—l—.2—4—,No.—1—.fp(A+ID+)=(4a+b-I-C)/(4口+26+2c)统计量则从总体上有较强的稳健性,并不随患病率和诊断参数的改变而有很大的改变。
<p(A—ID一)=(4d+b+c)/(4d+2b+2c)p(D+)=(2a+b+C)/(2N)(6)由上述几个估计式,利用条件独立性假设(1)和全概率公式,不难给出在原假设成立条件下各个元素的期望的估计值。
那么,类似于通常的列联表卡方检验,可定义如下的统计量:
zz=蒌2,2i.{=1}≯一tj(7)并且,当原假设成立时,也即(2)式成立时,x2近似服从参数为1的卡方分布。
数据模拟这部分主要通过几个模拟过程来说明随着患病率以及诊断试验参数的改变,本方法的检验效果有何变化。
为说明其合理性,还将其与通常的Kappa统计量(4,5J以及McNemar统计量6]的检验结果进行比较,模拟结果通过图表的形式给出。
由于诊断试验的性能通常由灵敏度和特异度两个参数来表征,本文定义了如下的指标Delta用以度量两种诊断试验之间的距离,也即两者的一致性程度:
Delta=f图1当样本量为100时三个统计量的比较P(A+ID+)一P(B+ID+)I+IP(A—JD一)一P(B—lD一)I显然,合理的检验统计量应该对于较小的Delta给出较大的P值,而对于较大的Delta给出较小的P值。
在模拟过程中,样本总量N分别取为100和200,Delta分别取0.05,0.1,0.3及0.5,患病率的取值等间距地从0.1取到0.9共20个数值。
对于Delta的每一个取值,再模拟生成k=20组不同的参数,每组参数均包括诊断试验A,B的灵敏度和特异度共4个参数。
然后,对于每组参数分别模拟生成如表1所示的列联表数据并计算上述几个统计量的P值。
最后,对所得的三种统计量的k个P值分别求平均值并标示于图中。
图1,2中,横坐标表示患病率,纵坐标分别表示本文介绍的检验统计量(用*表示)、McNemar统计量(用☆表示)、Kappa统计量(用+表示)的P值的平均。
由上述图示可以看出,随着Delta的增大,三个统计量的P值总体上逐步减小;而随着样本量N的增大,P值总体上也逐步减小。
这说明上述几个统计量都有其合理性,均为可选的方法。
但是,这三个统计量中,McNemar统计量的跳跃性较大,尤其是当Delta较大时,依然有可能给出较大的P值;Kappa统计量则图2当样本量为200时三个统计量的比较讨论首先,在临床诊断试验中,由于检测阳性率及检测阴性率等指标与诊断人群的患病率有直接的关系,其独立性通常是无法满足的,因此,在进行临床诊断试验的分析评价时,如(1)式所示的条件独立性假定应该有一般的意义。
其次,对于无金标准条件下诊断试验的分析评价,一般的方法都要求尽可能准确地估计灵敏度、特异度以及患病率等参数值。
但是,由于无金标准条件下诊断试验并无确定的参照标准,通常情况下都无法建立类似于(3)式的方程来求解参数;采用贝叶斯方法进行估计又面临选择先验分布的困难。
本文则摆脱了这一习惯性思维,并不对这些参数的真值进行估计,而是根据如(2)式所示的原假设命题建立相应的方程来获取这些参数在原假设成立条件下的估计,最后再进行假设检验。
既然参数的估计值仅是原假设成立条件下方程的解,那自然不要求参数的估计值尽可能地接近参数真值,这使得在不借助于先验知识的前提下对这些诊断试验参数的估计成为可能,大大降低了分析的难度。
对于患病率的极端取值比较敏感,当患病率非常小或者非常大时总倾向于给出较小的P值;而本文的检验・78・生垦里生缠盐2鲤Z生2屋筮丝鲞星!
塑最后,由于(6)式昕示的估计量是在原假设成立条件下方程的解,只要两个诊断非常接近时参数估计就越接近于真值,从而卡方统计量的P值也就越小,反之P值就越大。
因此,正如图中所示,本文所介绍的检验统计量对于诊断参数以及患病率的改变是比较稳健的。
至于McNemar统计量则可以从期望的角度近似表示成如下的形式:
异性。
类似地,Kappa统计量的最主要部分也可以近似表示成如下的表达式:
OJA・COB・P(D+)・[1一P(D+)]。
其中,∞A,60B分别是与诊断试验A以及B的灵敏度和特异度有关的常数,且一般不为0。
那么,由此可以看出,当患病率很大或者很小时,Kappa统计量的值总会很小,这就说明了Kappa统计量为什么容易受到患病率极端取值的影响。
参考文献1.Knottneruszz=等竿≈.,[P(A+,B一)一P(A一,B+)]2P(A+,B一)+P(A一,B+)其中,P(A+,B一)一P(A一,B+)可以化简为:
JA’WeeI2.SackettVC,Murisjw.Evaluationofdiagnosticproce—dures.BMJ,2002,324:
477—480.DL,HaynesRB.Thearchitectureofdiagnosticresearch.BlVU,[P(A+lD+)一P(B+ID+)]P(D+)一[P(A—ID一)一P(B—lD一)]P(D一)可以看出,当患病率接近0.5时,即使Delta很大,由于上述两部分的差运算,McNemar统计量的值也有可能很小,从而也会有较大的P值;而当患病率很大或者很小时,仅有一项起主要作用,从而Delta比较大时McNemar统计量的值也会较大,反之较小。
这就解释了为什么图中McNemar统计量会有较大的变2002,324:
39—541.3.JosephL,GyorkosTW,CoupalL.Bayesianestimationofdiseaseapreva—start—lenceandtheParametersofdiagnosticdard.AmericanJournalof4.CohentestsintheabsenceofgoldEpidemiology,1995,141(3):
263—272.Bul—J.Acoefficientofagreementfo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一致性 检验