Logrank检验所需样本量的测定迭代非中心法.docx
- 文档编号:4789943
- 上传时间:2022-12-09
- 格式:DOCX
- 页数:5
- 大小:21.16KB
Logrank检验所需样本量的测定迭代非中心法.docx
《Logrank检验所需样本量的测定迭代非中心法.docx》由会员分享,可在线阅读,更多相关《Logrank检验所需样本量的测定迭代非中心法.docx(5页珍藏版)》请在冰豆网上搜索。
Logrank检验所需样本量的测定迭代非中心法
Logrank检验所需样本量的测定:
迭代非中心法
【摘要】 目的:
提出一种迭代非中心法,用于Logrank检验所需样本量的测定,并同LachinFoukes法进行了比较。
方法:
预置样本量重复抽样,计算Logrank检验统计量及其平均值。
调整预置样本量重复操作,当该平均值充分逼近预定非中心参数时,最后预置样本量被看成是所需样本量。
结果:
该法所得样本量因生存分布而异,可满足Logrank检验预定功效。
相比之下,LachinFoukes法所得样本量偏小,用于Logrank检验功效不足。
结论:
迭代非中心法优于LachinFoukes法,可用于慢性病和癌症生存研究的设计。
【关键词】终检 Logrank检验;MonteCarlo方法 非中心法 样本量
TheSampleSizeDeterminationinLogRankTest:
theIterativeNonCentralProcedure
AbstractObjective:
ThispaperproposesaniterativenoncentralprocedureforthesamplesizedeterminationinlogranktestandcomparesitwiththeLachinFoulkesprocedure.Methods:
Samplingsareperformedwithaprescribedsize.Thestatisticsoflogranktestandtheiraveragearecalculated.Suchacourseisrepeatedwithadjustedsamplesizes.Whentheaverageisconvergedtotheinterestedvalueofnoncentralparameter,thelastadjustedsamplesizeisregardedastherequiredone.Results:
Thesamplesizesdeterminedbythisprocedurevaryfromdistributiontodistributionandaremetwiththeprescribedpoweroflogranktest.Bycontrast,thesamplesizesfromLachinFoulkesprocedurearebiasedtosmallandunabletomeetwiththepower.Conclusion:
TheiterativenoncentralprocedureissuperiortotheLachinFoullesprocedureandcanbeappliedinplanningsurvivalstudiesonchronicdiseasesandcancer.
Keywordscensorship;Logranktest;montecarlomethod;noncentralproceduresamplesize
众所周知,生存研究所需样本量的测定应以Logrank检验[1]为基础,该检验是生存数据组间比较的标准方法。
多年来,人们针对这一目标进行了不懈努力,然而始终未能实现,这是由于该检验是一种非参数检验,没有解析功效函数。
已有的测定方法多基于假定的指数分布[2~8],这与Logrank检验没有匹配关系。
Lachin(1981)[9]指出,这是不得已的,又是他(1986)[7]指出,这是不精确的。
由于无视生存分布的变异和所得样本量偏小,故不能满足Logrank检验的预定功效[10]。
另一方面,近年出现的基于生存率比较的方法又相对保守[11,12]。
本研究首先按临床数据实际分析过程说明设计参数赋值依据和生存研究所需样本量测定原则,然后提出迭代非中心法,即借助重复抽样估计其非中心参数,测定所需样本量,并同基于指数分布的方法进行比较。
1原理
各组t“年”生存率点估计与t“年”生存率检验相匹配,各组各时点条件死亡概率估计与Logrank检验相匹配。
前一匹配临床乐于接受,但检验功效较低;后一匹配功效较高,但估计不够直观。
在作临床数据分析时,通常并不在乎匹配关系,比如先作t“年”生存率点估计,再用Logrank检验作组间比较。
这致使估计与检验失去匹配,然而有直观高效等优点,不但被认可,且已约定成俗。
顺应这一约定,在生存研究设计中,应以各组t“年”生存率为主设计参数,针对Logrank检验进行样本量的测定。
r×2列联表卡方检验所需总样本量N取决于非中心参数表达式[13]:
λ(r-1,α,β)=Nτ
(1)其中,λ是非中心参数,r是组数,r-1是自由度,α是I型错误概率,β是II型错误概率。
τ是非中心卡方,取决于比例(率)πi,i=1,…,r。
给定r,α,β,πi以及组样本分数qi,经式
(1)可测定N。
再按qi分配,得各组样本量。
若将πi代之以估计值i,式
(1)转换为r×2列联表卡方检验:
χ2(r-1)=N
(2)这就是说,E{χ2(r-1)}=λ(r-1,α,β)。
Logrank检验情况特殊:
每一个观测时间点被看作一层,该点处于危险数被看作该层样本量。
总样本量N不能从等号右端分离出来,即不能写成式
(2)的形式,故无对应非中心参数表达式。
然而,可由N和所得χ2(r-1)反推=χ2(r-1)/N。
由式
(1)可以看出,给定πi,qi,τ固定,这时λ与N呈线性关系。
利用多次抽样使的平均值渐近τ。
当次数足够多时,与τ之差可减小到给定误差内,χ2(r-1)平均值与λ(r-1,α,β)之差亦然。
因此,以代替τ可得总样本量近似值。
随抽样次数增加,误差减小,所得样本量成为可接受的。
2方法
这里以两组等样本设计为例来说明测定方法。
给定α,β,由Haynam表[14]查出λ(1,α,β)。
例如,λ(1,0.05,0.1)=10.507,λ(1,0.01,0.05)=17.814。
取对照组t“年”生存率为π2,治疗对照差为μ=π1-π2,试验组t“年”生存率为π1=μ+π2。
取终检比例为b1=b2=b。
为取得具有给定t“年”生存率和给定终检比例的总体,比较方便的办法是设置总体分布。
死亡时间采用Weibull分布:
Fi(t)=1-exp(-θitγ),i=1,2。
这种分布通过形状参数产生迥然不同的生存曲线,应用极广。
由πi=exp(-θitγ)取t=1得θi=-lnπi。
取γ=2/3,1,3/2,分别代表下降、恒定、上升危险。
终检时间采用指数分布:
Ei(t)=1-exp(-φit),这里,φi=θib/(1-b)。
设样本量为n1=n2=n,由此抽取病人(ij,j=1,…,n)的死亡和终检时间分别是:
Xij=(-θi-1lnUij)1/γ和Yij=(-θi-1lnVij)
这里,Uij,Vij是(0,1)区间伪随机数。
如Xij≤Yij,观测的生存时间为Tij=Xij,δij=1;如Xij>Yij,观测的终检时间为Tij=Yij,δij=0。
经排序为Ti1<…
终检比例估计为i=1-∑jδij/n。
t“年”生存率按KaplanMeier法估计为i(t)。
第i组,i=1,2,第j阶处于危险数为:
nij=ni-j+1。
将两组生存时间混合排序为Tk,k=1,…2n,T1<…
如此重复M次,计算平均终检比例i、平均生存率i以及平均统计量。
预定功效1-β95%的置信限为(1-β)±1.96β(1-β)/M。
这样,每预置一次n值,可得对应值。
当|-λ(1,α,β)|≤λ(1,α,β)/(2n)时,最后预置的n值被认为是每组所需样本量。
为方便起见,这里以LachinFoulkes法[7]测定的样本量为初值n(0),并将本法最终确定的n值与此进行比较。
3结果
设计参数取值为α=0.05(双侧),β=0.1,π2=0.5,b=0,0.1,0.2,0.3时,两组Logrank检验按等样本设计每组所需样本量列入表2。
在该表中,μ=0.15,0.2,0.25,0.3,即治疗对照差跨寿命表上半部。
预定功效1-β95%的置信限为0.9±1.960.9×0.1/1000=(0.881,0.919)。
左栏是LachinFoulkes法产生的每组所需样本量,以及由该样本量产生的Logrank检验观测功效。
中栏是迭代非中心法产生的。
表1按迭代非中心法在Weibull生存分布下测定的两样本Logrank检验在寿命表上半部每组所需样本量及其观测功效(略)注:
α=0.05(双侧),β=0.1,π2=对照组生存率,μ=治疗对照差,试验组生存率π1=π2+μ,b1=b2=b=终检比例,n(0)=LachinFoulkes法产生的每组所需样本量,n=迭代非中心法产生的每组所需样本量,nc=观测功效校正样本量,1-β*=观测功效,n,nc,1-β*栏下前一数据来自形状参数γ=2/3各试验集。
LachinFoulkes法产生的样本量随μ值的增大而减小,随终检比例的增大而增大。
在无终检各试验集,不管下降、恒定或上升危险,其观测功效不变。
在有终检时,在下降危险观测功效较低,上升危险观测功效较高。
不管下降、恒定或上升危险,观测功效随终检比例升高而下降。
它们均低于预定功效95%的置信限下限。
在无终检时,不管下降、恒定或上升危险,由迭代非中心法产生的样本量相同。
在有终检时,在下降危险所得样本量较大,上升危险所得样本量较小,均大于由LachinFoulke法产生的对应样本量。
其观测功效在多数试验集略高于预定功效95%的置信限上限。
将观测功效调低到预定水平得校正样本量,如右栏所示。
其数值多比由迭代非中心法产生的样本量略小,随终检比例升高,差别增大。
设计参数取值为μ=-0.15,-0.2,-0.25,-0.3时,两组Logrank检验按等样本设计每组所需样本量列入表3。
在该表中,治疗对照差跨寿命表下半部。
在多数试验集,由迭代非中心法产生的样本量大于由LachinFoulke法产生的对应样本量。
其观测功效在无终检和低终检水平在预定功效95%的置信限内,只是在高终检水平高于其95%的置信限上限。
表3按迭代非中心法在Weibull生存分布下测定的两样本Logrank检验在寿命表下半部每组所需样本量及其观测功效(略)注释同表2。
4讨论
Logrank检验的来历可追溯到Cochran检验(1954)[15]。
这用于分层资料两比例(率)的综合比较,表达为自由度为1的卡方量。
从它的表达式可分解出总样本量N。
以两比例(率)为设计参数,由统计量可转换出非中心参数表达式λ(1,α,β)=Nτ,从而可测定所需总样本量N=λ(1,α,β)/τ。
各层样本量为QiN,Qi是层样本分数,i=1,…,R。
第i层每组样本量为QiqjN,qj是组样本分数,j=1,2。
Mantel和Haenszel(1959)[16]将Cochran统计量分母中的层样本量QiN代之以QiN-1,在分子中用校正项-1/2。
总样本量N不再能分解出来。
然而,只要不用校正项,针对MantelHaenszel检验的样本量测定仍可按等层设计解析地实现。
Peto等(1977)[17]将这类检验引入生存分析,将每个观测点看作一层,将该点处于危险数看作层样本量即分母,将该点死亡数看作分子,由此组成的分数正是条件死亡概率。
这就是Logrank检验。
处于危险数在第1阶等于样本量,以下随观测值向量按非参数过程衰减,无法从统计量中分解出来,即无法解析表达,从而酿成样本量测定的困难。
本研究提示,在假定的指数分布下测得的样本量不能满足Logrank检验的预定功效。
这显然是由于参数测定方法与非参数检验方法没有匹配关系所致。
模拟试验表明,下降危险所需样本量较大,上升危险所需样本量较小。
生存研究所需样本量因生存分布而异。
基于假定指数分布下的方法无视这一点,所得样本量不变,故不可能做出精确测定。
所以,必须寻求与Logrank检验匹配的样本量测定方法。
迭代非中心法是一次尝试。
所得样本量可满足Logrank检验预定功效。
当治疗对照差跨寿命表上半部时,略显保守;在下半部,在无终检和低终检水平,十分精确,只是在高终检水平略显保守。
本研究方法是按无重合样本设计的,未用Yates校正。
临床生存数据多有重合观测值,分析时用校正。
这两点都致使功效降低,所需样本量加大。
略显保守的样本量有其可取之处。
不同生存分布所需样本量不同。
设计前,宜对所研究疾病的生存分布有所了解,这可由文献报道、临床资料或预试获得。
本研究由Weibull死亡时间分布和指数终检时间分布取得给定t“年”生存率和给定终检概率的总体,采用其他生存分布结果如何,尚有待进一步研究。
【参考文献】
1LagakosSW.Inferenceinsurvivalanalysis:
nonparametricteststocomparesurvivaldistributions.In:
MikeV,StanlyKE,eds.StatisticsinMedicalResearch.NewYork:
JohnWiley&Sons,1982,40~364.
2PasternackBS,GilbertHS.Planningthedurationoflongtermsurvivaltimestudiesdesinnedforaccrualbycohorts.JChronDis,1971,24:
681~700.
3GeorgeSL,DesuMM.Planningthesizeanddurationofaclinicaltrialstudyingthetimetosomecriticalevent.JChronDis,1974,27:
16~24.
4RubinsteinLV,GailMH,SantnerTJ.Planningthedurationofacomparativeclinicaltrialwithlosstofollowupandaperiodofcontinuedobservation.JChronDis,1981,34:
469~479.
5LesserML,CentoSL.TablesofpowerfortheFtestforcomparisontwoexponentialsurvivaldistributions.JChronDis,1981,34:
533~544.
6MorganTM.Planningthedurationofaccrualandfollowupforclinicaltrials.JChronDis,1985,38:
1009~1018.
7LachinJM,FoulkesMA.Evaluationofsamplesizeandpowerforanalysesofsurvivalwithallowancefornonuniformpatiententry,lossestofollowup,noncomplience,andstratification.Biometrics,1986,42:
507~519.
8ZhaoG,XiaJ,XuY,etal.Followupstudies:
apracticalmodelanditscomputersimulations.In:
BarberB,CaoD,QinD,WagnerG,eds.MEDINFO'89.Amsterdam:
ElsevierSciencePublishersBV,1989,1006~1010.
9LachinJM.Introductiontosamplesizedeterminationandpoweranalysisforclinicaltrials.ControlledClinicalTrials,1981,2:
93~113.
10朱斌,王曙炎,赵国龙.Logrank检验的功效.数理医药学杂志,2006,19(3):
225~229.
11赵国龙,买玲,周灵杰,等.两生存率比较所需样本量的精确测定逐个迭代法.数理医药学杂志,1998,11(4):
296~298.
12赵国龙.广义非中心法.应用概率统计,1999,15(4):
337~344.
13LachinJM.Samplesizedeterminationsforr×ccomparativetrials.Biometrics,1977,33:
315~324.
14HaynamGE,GovindarajuluZ,LeoneFC.Tablesofthecumulativenoncentralchisquaredistribution.CaseStatisticalLaboratory,PublicationNo104,1962.
15Cochran,W.G.Somemethodsofstrengtheningthecommonχ2tests.Biometrics,1954,10:
417~451.
16MantelN,HaenszelW.Statisticalaspectsoftheanalysisofdatafromretrospectivestudiesofdisease,JournaloftheNationalCancerInstitute,1959,22(4):
719~748.
17PetoR,PikeMC,ArmitageP,etal.Designandanalysisofrandomizedclinicaltrialsrequiringprolongedobservationofeachpatient.II.Analysisandexamples,BritishJournalofCancer.1977,35:
1~39.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logrank 检验所 样本 测定 迭代非中 心法