临床试验中的统计学知识Word文件下载.docx
- 文档编号:22592406
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:18
- 大小:33.80KB
临床试验中的统计学知识Word文件下载.docx
《临床试验中的统计学知识Word文件下载.docx》由会员分享,可在线阅读,更多相关《临床试验中的统计学知识Word文件下载.docx(18页珍藏版)》请在冰豆网上搜索。
执行错误
不严格遵循剂量方案
入选了不合格受试者
试验过程中合并用药
测量的变异
编码错误
在新药研制过程中,按科学原则进行的临床试验是评价一种新治疗方法的有效性和安全性的惟一可靠的基础。
一个临床试验,如果不能恰当地评价试验药物的安全性和/或效性,不能提供关于新药的最好使用方式的充分信息或者提供了误导信息,因而不能对药物的研制、管理、上市和安全有效地使用做出有益贡献,那么这就是一个失败的临床试验。
可能导致临床试验失败的原因很多,有些原因是可以控制的,有些则是较难控制的。
其中试验设计对于临床试验的成功与否起着极其重要的作用。
试验假设(阳性对照)选择不当,随机化及盲法不规范,入选/排除标准过严或过宽,受试者基线值变异大,药物剂量选择不当,终点指标选择及测定时间不妥,样本数太小,数据分析方法不恰当都可能导致临床试验失败(表8)。
GCP对生物统计学的要求包括四个方面:
统计学设计,统计分析计划,临床和统计学报告,以及数据处理。
与临床试验其他专业人员合作的临床试验统计人员的作用和责任是确保在支持新药研制的临床试验中能恰当地应用统计原则。
5.1.2统计学与试验设计
临床试验按其目的大体可分为:
“验证性(Confirmatory)”试验和“探索性ploratory)”试验,验证性试验是控制良好的试验,总是预先定义与试验目的直接有关的关键假设,并且在试验完成后对此进行检验。
验证性试验必须提供疗效和安全性的可靠证据。
新药临床试验中大部分是确认性试验。
但一个临床试验常具有验证性和探索性两方面。
对于每一个支持上市申请的临床试验,所有关于设计、实施和统计分析的要点应当于试验开始前在试验方案中写明。
试验方案中的统计学设计包括:
试验设计,样本大小的确定和为避免偏差而采用的技术。
5.1.2.1平行组设计(Paralleldesign)
验证性试验的最常见设计是平行组设计。
受试者被随机分配到两个(或多个)组中的一个,每个组接受不同的治疗。
治疗包括一个或几个剂量的研究产品,以及一个或多个对照(如安慰剂和/或阳性对照)。
这种设计最有效,其假定比其他设计简单,有明确的有效性结果,完成研究时间较短。
但是,这种设计需要较大的样本,有较大的受试者变异,比较复杂。
试验的某些特点会使结果的分析和解释复杂化,如协变量问题、在一段时间内的重复多次测定、设计因子之间的相互作用、违反设计等等。
5.1.2.2交互设计(Crossoverdesign)
在交叉设计中,每例受试者被随机分配到两个或多个治疗序列中的一个,其自身在治疗比较中作为对照。
这个简单设计的吸引力在于它减少了受试者例数。
在最简单的2x交叉设计中,受试者按随机顺序在两个连续的治疗周期(间隔一个洗脱期)中分别接受两种治疗。
这种设计可以扩大到对象在n(>2)个周期接受n种不同治疗。
交叉设计的优点是所需受试者数较小,消除了受试者间变异。
但是,除了试验时间较长、序列效应和周期效应需作分析以外,交叉设计存在许多可能会使其结果无效的问题,主要是可能带入延期(Carryover)效应。
在2x2设计中,由于缺少把握度(power),统计学上不能从治X周期相互作用项来鉴别延期效应。
使用交叉设计时很重要的是避免延期效应。
要做到这一点,在设计时必须对疾病和新药有足够的认识。
所研究的疾病应当是慢性病且病情稳定;
药物的作用在治疗周期内应当充分展现。
洗脱期要足够长,以使药物的作用完全消退。
交叉设计要注意的其他问题还有受试者出组造成的分析和解释的复杂性;
潜在的延期效应可导致对发生在后一治疗周期的不良事件认定的难度。
通常2x2交叉设计用于证明同一药物两种制剂的生物等效性试验。
在这一特例中,受试者是健康志愿者。
只要洗脱期足够长,延期效应不可能发生。
但是,在试验中仍要在每个治疗周期开始时进行测定,没有检测到药物即可确认没有延期效应。
5.1.2.3析因设计(Factorialdesign)
析因设计通过不同的治疗组合可同时评价两个或多个治疗。
最简单的例子是2x2析因设计,受试者被随机分配到两种治疗(A,B)的4种可能组合中的一个:
A,B,AB,无A无B。
这一设计在多数情况下系用于检查A与B的相互作用的特殊目的。
如果根据主效应计算样本数,统计检验可能缺乏把握度检测相互作用。
如果该设计用来检查A和B的联合作用,特别是一起使用两种治疗时,要特别注意样本数的问题。
析因设计的另一重要用途是确定同时使用治疗C和D的剂量-反应特征。
设C有m个剂量水平(通常包括零剂量、安慰剂),治疗D有n个剂量水平,那么完全析因设计包含了mxn个治疗组,每个接受不同剂量的C、D组合。
反应面(responsesurface)的结果估算有助于鉴别合适的临床使用剂量组合。
5.1.2.4多中心临床试验
多中心临床试验是一种实践上可被接受、且更加有效地评价新药的方法。
它的优点是可以在合理的时间内招募足够多的受试者,而且多中心临床试验为其研究结论的普遍性提供了良好的基础。
一个多中心临床试验要成功,必须采用同样的试验方案并严格按此实施临床试验,需要有尽可能完善的实施临床试验的标准化操作程序(SOP)。
样本大握度的计算通常是假定各中心所比较的治疗差异是同样数量的无偏差估计,多中心试验应当避免各中心招募的受试者人群特征变化过大以及样本量过小的中心,以降低治疗效果的不同权重估算的差异。
每个中心必须有一个主要研究人员负责本中心的研究工作符合设计要求,试验前集中对各中心人员进行必要的培训,实施试验过程中的质量控制。
多中心研究中,研究人员可能从一个医院入选对象,也可能一个研究人员从几个协作医院入选受试者。
因此,试验方案中应该对中心有明确的定义(如指研究人员、医院或地区),多数场合中心以研究人员来限定。
如果每个中心有相当数量的受试者,在分析多中心研究的主要治疗效应时,要考虑中心间的均匀性。
5.1.3临床试验中的有关考虑
5.1.3.1避免偏差的技术
(l)育法
采用盲法技术是为了防止由于对于治疗的了解而引起的有意识和无意识的在实施和评价临床试验中的偏差。
因此,盲法的基本目的是在发生偏差的机会过去之前防止识别接受的是何种治疗。
①单盲试验受试者或研究人员/工作人员一方不知道所接受治疗。
②双盲试验受试者和参加临床试验或临床评价的研究人员或申办者方工作人员均不知道也不能识别对象接受了何种治疗的称为双盲试验。
在试验实施过程中一直保持盲态。
只有在试验结束、完成数据清理、数据已达到可以接受水平并且"
锁定"
后方可由指定人员揭盲。
要达到理想的双盲会遇到一些问题:
如完全不同的治疗(手术和药物);
两种药物剂型不同,而改变剂型如胶囊可能会引起药代动力学和/或药效动力学特征的改变,从而需要确定制剂的生物等效性;
两种制剂的给药方案可能不同,等等。
在这种情况下,可采用"
双模拟"
(double-dummy)技术。
即为每一种制剂,如A、B,准备一个一模一样的安剂,受试者接受A(活性)+B(安慰剂)或A(安慰剂)+B(活性)。
但是,由于明显的治疗效应,某些双盲临床试验仍会遇到问题。
在这种情况下,对研究人员和有关人员加盲可改善盲法,即所谓三盲试验。
(2)随机化
随机化为在临床试验中受试者接受某种治疗引入了审慎的机遇成分。
它为以后的数据分析提供了一个坚实的统计基础。
随机化所产生的治疗组,基线中已知和未知预后因子(Prognosticfactor)的分布相仿。
随机化与盲法相结合,会大大有助于避免在指定治时由于可预见性所引起的选择和分配受试者的可能偏差。
与无限制的随机相比,区组随机有两个优点:
有助于增加治疗组间的可比性(尤其是受试者特征随时间可能变化时),和保证治疗组有几乎相同的受试者数。
但要注意区组长度不宜过长也不宜过短,过长可能会产生不平衡,过短则会使区组末段的分配有可预见性。
多中心试验的随机化程序应当以中心为单位。
各个中心有各自的随机表,但应该是完整的区组。
表9影响样本大小的因素
因素
对样本大小的影响
治疗组数目
公式计算的是每个组所需要的例数
结果变量的测定
连续变量或(转化为)两分变量
预期受试者随访时间
随访时间长则事件发生率高,对给定的α、β,所需例数较少
备择假设
双侧或单侧
可检测到的治疗差异
必须符合实际。
差异大则所需例数少
所定的Ⅰ类Ⅱ类错误
通常取α<
β。
适用于:
对照治疗已经广泛应用且安全有效;
试验药物为新药。
α与β越小,所需例数越多
受试者分配比
通常取各组例数相同。
当有其他目的时,或为了提高精确度(降低方差)时,取组间例数不等同。
如r个治疗组与一个对照组比较时,可取对照组例数为治疗组的(r)1/2[上标]倍。
预期的失访率
样本数应根据失访率相应扩大
预期的治疗不依从率
药物暴露不足或过量;
受试者/医生不遵循设计方案规定,例数应增加
基线变量的分层程度
分层后亚组的受试者数减少
多重比较
按多个治疗组比较
多个终点
有一个主要结果、多个次要结果。
样本大小通常按主要变量计算。
有时对每个结果变量计算所需样本数,取最大样本数。
5.1.3.2试验样本量的确定
临床试验应当有足够功效(把握度)检测不同治疗之间的差异。
样本应当足够大才可以对所提出的问题做出可靠的回答。
一个临床试验的样本大小是由研究目的、反映研究目的的研究假设和由此导出的统计检验所确定的。
样本量通常是根据试验的主要目的计算的。
如果样本大小根据其他变量,如安全性变量或次要目的计算,应当在设计书中有清楚说明并给出理由。
(1)影响样本大小的因素
在计算所需样本量之前,下列各项应有明确的定义:
主要变量;
试验数据的统计检验;
零假设和备择假设;
Ⅰ类和Ⅱ类错误;
计量数据的差值、标准差和参考值;
计数数据的率。
下面介绍3种常用的计算临床试验样本大小的方法。
计算所得的是每组所需受试者例数。
考虑到试验中受试者因不良事件退出的比例,实际筛选受试者数还需根据估算的比例增加。
在计算临床试验样本大小时要考虑的因素和它们的影响简列于表9。
(2)样本大小的计算
①试验的结果变量为定性的两分(值)变量。
式中,P1:
为对照标准治疗的成功率。
P2:
为试验治疗的成功率。
α:
为检测治疗差异的c2显著性检验水平,通常取0.05。
1-β:
如果差异P2-P1存在,检测到这种差异的把握度或功效。
α通常又称Ⅰ类错误,即当实际上两种治疗同样有效时,检测到有显著差异的概率,相当于假阳性率。
β通常又称Ⅱ类错误,即当差异P2-P1确实存在时没有检测到这种差异的概率,相当于假阴性率。
f(α,β):
α和β的函数。
其常用值列于表10。
表10用于计算所需受试者数公式中的f(α,β)值
β(Ⅱ类错误)
0.05
0.1
0.2
0.5
α(Ⅰ类错误)
10.8
8.6
6.2
2.7
13.0
10.5
7.9
3.8
0.02
15.8
10.0
5.4
0.01
17.8
14.9
11.7
6.6
例:
观察(降血胆固醇药)预防胆固醇升高者的缺血性心脏病的随机临床试验,安慰剂对照。
根据资料,对照组的缺血性心脏病的年发病率为1%。
研究希望检测5年中用安妥明组的缺血性心脏病发生率比对照组降低1/3,设定Ⅰ、Ⅱ类错误水平分别为α=0.01和β=0.1,求所需受试者例数。
例中由于该研究没有可能重复,因此选定的显著性水平比较严格(P<
0.01)是必要的。
对照组缺血性心脏病的年发生率1%,因此5年中为5%,即P1=5%;
P2=3.3%。
②试验的结果变量为定量(连续)变量。
式中,μ1:
对照标准治疗的均值。
μ2:
另一治疗的期待均值。
s:
标准差。
f(α,β)为α和β的函数。
例:
评价孕妇补充VitD防止婴儿低血钙的临床研究。
从以前未用药妇女资料中可得血清钙均值为9.0mg/100ml,标准差为1.8mg/100ml。
选择显著性水平α=0.05,1-β=0.95。
考虑被VitD后孕妇血清钙水平提高到9.5mg/100ml,求所需受试者例数。
注意,以上两个临床试验目的都是希望确证一种治疗(试验组)明显好于另一种治疗(对照)。
③生物等效性研究中交叉设计的受试者例数计算我国新药审批办法规定,四类新药需进行生物等效性研究。
生物等效性研究的试验目的是比较一种产品的两种制剂(试验制剂和参考制剂)的生物利用度,并根据吸收速率和吸收程度判断其生物等效性。
试验的主要假设是两种制剂的平均生物利用度的差异是否有一定把握落在参考制剂均值的±
20%范围之内。
为此目的,根据试验药物的性质,一般采用交叉设计,在某些情况下亦可以采用平行设计,如当受试者间变异小于受试者内变异药物有潜在毒性和/或消除半衰期长,研究人群包括重病人,增加受试者例数的花费远低于增加一个治疗周期的费用时可考虑。
下面介绍生物等效性研究中交叉设计的受试者例数计算,并且试验假设为Ho:
生物等效;
Ha:
生物不等效。
根据生物等效性的双向单侧统计检验程度,每个序列所需受试者数为:
CV由先前的研究或参考资料获得。
当α=0.05,1-β=0.90时,根据上述公式计算的双单侧检验程度所需受试者例数列于表11。
表11双单侧检验所需受试者例数(α=0.05,1-β=0.90)
cv(%)
θ=(μT-μR)/μR
0%
5%
10%
15%
10
20
70
12
14
28
100
18
36
136
16
22
46
178
58
224
24
32
276
40
86
334
34
396
26
54
118
466
44
62
540
30
52
156
618
80
704
66
90
200
794
72
890
38
112
250
992
124
1098
5.1.3.3统计学分析计划
根据ICH的要求,一个临床试验方案中应该有专门的统计段落描述数据的主要统计分析方法。
随后,统计分析计划可写成一个独立的文件。
它是对试验方案中描述的分析原则的更加技术性和详细的说明,包括关于主要变量、次要变量和其他数据的详细的可执行的分析程序。
临床试验结果应当依据方案中规定的分析计划进行分析;
如果试验方案有所修改,应该在报告中说明。
对于盲法试验,在揭盲之后所作的任何变更都要在临床和统计报告中说明变更的理由。
统计分析计划的内容应包括:
分析研究的人群,疗效与安全性评价的主要变量、次要变量,统计学方法,缺失数据的处理,结果的表达,亚组分析(如果有)等。
(1)分析研究人群
·
所有进入随机化分组的受试者(intent-to-treat)。
接受试验药物治疗的所有随机化受试者。
遵循研究设计方案的受试者(Per-protocol)
安全性/耐受性分析的受试者。
(2)要比较的治疗组
(3)主要变量和次要变量
主要变量是;
临床意义上最重要的变量,其与试验的主要目的直接相关。
一般应该只有一个主要变量。
如充血性心力衰竭治疗试验中的死亡率;
高血压治疗试验中的舒张压;
避孕药临床试验中的妊娠率等。
对于主要变量在试验设计中应作限定。
在分析计划中要说明主要变量的测定方法、测定时间点、是否作数据转换等,以及测定程序的有效性。
次要变量可以是有关主要目的的辅助测定,也可以是关于次要目的的测量。
对次要变量的数目应当限制。
(4)统计学方法
必须阐明统计显著性是采用单侧或是双侧检验,特别是采用单侧检验时应充分说明其理由。
应当说明检验假设和为满足试验主要目的需要估算的治疗效应。
描述要完成这些任务对于主要变量(也包括次要变量)所采用的统计方法。
基本统计模式应有清楚说明。
只要可能,估算治疗效应要以可信区间表示,计算可信区间的方法应予以说明。
使用基线数据以改善精确度或调节潜在的基线数据的差异,如采用协方差分析,对其目的应有说明。
此外,应该说明主要和次要变量的辅助分析方法,以及其他数据的分析方法,如安全性数据。
在统计分析计划中并应列出相应的分析程序。
(5)缺失数据
在临床试验中,各种类型的违反方案、中途退出试验和数据缺失都可能影响完满的分析。
在统计分析计划中应该写明发生这些问题时在数据分析中的处置办法。
(6)结果的表达
可采用均数、标准差;
最小值和最大值;
累积百分率;
各种图、表等。
只要可能,估算治疗效应要以可信区间表示。
(7)亚组分析
列出那些预期会对主要变量有重要影响的协变量和因子,考虑为改善精度在分析时如何计算,以及如何弥补治疗组之间的不平衡。
应当特别注意中心和主要变量的基线值的影响。
在大多数情况下,对于亚组或相互作用的分析是探索性的,一般应当反映治疗效果总的一致性。
(8)统计分析计划的修改
统计分析计划如有变更,应在报告中作出说明。
包括修改的时间和原因;
修改的内容陈述;
负责修改的人或组;
可供分析数据的性质和内容。
在盲法试验揭盲之后所作的变更,需要在临床和统计报告中描述并说明其合理性;
对报告中将要讨论的结果的解释所产生的影响要给予说明。
在揭盲之后就不能再接受下列变更:
主要变量、从领先确定人群中剔除受试者和处理缺失数据的原则。
临床试验数据分析要点
5.3.1分析对象的数据集
5.3.1.1全样本分析(Fullanalysisset)
计划治疗原则(intention-to-treat)是指主要分析应当包括所有进入随机化的遵循这一原则需要对所有随机受试者完成随访得到试验结果。
由于各种理由,这在实际上是难以达到的,因此,全样本分析是尽可能接近于包括所有随机受试者,在分析中保留最初的随机化对于防止偏差和提供安全的统计检验基础很重要。
在许多场合,它提供的对治疗效果的估算很可能反映了以后的实际观察结果。
从分析中剔除已随机受试者的情况不多:
包括不符合重要入选标准,一次也没有用药,随机化后没有任何数据。
从分析中剔除不符合入选条件受试者必须不致引起偏差:
入选标准的测定是在随机化之后;
违反合格标准的检测是完全客观的;
所有受试者都受到同样的合格性调查;
各组实行同样的入选标准,凡违反者均被排除。
5.3.1.2遵循研究设计对象(PerProtocolSet)
"
PerProtocol"
对象组,有时称之为"
有效病例"
、"
有效样本"
或"
可评价受试者样本;
定义为全部分析样本中较好遵循设计书的一个受试者亚组:
完成预先说明的确定治疗方案暴露。
得到主要变量的测定数据。
没有违反包括入选标准在内的重要试验设计。
从"
有效受试者"
组中剔除受试者的精确理由应当在揭盲前就充分限定并有文件记载。
为得到"
而排除对象的原因和其他一些违反研究设计的问题,包括对象分配错误、试验中使用了试验方案规定不能用的药物、依从性差、出组和数据缺失等,应当在不同治疗组之间对其类型、发生频率和发生时间进行评价。
5.3.1.3不同的分析(受试者)组的作用
在验证性试验中,通常进行全样本和"
两种分析。
这样可以对两者之间的任何差别进行明白的讨论和解释。
有时候可能需要计划进一步探究结论对于选择分析受试者组的敏感程度。
两种分析得到基本一致的结论时,治疗结果的可信度增加。
但是要记住,需要?
quot;
中排除相当数量受试者会对试验的总有效性留下疑点。
在优越性(Superioritytrial,证明新药比标准对照药物优越)试验、等效性试验或不差于(non-inferioritytrial,确证新产品与对照药物相当)试验中,这两种分析有不同的作用。
在优越性试验中,全样本分析用于主要的分析可以避免"
分析对疗效的过于乐观的估算;
全样本分析所包括的不依从受试者一般会缩小所估算的治疗作用。
但是,在等效性或不差于试验中使用全样本分析通常是不谨慎的,对其意义应当非常仔细考虑。
5.3.2缺失值和线外值(包括异常值)
缺失值代表临床试验中一个潜在的偏差来源。
因此,在实施临床试验时应当尽最大努力符合试验方案对于数据收集和数据管理的要求。
对于缺失值并没有通用的处理办法,但只要处理方法合理,特别是如果处理缺失值方法在试验方案中预先写明,则不会影响试验的有效性。
当缺失值数目较大时,要考虑分析结果对于处理缺失值方法的敏感程度。
线外值(包括异常值)的统计学定义在某种程度上带有随意性。
除了统计学判断之外加上医学判断以鉴别一个线外值(包括异常值)是最可信的方法。
同样,处理线外值(包括异常值)的程序应当在方案中列出,且不可事先就有利于某一个治疗组。
5.3.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床试验 中的 统计学 知识