第5章病例对照研究王建华.docx
- 文档编号:8560083
- 上传时间:2023-01-31
- 格式:DOCX
- 页数:33
- 大小:244.44KB
第5章病例对照研究王建华.docx
《第5章病例对照研究王建华.docx》由会员分享,可在线阅读,更多相关《第5章病例对照研究王建华.docx(33页珍藏版)》请在冰豆网上搜索。
第5章病例对照研究王建华
第五章病例对照研究
病例对照研究(case-controlstudy)是分析流行病学方法中最基本、最重要的研究类型之一。
近年来,在经典的病例对照研究基础上又衍生出若干种新的方法,克服了经典方法本身的一些缺陷,大大丰富和发展了病例对照研究的方法和内涵,成为现代流行病学方法学进展的重要部分。
病例对照研究得到越来越广泛的应用,特别是在病因学研究中,不失为一个得心应手的工具。
第一节基本原理
病例对照研究的基本原理是以确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,通过询问、实验室检查或复查病史,搜集研究对象既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各因素的暴露比例,经统计学检验,若两组差别有意义,则可认为因素与疾病之间存在着统计学上的关联。
在评估了各种偏倚对研究结果的影响之后,再借助病因推断技术,推断出某个或某些暴露因素是疾病的危险因素,从而达到探索和检验疾病病因假说的目的。
这是一种回顾性的、由结果探索病因的研究方法,是在疾病发生之后去追溯假定的病因因素的方法,是在某种程度上检验病因假说的一种研究方法(图5-1)。
图5-1病例对照研究示意图
最早的病例对照研究见于1843年Guy向伦敦统计学会所做的报告,该报告分析了职业暴露与肺结核发生的关系。
最早的病例对照研究的概念见于Louis的著作(1844)。
但是符合现代病例对照研究概念的研究首推LaneClaypon(1926)报告的生殖因素与乳腺癌关系的研究。
二次世界大战后,病例对照研究方法的应用大大增加,比较著名的有Schreck和Lenowitz(1947)的包皮环切和性卫生与阴茎癌的关系;Hartwell(1947)对于输血与肝炎关系的研究;Doll和Hill(1950)关于吸烟与肺癌的研究。
20世纪60年代以来,病例对照研究方法日臻完善,应用日益普遍。
其中,孕妇服用反应停(thalidomide)与婴儿短肢畸形、母亲吸烟与先天性畸形、早产儿吸入高浓度氧与晶体后纤维组织增生症、经期使用月经棉与中毒性休克综合征、小剂量电离辐射与白血病、以及母亲早孕期服用雌激素与少女阴道腺癌等之间的关系,均是应用病例对照研究的经典范例。
第二节研究类型
一、病例与对照不匹配
在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病例人数。
对照选择时没有特殊规定。
二、病例与对照匹配
匹配(matching)或称配比,即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。
如以年龄做匹配因素,在分析比较两组资料时,可免除由于两组年龄构成的差别对疾病和因素关系的影响,从而更正确地说明所研究因素与疾病的关系。
匹配分为频数匹配与个体匹配。
1.频数匹配(frequencymatching)频数匹配首先应当知道或估计出匹配变量每一层的病例数,例如做年龄匹配,应当知道20~24岁组、25~29岁组等各组的病例数,然后从备选对照中选择对照,直至达到每层所要求的数目,不一定要求绝对数相等,重要的是比例相同。
例如,病例组中男女各半,则对照组中也应一样。
2.个体匹配(individualmatching)以病例和对照个体为单位进行匹配叫个体匹配。
1:
1匹配又称配对(pairmatching),1:
2、1:
3、……1:
R匹配时,直接称为匹配。
定量指标有时要在一定范畴内匹配。
例如年龄匹配,病例为50~59岁组,则对照亦应为50~59岁组。
有时对照应当在某定量指标的特定范围内与病例匹配。
例如,对年龄进行匹配时,可要求对照在2岁以内、3岁以内或5岁以内匹配等。
假定要求对照与病例的年龄之差在±3岁之内。
一个39岁的病例,其对照的年龄应当在36~42岁之间。
匹配指标范围的大小应当根据可行性而定,在预实验(pilotstudy)中可以从较窄的范围开始,探求多大的范围最合适。
很显然,范围越宽,两组的可比性就会越差,造成较大的残余混杂(residualconfounding)而达不到匹配的目的。
在病例对照研究中采用匹配的目的,首先在于提高研究效率(studyefficiency),表现为每一研究对象提供的信息量增加。
其次在于控制混杂因素的作用。
所以匹配的特征或变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子,否则不应匹配。
匹配同时也增加了选择对照的难度。
而且一旦某个因子做了匹配,我们将不能再分析它与疾病的关系,也不能充分分析它与其他因子的交互作用。
把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率。
这种情况称为匹配过头(over-matching),应当注意避免。
有两种情况不应使用匹配,否则会造成匹配过头。
一是研究因素与疾病因果链上的中间变量不应匹配。
例如,吸烟对血脂有影响,而血脂与心血管疾病有病因关系,在研究吸烟与心血管病关系的病例对照研究中,按血脂水平对病例和对照进行匹配,则吸烟与疾病的关联消失。
另一种是只与可疑病因有关而与疾病无关的因素不应匹配。
例如,避孕药的使用与宗教信仰有关,但宗教信仰与研究的疾病并无关系,因此不应将宗教信仰作为匹配因素。
换句话说,上述两种情况中提到的因素都不符合混杂因素的特征,所以不应用来匹配。
匹配的变量应当一致到什么程度,取决于变量的性质、必要性与实际可能性。
离散变量可以完全匹配;连续变量可以首先划分为若干类或组,再按组匹配,如按5岁一个年龄组进行的分组匹配。
分得太细不一定必要,还会增加工作难度;分得太粗有可能达不到控制混杂的目的。
一般除性别、年龄之外,对其他因素是否进行匹配,须持慎重态度,以防止匹配过头,且徒增费用和难度。
匹配在提高了研究效率的同时,也提高了检验无效假设所需的统计学功效,增加了比值比(反映关联强度的指标,参见后文)的精确度(即可信区间变窄)。
三、衍生的研究类型
近年来,在病例对照研究中衍生了多种改进的、非上述传统意义的病例对照研究类型。
1.巢式病例对照研究(nestedcase-controlstudy,case-controlstudynestedinacohort)1973年美国流行病学家Mantel提出了综合式病例对照研究设计,1982年正式命名为巢式病例对照研究。
它是将传统的病例对照研究和队列研究进行组合后形成的一种研究方法,也就是在对一个事先确定好的队列进行随访观察的基础上,再应用病例对照研究(主要是匹配病例对照研究)的设计思路进行研究分析。
巢式病例对照研究是在某特定队列中进行的,因此对应于队列研究的两种类型,可分为前瞻性巢式病例对照研究和回顾性巢式病例对照研究两类。
2.病例队列研究(case-cohortstudy)又称病例参比式研究(case-basereferencestudy),也是一种队列研究与病例对照研究结合的设计形式。
在流行病学的队列研究中常常会见到,随访一段时间后只发生了少量病人,其他大多数对象只能得到截尾(censored)观察结果,这时如果要获得所有对象的协变量资料做统计分析,则需花费大量的资源。
为此,Prentice在1986年提出了一种新的设计方法,即病例队列研究。
病例队列研究的基本设计方法是队列研究开始时,在队列中按一定比例随机抽样选出一个有代表性的样本作为对照组,观察结束时,队列中出现的所研究疾病的全部病例作为病例组,与上述随机对照组进行比较。
病例队列研究与巢式病例对照研究的不同之处在于:
(1)对照是在基线队列中随机选取的,不与病例进行匹配。
(2)对照是在病例发生之前就已经选定,而巢式病例对照研究,选择对照是在病例发生之后进行。
(3)可以同时研究几种疾病,不同的疾病有不同的病例组,但对照组都是同一组随机样本。
3.病例交叉研究(case-crossoverdesign)1991年美国学者Maclure提出了病例交叉设计的方法。
该方法的基本原理是:
如果暴露与某急性事件有关,那么在事件发生前较短的一段时间(危险期)内,暴露的发生应比事件发生前较远的一段时间(对照期)内更频繁。
病例交叉设计的研究对象包含病例和对照两个部分,但两部分的信息均来自于同一个体。
其中,“病例部分”被定义为危险期,该期是疾病或事件发生前的一段时间;“对照部分”为对照期,该期是指危险期外特定的一段时间。
研究就是对个体危险期和对照期内的暴露信息(如服药、运动等)进行比较。
例如,据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。
4.单纯病例研究(caseonlystudy)由Piegorsch等于1994年首先提出,也称病例病例研究(case-casestudy)或病例系列研究(caseseriesstudy)。
近年来,该方法被广泛应用于疾病病因研究,仅利用某一疾病的患者群体来评价基因与环境的交互作用。
该方法的基本原理是:
确定某一患病人群作为研究对象,追溯每一成员的环境暴露资料,并收集病人的一般情况、混杂变量及其他宏观资料,采集病人的生物标本,采用分子生物学技术检测基因型。
以具有某一基因型的患者作为病例组,以无该基因型的患者作为对照组(当基因型别较多时,也可以分成多组资料),在调整其他协变量(如年龄、性别、种族、职业等)后,根据基因型与环境暴露情况,按病例对照研究的方式处理资料。
单纯病例研究应用的前提条件是:
在正常人群中,基因型与环境暴露各自独立发生,且所研究的疾病为罕见病(此时可用OR来估计RR值)。
5.病例时间对照设计(case-time-controldesign)1995年,Suissa提出了病例时间对照设计。
该方法是在Maclure提出的病例交叉设计的基础上结合传统的病例对照研究设计的一种方法。
在药物流行病学研究中,传统的病例对照研究往往不能完全控制疾病的严重程度造成的混杂。
此时,病例自身作为对照就可以克服这个问题,因而Maclure提出了病例交叉设计。
然而,病例交叉设计仅适用于效应短暂的研究,不适用于随时间的推移,暴露可能会变化的情况。
例如,随时间的推移,药物的使用可能会“自然增加”。
药物使用的“自然增加”不仅与研究的事件相关,而且与医疗措施改变、对药物益处的认识加深、对使用该药物信心增加、适应症扩大、病人对药物依赖增加以及市场的推广等均有关。
这样,药物使用的自然变化趋势会混合到由病例交叉分析所得的OR值中。
另设一组对照,对照组中每个研究对象也观测两次,则可以消除该影响。
第三节研究实例
一、研究背景
美国波士顿Vincent纪念医院妇产科医师Herbst注意到该院于1966~1969年间共诊断了7例15~22岁年轻女性阴道腺癌(adenocarcinomaofvagina)病例。
这是一种罕见的女性生殖系统癌症。
通常,阴道癌只占女性生殖系统癌症的2%,腺癌又只占阴道癌的5%~10%,且多发生于50岁以上的女性中。
这种明显的时间和地点的聚集现象引起了Herbst医师探讨病因的兴趣。
Herbst最初想从7例病人的共同点找出线索,发现7例病人都没有使用阴道局部刺激物、阴道冲洗或阴道塞的历史。
除一例发病后结婚外,均否认有性交史。
病例发病前均未使用过避孕药。
在描述性研究未获结果的情况下,Herbst认为应当详细了解这些病例从胚胎期至发病前的情况,以及她们的母亲在妊娠期的情况,如怀孕时出血史、流产史等,因此决定做一次病例对照研究。
二、研究方法
研究时,Herbst将1969年波士顿另一所医院的一名20岁女性阴道透明细胞癌患者也包括在内。
这样,共收集到8个病例,每个病例配4个未患阴道腺癌的病人做对照。
对照候选人为出生时与病例在同等级病房中,出生时间前后不超过5天的女性,优先选择与病例出生时间最接近者为对照。
由经过培训的调查员,使用统一的调查表,对病例、对照以及她们的母亲进行访问调查。
三、主要研究结果
在比较的诸多因素中,多数在两组间无明显统计学差别。
但有三个因素表现出显著的组间差别。
它们是母亲怀孕期间使用过己烯雌酚激素治疗(P<0.00001)、母亲以前的流产史(P<0.01)和此次怀孕时的阴道出血史(P<0.05)。
而三者的关系是,因为有后两个因素才使用己烯雌酚治疗。
通过8个病例与32个对照的病例对照研究,Herbst等做出结论,母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加。
一些主要结果见表5-1。
表5-1病例对照研究部分资料
病例号
母亲年龄
母亲吸烟
此次怀孕出血
以往流产史
此次怀孕时使用过雌激素
母亲哺乳
此次怀孕时照射过X线
病例
四个对
照平均
病例
对照
病例
对照
病例
对照
病例
对照
病例
对照
病例
对照
1
25
32
有
2/4
否
0/4
有
1/4
有
0/4
否
0/4
否
1/4
2
30
30
有
3/4
否
0/4
有
1/4
有
0/4
否
1/4
否
0/4
3
22
31
有
1/4
有
0/4
否
1/4
有
0/4
有
0/4
否
0/4
4
33
30
有
3/4
有
0/4
有
0/4
有
0/4
有
2/4
否
0/4
5
22
27
有
3/4
否
1/4
否
1/4
否
0/4
否
0/4
否
0/4
6
21
29
有
3/4
有
0/4
有
0/4
有
0/4
否
0/4
否
1/4
7
30
27
否
3/4
有
0/4
有
1/4
有
0/4
有
0/4
否
1/4
8
26
28
有
3/4
有
0/4
有
0/4
有
0/4
否
0/4
有
1/4
合计
7/8
21/32
3/8
1/32
6/8
5/32
7/8
0/32
3/8
3/32
1/8
4/32
平均
26.1
29.3
χ2
自由度为1*
0.53
4.52
7.16
23.22
2.35
0
P
0.50
<0.05
<0.01
<0.00001
0.20
不显著**
不显著
不显著
不显著
OR
5.7
8.0
10.5
28.0
10.0
3.0
注:
*用Pike与Morrow的配对对照χ2检验公式。
**配对t检验,
=1.7岁。
第四节研究设计与实施
一、一般步骤
(一)提出病因假设
(二)制定研究计划
1.明确研究目的,选择适宜的对照形式,选择病例与对照比较的类型;
2.病例与对照的来源和选择方法,确定病例的诊断标准和诊断方法;
3.估计研究样本大小;
4.根据病因假设与研究所具备的条件,确定调查因素或暴露变量;
5.设计调查表,特别要注意混杂变量;
6.设计中要考虑整个研究过程中可能出现的偏倚,并预先设计好如何控制各种偏倚;
7.考虑获取研究因素信息的方法;
8.考虑资料整理与分析的方法;
9.研究所需费用的概算;
10.人员分工及与协作单位的协调;
11.制定一套严格的、可行的、针对各个环节的质量控制措施。
(三)收集资料
1.培训调查员与预调查制定培训手册和工作手册,对调查员进行培训考核,规范调查方法。
小样本的预调查后应对整个研究计划(包括调查表)提出修改和完善的意见和建议;
2.开展正式的调查严格按照已修改过的调查表与统一的调查方式进行,不得随意更改。
(四)对收集到的资料进行整理与分析
(五)总结并提交研究报告
二、具体实施
(一)提出假设
根据所了解的疾病分布的特点和已知的相关因素,在广泛查阅文献的基础上,提出研究假设。
(二)明确研究目的,选择适宜的对照形式
首先,如果研究目的是广泛地探索疾病的危险因子,可以采用不匹配或频数匹配的方法。
其次,了解可供研究用的病例的数量,以确定是否采用匹配设计及匹配比。
如果所研究的是罕见病,或所能得到的符合规定的病例数很少时,例如10-20例,则选择个体匹配方法,因为匹配比不匹配的统计学检验效率高。
第三,以较小的样本量获得较高的检验效率。
如1:
R(或1:
M)的匹配方法,R值越大,效率越高。
按Pitman效率递增公式2R/(R+1),1:
1配对的效率为1,1:
2时为1.3,1:
3时为1.5,1:
4时为1.6。
随着R值的增加,效率逐渐增加,但增加的幅度越来越小,而工作量却显著增大。
因此,R值不宜超过4,否则将得不偿失。
匹配可保证对照与病例在某些重要方面的可比性。
对于小样本研究以及因为病例的某种构成(例如年龄、性别构成)特殊,随机抽取的对照组很难与病例组均衡可比,此时个体匹配特别有用。
(三)病例与对照的来源与选择
病例与对照的基本来源有两个。
一个来源是医院的现患病人或医院和门诊的病案及出院记录记载的既往病人,称为以医院为基础的。
相应地,这种设计称为以医院为基础的(hospital-based)病例对照研究。
另一个来源是社区、社区的监测资料或普查、抽查的人群资料,称为以社区为基础的。
相应地,这种设计被称为以社区为基础的(community-based)病例对照研究或以人群为基础的(population-based)病例对照研究。
1.病例的选择主要是确定判断病人的标准和如何获得符合标准的病人。
(1)对疾病的规定有些疾病的诊断标准很容易确定,很少有争议,如唇裂。
有些疾病则需制订具体而明确的诊断标准,尤其是只适用于本次研究的标准,并且应落实为文字形式作为研究计划的附件。
制订疾病标准时应注意两点:
①尽量采用国际通用或国内统一的诊断标准,以便于与他人的工作比较;
②需要自订标准时,注意均衡诊断标准的假阳性率及假阴性率的高低,宽严适度。
如有定量指标时,一般要求诊断标准落在病人与非病人分布曲线的交叉点上(参见本书第7章)。
(2)对病例其他特征的规定如性别、年龄、民族等。
其目的是控制外部因素即非研究因素以增强两组的可比性。
在选择病例时有三种不同的情况,即新发病例(incidentcase)、现患病例(prevalentcase)与死亡病例(deathcase)。
比较而言,新发病例由于刚刚发病,对疾病危险因素的回忆可能比较清楚,提供的信息较为准确可靠。
现患病例则不然,而且易于掺入疾病迁延及存活的因素在内。
死亡病例则主要由家属或他人提供信息,准确性较差。
(3)如何保证病例达到有关规定的标准可要求具备某一级医院或实验室的诊断,或病人必须经过某项检查等。
有时需要另组织专家对病例复查,以保证符合规定的标准。
病例一般以社区来源为优,代表性较强,但实施难度较大。
使用医院来源的病例,可节省费用,容易获得,合作好,信息较完整、准确,但容易发生选择偏倚。
2.对照的选择在病例对照研究中,对照的选择往往比病例的选择更复杂、更困难。
对照选择是否恰当是病例对照研究成败的关键之一。
对照的选择应满足以下4个原则:
(1)排除选择偏倚;
(2)缩小信息偏倚;(3)缩小不清楚或不能很好测量的变量引起的残余混杂(准确测量的混杂因素在分析阶段可以控制);(4)在满足真实性要求和逻辑限制的前提下使统计把握度达到最大。
对照最好是全人群的一个无偏样本,或是产生病例的人群中全体未患该病者的一个随机样本,而未患该病的状态也经过相同诊断标准的确认。
实际上,这种理想的对照很难得到。
过分强调病例与对照的代表性,假定病例代表所有该病病人,对照代表全部非病人群是不恰当的。
一项病例对照研究可以限于研究者感兴趣的任何类型的病例,如女性病例、老年病例、严重病例、发作后迅速死亡的病例、轻型病例、某城市的病例、工厂工人中的病例等。
这些例子中没有一种病例是代表该病所有病人的。
根据病例的定义可以确定病例的源人群(sourcepopulation),对照应当是从该源人群中抽取,代表的是整个源人群,而不是未患病的人群。
对照组的样本的暴露率应当能够反映源人群的暴露水平。
实际工作中的对照来源主要有:
(1)同一或多个医疗机构中诊断的其他病例;
(2)病例的邻居或所在同一居委会、住宅区内的健康人或非该病病人;(3)社会团体人群中的非该病病人或健康人;(4)社区人口中的非该病病人或健康人;(5)病例的配偶、同胞、亲戚、同学或同事等。
其中以第(4)种最接近全人群的无偏样本,而以第
(1)种使用最多。
对照应当来自产生病例的人群,能代表产生病例的人群。
在医院为基础的病例对照研究中,常常不能识别源人群,因为它代表了一组人,这些人如果发生了所研究的疾病将会去一定的医院治疗。
这种情况下,总人群的随机样本不一定与源人群的随机样本一致。
当使用医院病例时,对照组个体可以限制为那些与暴露没有联系迹象的病人。
例如,在吸烟与白血病的研究中,可以从对照组中排除那些因为已知与吸烟有关的疾病入院的人。
也就是说,对照除了应具有和病例一致的某些特征而与病例具有可比性之外,同时还应注意对照不患有与所研究的疾病有共同已知病因的疾病。
例如,在研究吸烟与肺癌的关系时,不能以慢性支气管炎病人作为对照,因为吸烟同时是这两种疾病的可能病因;研究胃癌的病因时,不能以慢性胃炎病人为对照,因为二者的病因可能有密切关系,前者可能是后者病因链上的一环。
这样做的目的是为了减少混杂偏倚。
因此,以医院为基础的病例对照研究选择对照时应遵循以下原则:
(1)对照应由尽可能多的病种的病人组成,避免因过多地代表某一类病人,而该病种恰与所研究疾病具有共同的危险因素,从而影响研究结果的真实性。
多病种的选择对这种意外有一定的稀释作用;
(2)从新发病人中选取对照,避免研究的暴露因素受疾病迁延的影响;(3)不选择当前患有多种疾病的病人;(4)因已知与所研究的危险因素有关的病种入院的病人不能作为对照。
不同来源的对照要解决的问题不同,而且各有其局限性。
例如,邻居对照可能有助于控制社会经济地位的混杂作用;同胞对照可能有助于控制早期环境影响和遗传因素的混杂作用;配偶对照则主要考虑控制环境的影响。
为了保证研究的真实性,在选择对照时必须考虑对照的代表性、对照与病例的可比性、以及可能出现的选择偏倚等问题。
就对照而言,没有哪一种对照一定优于其他对照,不同的对照要解决不同的问题。
病例与对照和研究人群严格可比时,不存在选择偏倚。
当对照来自产生病例的源人群,而且是一个有代表性样本时,即可做到这一点。
这时研究人群不需要代表任何特定的人群。
3.以社区为基础的和以医院为基础的病例对照研究的比较(表5-2)
表5-2以社区为基础的和以医院为基础的病例对照研究各自的相对优点
以社区为基础的病例对照研究
以医院为基础的病例对照研究
(1)可以较好地确定源人群;
(1)研究对象的可及性好;
(2)容易保证病例和对照来自于同一源人群;
(2)研究对象更易合作;
(3)对照的暴露史更可能反映病例源人群的暴露情况。
(3)可以平衡病例和对照的背景特点;
(4)比较容易从医疗记录和生物标本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 病例 对照 研究 王建华