第6章 精神病学的循证方法.docx
- 文档编号:3741713
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:14
- 大小:38.07KB
第6章 精神病学的循证方法.docx
《第6章 精神病学的循证方法.docx》由会员分享,可在线阅读,更多相关《第6章 精神病学的循证方法.docx(14页珍藏版)》请在冰豆网上搜索。
第6章精神病学的循证方法
第六章精神病学的循证方法
第一节什么是循证医学?
循证医学(evidence-basedmedicine,EMB)是一种获取关于病因、诊断、预后和治疗等重要临床信息的系统方法。
循证方法是指应用以下步骤的一种过程:
●制订一个可回答的临床问题;
●识别最佳证据;
●细致评估证据的真实性和实用性;
●实施调查结果;
●评估成果。
循证医学的原理可以应用于各种医疗过程。
目前循证医学在精神病学中的主要用途是评价治疗性干预的价值。
因此以下各节中循证医学的应用将联系治疗的研究。
而在诊断和预后等其它领域中的应用将在以后讨论。
一、为什么我们需要循证医学?
循证医学的应用将有助于解决与临床实践相关的两个主要问题:
●很难与临床和科学进展保持同步;
●医疗工作者以自己特有的且未被已有证据证明合理的方式工作的倾向性
由于临床科学杂志的数量急剧增长,最勤奋的医生也不能掌握即使是他自己的领域所有相关的文章提供的最新动态。
因此临床医生不得不依赖其他渠道汇集起来的信息,比如可能包括:
非系统性的专家综述、同行意见、来自医药代表的信息、以及他们自己的临床经验和观点。
这样使医疗实践五花八门,比如那些关于电抽搐治疗和各种药物治疗的描述(Pippard1992;Lehman和Steinwachs1998)。
二、证据的类型
循证医学的基本假设是某些类型的证据优于(也就是,更为合理有效和临床适用性更强)其他证据。
关于治疗的问题最易详细阐明这一观点。
表6.1列举了常用的证据“等级”。
表6.1 治疗性研究的等级
Ⅰa来自随机对照试验的系统评价证据
Ⅰb 来自至少一篇随机对照试验的证据
Ⅱa 来自至少一篇非随机的对照试验证据
Ⅱb 来自至少一篇其他类型的半试验研究证据
Ⅲ 来自非试验性的描述性研究的证据,如对比研究、相关性研究和病例对照研究
Ⅳ 来自专家委员会的报告或意见和/或权威者的临床经验的证据
在这个等级中,随机性的证据比非随机性的证据更为可靠,而随机试验的系统评价被认为是以可能的最客观方式解答临床问题的金标准(见Geddes和Harrison,1997)。
这个假设本身还须进行系统验证,但在目前看来似乎是正确的。
有必要训练临床医生在把评价结果用于临床实践之前对系统综述进行严格评价(见后和Greenhalgh,1997)。
第二节单个的治疗研究
一、真实性
评价治疗性研究真实性的关键是随机化。
此外,医生把患者纳入到治疗性试验时不应知道患者被分配到了哪一治疗组。
这通常被称为随机名单隐藏。
没有被隐藏的随机化,研究的真实性就值得怀疑,其结果可能具有误导性。
以下是评价研究质量的其它要点:
●是否所有参加试验的患者都纳入了最后的结论中?
●患者是否在他们被分配的组中进行分析的(所谓“意向性分析”,“intentiontotreat”)?
●对患者所接受的治疗,是否对患者和医生都采取了盲法(这是不同于盲法分配的另一个问题)?
●除了试验性治疗措施以外,各组接受的其他治疗是否均等?
●随机化的过程是否使各组基线情况相近?
二、结果的表示
(一)比值比
当临床试验的结果是一个事件(比如入院)时,常用于评价效果的指标是比值比(oddsratio)。
比值比是某事件发生在试验组的机率与发生在对照组机率的比值。
通常取95%的可信区间(表示我们有95%的把握性真实值会落在该区间)。
可信区间越窄,研究的精确性越高。
如果某个事件如入院的比值比是1.0,这意味着对照组和试验组的入院率没有差异。
因此,如果一个研究的比值比的可信区间包括1.0,那么该研究就没能显示出试验性治疗和对照治疗之间的差别。
(二)效应值
在很多研究中,评定结果的指标是连续性变量,如Hamilton抑郁量表的平均分。
在荟萃分析(meta-analysis)中尽管也可以使用原有指标,但更常估计效应值(effectsize),因为其更具统计学效能。
效应值是通过将试验组和对照组的标准差相除来比较二者的效果差异而获得。
对效应值的临床解释在下文讨论。
三、干预的临床效用
危险降低值和需要治疗的人数
循证医学的一个重要部分是使用随机试验来获取干预措施针对每个患者的治疗效果。
当评价一种治疗的价值时,一个有用的概念是绝对危险降低值。
这是比较试验组和对照组的出现某种有明显临床意义的负性结果(如临床复发)的比例。
它们分别被称为试验事件发生率(theexperimentaleventrate,EER)和对照事件发生率(thecontroleventrate,CER),以百分率来计算。
两个发生率的差值即是绝对危险降低值(theabsoluteriskreduction,ARR)。
ARR可以被转换成更有临床实用性的数值——需治人数(numberneededtotreat,NNT)。
NNT是ARR的倒数,它告诉我们为减少一次负性结果发生需要治疗的患者人数(见专栏6.1)。
和比值比一样,也常给出NNT的95%可信区间(见Geddes和Harrison1997)。
专栏6.1将研究结果转化为临床实践的指标
试验组治疗,X对照组治疗,Y
阳性结果ab
阴性结果cd
对照事件发生率(CER)=b/(b+d)
试验事件发生率(EER)=a/(a+c)
绝对危险降低值(ARR):
治疗X和Y阳性结果比例的差值=(CER-EER)
比值比(OR):
治疗X和Y获得阳性结果的机率之比=(a/c)/(b/d)=ad/bc
需治人数(NNT)——多少例患者需要采用治疗X来获得比采用治疗Y的预期多一次阳性结果(=1/AAR)
摘自Geddes和Harrison(1997)
1.实例
Paykel等(1999)将158名重型抑郁发作后有残余抑郁症状的患者随机分到临床治疗组或临床治疗合并18次认知行为治疗(CBT)组。
经过68周后,CBT治疗组的复发率(29%)显著低于临床治疗组(47%;P=0.02)。
CBT组复发的绝对危险降低值(ARR)是47%-29%=18%。
需治人数(NNT)是这一数值的倒数,大约是6(通常NNT采用整数,把小数点后的数值升入到前一位)。
这表示需要用CBT治疗6名有残余抑郁症状的患者才能防止1例复发。
通常NNT小于10提示有效的治疗结果。
然而对NNT的解释也取决于治疗的性质及疗效和副反应的程度。
一些常见精神疾病治疗的NNT见表6.2。
表6.2精神病学中干预措施的需治人数(NNT)举例
干预措施结果NNT
厌食症的认知治疗
缓解
2
冬季抑郁的光疗
临床有效
2
难治性抑郁的锂盐增效治疗
临床有效
4
氯丙嗪治疗精神分裂症
预防复发
4
精神分裂症的家庭治疗
一年复发
7
SSRIs和TCAs治疗急性抑郁的比较
维持治疗6周
33
SSRIs:
选择性5-羟色胺再摄取抑制剂;TCAs:
三环类抗抑郁药
如果一种干预措施的结果指标是一个有益事件(比如康复)而不是需避免的一个负性事件,则干预的效果计算为绝对受益增加值(absolutebenefitincrease,ABI),方法类似ARR(见前),同样计算NNT。
与NNT相关的一个概念是副反应需治人数(numberneededtoharm,NNH),它用于描述特定疗法发生毒副反应的危险,比如抗精神病药导致的锥体外系反应。
2.从比值比计算NNT
如果一个研究或荟萃分析提供了比值比,那就可以计算出可能与临床医生及其患者的临床处境更为相关的NNT。
例如在上面的例子中,相比临床治疗组78名患者中35名复发,CBT组中80名患者23名复发。
这里两种治疗手段复发风险的比值比是0.49。
为了从比值比计算NNT,需要知道或估计对照组的预期复发率。
这就是患者期望事件发生率(patientexpectedeventrate,PEER)。
下面是从比值比(OR)计算PEER的公式:
如果我们把上面研究中临床治疗组患者的复发率(45%)代入公式,得到:
NNT=
NNT的结果大约是6,同一结果也可以从涉及ARR的其他计算方法中得到。
然而如果我们从当地记录中得知我们自己治疗有残余抑郁症状患者的复发率大约是20%(而不是Paykel等的45%),使用以上的公式,NNT变成约11。
这表示在我们自己的治疗中,我们需要用CBT治疗11名患者来减少1名复发。
采用这种方式,比值比可用于根据当地医疗水平核算NNT值,由此帮助决定干预措施的适用性(见Freemantle和Geddes,1998)。
3.效应值的临床相关性
与比值比一样,效应值也不易从临床角度解释。
一个有用的方法是使用效应值来估计对照人群和被试人群之间的重叠程度。
用这种方式,我们可以得到对照组中分值低于试验组的比例。
(负的效应值仅仅表示对照组的分数高于试验组。
)
例如,在一篇关于苯二氮卓类药物和唑吡旦与安慰剂相比对总睡眠时间的影响的综述中,Nowell等(1997)发现总体效应值是0.71。
从正态分布表中,这表示76%的对照人群总睡眠时间少于催眠药治疗患者的平均睡眠时间。
效应值大小的分类如下:
0.2=小
0.5=中等
0.8或以上=大
相对安慰剂,抗抑郁药的效应值约为0.4-0.5。
Furukawa(1999)设计了一种列表方法将效应值转化为NNT。
根据抗抑郁剂治疗患者的疗效水平排序(安慰剂组的有效率约为30%,试验组的有效率约为60%),0.2的比值比相当于NNT是10。
当效应值是0.5时,NNT则降至5。
四、治疗性试验的伦理学观点
(一)随机化
正如我们已经了解到,随机化是实施循证临床试验的一个关键过程,因为它是避免因机遇和随机误差而产生偏倚的最好方法。
但是,一个临床医生可能对随机化感到不安,比如当他坚信某种被评估的疗法的效果时。
当对个体的最佳治疗确实还不确定时,随机化是符合伦理的。
事实上,循证医学显示许多对治疗性干预措施的疗效坚信不疑的观念是建立在前人的经验而非系统的证据之上,而临床医生可能对此认识不足。
(二)安慰剂的使用
在精神药物试验中使用安慰剂是有争议的。
但是许多药物认证机构在认可药物,如一种新的抗抑郁药之前都要求此类试验。
有人总结了在抗抑郁药物试验中使用安慰剂的争论(见Miller,2000):
●重型抑郁中的安慰剂效应是各种各样和不可预测,其效果等同于积极治疗的疗效的情况并不少见。
●需要安慰剂来确定新型抗抑郁剂的疗效。
仅与积极治疗对比从方法学上并不充分。
●在抗抑郁剂的开发中缺乏安慰剂对照的设计可能会导致无效药物在市场推广,最终有损公众健康。
这些争议不得不考虑到在抑郁症的治疗中抗抑郁剂通常总比安慰剂更为有效。
因此,在随机试验中接受安慰剂治疗的患者没有接受到现有的最佳治疗。
试图处理这种情况的一种方法是在试验中确保患者处于密切的临床监测下,当情况不佳时及时退出研究。
(三)知情同意
知情同意的作用在随机和安慰剂对照的试验的伦理上十分关键。
这在某些精神障碍使患者的判断能力和决定能力可能受损时,会出现困难。
Miller(2000)列出了数条重要因素:
●患者需要被特别告知试验并不是为他们个体的利益而进行的。
●由于有安慰剂治疗,需要详细说明接受安慰剂治疗的可能性,可能出现的病情无改善结果和症状恶化的可能性。
●不能给患者任何的压力或诱惑。
●患者有权在任何时间退出研究并且不会有任何不利。
●除研究者以外,还应鼓励一名家庭成员或其他适当人选密切注意患者的情况并及时把相关问题报告给研究者。
因此,要点是和患者及其家属公开、清楚地享有信息,采取所有可以避免安慰剂可能有害于个体的措施。
但是这个观点仍有争议(见Lavori,2000)。
第三节系统评价
一、真实性
系统评价的目的是获取所有关于某种特殊疗法或干预措施的真实证据,并由此对该疗效进行更准确的量化评估。
两方面的进步极大增加了系统评价的可行性:
第一,电子数据库的存在,如Medline和Embase;第二,新统计技术的发展使得不同的研究结果可以以量化的形式整合起来。
因为Meta分析利用了所有可得到的有效数据,它的统计效能大于单个的研究;因此也许它可以显示一个未在单个的随机研究中显示出来的,疗效中等但有临床意义的结果。
像单个的治疗研究一样,对治疗的系统评价也必须进行真实性和质量的检验。
以下的问题应予考虑:
(一)是否是对相关和随机研究的系统评价?
我们已经知道循证医学的首要任务是提出一个明确的问题。
因此有必要确定系统评价的题目是否与需要解决的治疗问题有关。
下一步是确定纳入的都是随机研究。
混杂了随机和非随机研究的系统评价可能产生误导的结果。
(二)作者是否描述了寻找相关试验的方法?
虽然电子检索为找出临床试验提供了极大的方便,但由于错误编码可能使达半数的相关研究被丢失。
因而作者有必要澄清在电子检索的同时有没有手工检索相应的杂志作为补充。
例如他们还可能与试验的作者以及药厂的相关小组进行了联系。
通常阴性结果比阳性报道得少,这可导致对特定治疗的效果错误的乐观结论。
(三)作者如何决定哪些研究应纳入系统评价?
在系统评价中,作者必须决定所找到的众多研究哪些应纳入总体分析。
这表示阐明根据以上总结的因素确定的明确质量评测。
因为这些判断有一定的主观性,故需要由至少两名研究者独立完成。
(四)不同研究间治疗性干预的结果是否一致?
我们常看到来自不同研究的治疗性干预措施的疗效差异。
然而,如果疗效是混杂的,即一些研究显示较高的临床疗效,而另一些研究却认为一点效果都没有,这些试验就被认为有异质性。
有时异质性可解释为药物治疗的剂量较低或患者的个体差异。
如果异质性很难解释,那么评价的结果就令人怀疑。
二、结果的表示
(一)结合比值比
荟萃分析的结果常表示为“森林图(forestplot)”,它是把各种研究的发现以图表形式表示(图6.1)。
如前所述,研究的结果以比值比的95%可信区间表示。
图6.1积极的社区治疗(activecommunitytreatment)对入院比值的影响(引自Freemantle和Geddes1998)
pooledoddsratio=汇总比值比,fixedeffects=固定效应,randomeffects=随机效应
荟萃分析的目的是结合所有研究的比值比或效应值得到一个治疗效果的汇总估计值(pooledestimate)。
这不是简单的将所有的比值比取平均数,而是经过加权处理使那些含有更多的统计学信息和精确性更高(可信区间更窄)的研究在最后的结果中占更大的比例。
汇总的比值比(pooledoddsratio)也有95%的可信区间。
同样如果可信区间覆盖1.0,试验性干预措施和对照组则没有区别。
在图6.1中,一些研究显示积极的社区治疗(ACT)有明显的疗效,而另一些研究却显示没有。
两个汇总分析难于解释,因为其中之一(固定效应模型)的可信区间并没有覆盖1.0,使得ACT明显与对照不同,而另一个(随机效应模型)刚好覆盖1.0,位于有统计学意义的边缘。
我们已经知道一个荟萃分析中的研究可能具有异质性。
可以用χ2检验从统计学上进行验证。
如果异质性显著,最适合的荟萃分析是汇总随机效应模型。
这个模型假定不同的研究中会产生不同的效果,并把它纳入汇总的估计值中。
这通常会使ACT研究中的汇总随机比值比的可信区间增宽。
如果研究提示了单一人群的治疗效果(即缺乏异质性),那么汇总治疗分析应使用固定效应模型。
然而这个估计值的可信区间更窄,也许在异质性显著时会产生误导。
在图6.1中,研究之间有统计学上的显著异质性,检阅数据发现有效的结果主要来自两个并非最大的研究。
在预防复发方面,随机模型和固定效应模型认为ACT的效果相似,但随机模型可信区间更宽,如前所述,刚好覆盖1.0。
由于研究的异质性,随机效应模型更适于分析数据。
因此,从整体上我们对ACT的疗效可降低再入院率的结论将持慎重态度,除非我们能找到解释研究结果差异的令人信服的原因(见Freemantle和Geddes,1998)。
(二)效应值
如前所述,如果结果是连续性变量,常用计算结果的方法是用效应值。
效应值和比值比一起能给出精确度更高的汇总估计值。
三、临床效用
荟萃分析的临床效用评定和前面所述的对单个研究的评定一样。
荟萃分析常可为NNT提供数据。
然而如上所示,也可从荟萃分析数据中使用ARR或比值比来计算NNT.
四、荟萃分析存在的问题
(一)偏倚
除了系统的评定证据,Meta分析的目的是把多个研究的数据综合起来对治疗效果给予一个总的评估。
数种方法都会导致评估结果有误导性:
●发表偏倚证据显示阳性治疗效果的研究比阴性结果的研究更易被发表。
如果阴性结果的研究没有纳入荟萃分析,将治疗的效果将会被夸大。
●多重发表正如阴性治疗结果的研究可能不被发表一样,阳性结果的研究可能以不同的形式被发表数次,有时甚至以不同的作者名义发表。
如果多次纳入同样的研究,这同样会导致治疗的效果被错误评定。
♦研究的异质性如前所述,由于单个研究的设计、质量和患者人群的不小差异,其研究结果可能相差甚远。
如果荟萃分析时没有认识到这种异质性并予以考虑,将会产生错误的结论。
1.荟萃分析的精确性如何?
已有一些著名的事例关于荟萃分析的结果被随后的单个大规模随机试验推翻。
比如,一个荟萃分析显示静脉注射镁可以改善心肌梗塞患者的预后,这一结果后来被一个包括58000人的大规模随机试验明确地推翻了。
这个荟萃分析错误的结果后来被解释为发表偏倚、小规模研究的方法学质量差和临床异质性所致(见Greenhalgh,1997)。
这一领域的综述通常认为就治疗效果的方向而言,80%的荟萃分析与单个的大规模试验结果一致,但是两种方法在疗效的大小和统计学意义上常有差异。
同样对同一治疗干预措施的独立荟萃分析也可能会有甚为不同的结论(见Naylor,1997)。
2.漏斗图
提高荟萃分析可靠性的方法之一是使用“漏斗图”。
漏斗图是基于以下设想:
研究的样本量越大,对治疗效果评估的精确性(可信区间)也越高。
因此,大样本研究的效应值应该聚集在试验组和对照组的总体均数差周围。
相反,来自小样本研究的结果在均数周围应更分散。
这意味着当根据单个研究的比值比或效应值绘制其精确度的点图时,其结果构成一个对称的倒置漏斗(漏斗图)。
从图上看到的有统计学意义的偏差提示荟萃分析可以存在偏倚,在接受结果时应慎重(见Egger等1997)。
3.大样本的随机试验
如前所述,荟萃分析的优点在于通过综合单个研究,收集到足够的患者人数以检测出效果中等、但有重要临床意义的治疗手段。
另一个检测中等程度治疗效果的方法是随机分配非常大数量的患者到一个研究中。
这些大样本的试验(或mega-试验)的优势胜过荟萃分析,因为所有患者可以被分配到同一试验设计中。
这样的研究需要众多的协作者,因此它要求研究设计简单而且终点明确。
这种方法学曾经很成功地应用于医学的某些领域,如心血管疾病,在这些领域干预措施有时会比较简单(如每日一片阿司匹林),终点(心肌梗塞或死亡)也被明确定义(见Collins等,1996)。
对于精神病学的挑战在于将这样的方法学用于干预措施更复杂而终点更模糊的情况。
(二)适用性
将随机研究和荟萃分析的证据应用于日常的临床工作的一个常见问题是临床试验常常是在“理想”的状况下进行的,这在很多方面与日常的临床工作不同:
●患者群体在对照研究中的患者病情较轻,合并症少,有别于临床患者。
因此试验人群也许事实上并不能代表通常的患病人群。
●监督水平在药物试验中,通过频繁地检查和监督来定期监测是否协调一致。
因此在常规治疗中不会服用很长时间的药物(如三环类抗抑郁剂),也许会比在常规的治疗有更好的耐受性。
●治疗者差异尤其在心理治疗中,治疗可能由技艺高超和经验丰富的治疗者进行。
在日常医疗实践中,这样的治疗者也许很少,因此来自心理治疗试验的结果可能不能很好的应用于日常的临床工作中。
实用性试验
为了克服这些局限性,有人提出实用性试验(pragmatictrials)可能更适合对精神干预疗效的研究。
这类研究志在“真实生活”环境中进行随机试验。
从方法学上它们和先前提及的mega试验有很多共同点,因为它们也被设计用于回答简单且重要的临床问题。
实用性研究尽可能地在日常临床环境中进行。
实用性研究需要大量的研究对象以精确评估益处,以及简单的相关的终点以取得最大的随访率和临床实用性。
例如,在一个对精神分裂症的治疗干预试验中,由患者及其家属通过一个简单量表对病情的评定也许比使用一个标准化量表的分值更有临床意义(见Hotopf等,1999)。
第四节循证医学的应用
一、对单个患者应用循证医学
在已经拥有一个治疗性干预的最好证据并确定它是有效的和实用的之后,医生需要确定是否可用于自己的具体患者。
大范围而言,这取决于对前面所列的“适用性”问题的回答。
主要问题是:
●与那些随机试验中患者的类似程度如何?
●当地的医疗服务机构能否成功地提供这项干预措施?
(如果没有经过训练的治疗者,建议个体治疗是没有用的。
)
●在决定实施过程中,如果可以得到相关信息,那么根据当地医疗条件调整NNT是有用的(见前面)。
二、在服务中应用循证医学
我们已经知道有不同的随机试验以适应不同的目的。
Haynes(1999)提出了以下分类:
●效能干预是否是在严格控制的(“理想的”)条件下进行?
●效果当提供通常的卫生保健工作环境时干预是否有效?
●效率与干预耗费的资源相比,它的效果怎样(成本-效果或成本-收益)?
理想的情况是,循证医学的全面实施将涉及所有这些过程,而且仅仅使用那些满足效能、效果和效率这三个条件的干预措施。
在实践中许多精神科的治疗性干预措施(尤其是药物治疗和认知-行为治疗)效能是已知的但我们缺乏关于效果和效率的明确证据。
例如锂盐治疗对双相障碍的预防是有效能的,但它的效果却令人失望,主要因为在临床中很少有患者能坚持服用锂盐。
临床实践指南
在一些医学领域中,尽管存在大量不同种类的证据,但关于最好的治疗手段仍有许多临床不确定性。
在这种情况下,有必要制定明确源于循证的临床实践指南。
这些指南最好通过下列方法制定:
●一个指南制定小组,它包括涉及多学科的小组和患者代表,决定需要解决的确切临床问题。
●系统地评价已有的证据,根据表6.1所示的等级分类。
●指南制定小组提出建议,并明确的阐述他们的建议是如何与已有的证据相关联的。
临床指南最好是在国家水平由适当的专业机构制定,但通常需考虑当地医疗水平作出调整。
只有当指南被积极地传播和实施时,指南才是有效的。
有一些随机研究的证据显示指南能改善患者预后(见Geddes2000)。
第五节循证医学的评估
循证医学就象我们前面描述的治疗抑郁症的指南那样,需要通过随机试验评估其效果。
单个的行医者也可以通过以下步骤评估他们实施循证医学的情况:
●记录他们遵循证据做出的临床决定所占的比例;
●认识需要进行一个研究和评价相关证据在实践中的差距;
●记录循证实践改变的效果。
这样,循证医学就变成一个不断专业发展和记录循环的过程。
第六节循证医学的其它应用
前面主要集中于讲述应用循证医学评估精神病学中的治疗干预措施。
循证医学的其它应用包括对诊断、预后和病因的相关证据进行评价。
这些应用需要有和前面讨论的随机试验颇为不同的方法,诊断和预后将在本章的余下部分讨论。
病因学的方法已在第五章中讨论。
和治疗性问题一样,所有这些应用将开始于这样一个问题,它必须:
●和确定的问题直接相关;
●创立方式有助于寻找准确答案(见Geddes1999,表6.3)。
一、诊断
如果我们试图评价一个评定诊断性测验的特定研究的价值,评
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 精神病学的循证方法 精神病 方法