大数据分析在心血管疾病防治中的应用全文.docx
- 文档编号:25267247
- 上传时间:2023-06-06
- 格式:DOCX
- 页数:9
- 大小:123.02KB
大数据分析在心血管疾病防治中的应用全文.docx
《大数据分析在心血管疾病防治中的应用全文.docx》由会员分享,可在线阅读,更多相关《大数据分析在心血管疾病防治中的应用全文.docx(9页珍藏版)》请在冰豆网上搜索。
大数据分析在心血管疾病防治中的应用全文
大数据分析在心血管疾病防治中的应用(全文)
在过去的数十年间心血管疾病的防治取得了重大进展,与此同时对于心血管疾病防治策略以及预后和治疗费用等问题的关注度持续增加[1,2]。
由于用个体差异无法充分解释患者治疗和预后的不同,且医疗费用高也不一定带来更好的治疗或预后[3,4],因此如何降低医疗费用、提高疗效已经成为目前医学领域关注的热点。
"医疗学习系统(learninghealth-caresystem)",作为"证据指导实践,实践呼应证据"的良性循环系统受到国内外专家的推崇,而"实现医疗学习系统"的关键在于有效地运用数据。
目前用于指导"医疗学习系统"的有效数据正在迅速增长,随着电子健康病历、可穿戴装置、互联网数据、遗传学信息等数据资料的不断扩大,有效数据量呈指数级增长。
另外,计算机存储和数据科技的发展为实现快速分析大量繁杂的数据资料提供了可能。
有效数据增加,数据分析能力增强,加之对改善治疗和预后的迫切需求,医疗领域大数据分析应运而生。
心血管医疗领域的大数据分析定义为,通过对大量数据进行整合分析,识别各变量与疾病的相关性,并进行风险预测,最终改善心血管疾病的治疗和预后。
尽管在心血管领域中大数据分析有巨大潜力,但是目前缺乏通过大数据分析改善治疗和预后的证据。
本文将从大数据分析的来源与分析方法及其对改善心血管疾病治疗和预后的潜在应用价值和面临的挑战作一阐述。
一、大数据的来源
作为大数据研究的先驱,美国麦肯锡公司在其研究报告中给出了大数据的权威定义,大数据是指超出常规的数据库工具获取、存储、管理和分析能力的数据集,随着科技进步,数据集容量不断增加,根据所使用的软件工具和数据规模的差异,不同产业的大数据可以从几十到几千万亿字节不等[5]。
大数据具有容量(volume)、多样性(variety)、速度(velocity)、真实性(veracity)和数据价值(value)的特征,根据英文首字母缩写成"5V"[6]。
容量,指一个数据库中数据的总量,对于大数据而言,总量并没有确定标准,但大部分数据库至少应该包含一个拍字节(PB,1015字节)的数据[7,8]。
多样性,指来自多种资源的数据相结合,包括各种结构性或非结构性的数据类型。
速度,指整合和分析大数据集时获取及时信息的速度。
真实性,指由于数据本身的不确定性及来源不一致性,影响数据的质量及可信赖程度[9]。
数据价值,指数据价值密度低,大数据为了保证数据信息的完整性,直接应用原始数据,因此导致纳入很多价值不高的信息,使得数据信息的价值密度降低[10]。
理论上讲,大数据分析所用数据在数量和多样性方面并无限制。
在心血管疾病和整体医疗服务领域中,大数据资源主要包括行政管理数据库(如对服务和药品的需求)、临床注册数据、电子病历系统、人体计量生物数据(如从可穿戴装置或其他技术获得的数据)、健康普查数据、互联网数据、医学影像数据以及包含各种组学的生物数据(如基因组学、蛋白质组学和代谢组学数据)等(图1)。
近年来,上述数据以及其他各种潜在来源的数据迅猛增长,未来都可能整合到大数据的应用中[11]。
图1大数据分析的应用概况
二、大数据分析的方法
大数据分析一般指运用数据挖掘、机器学习或人工智能等数据科学方法,对规模巨大的数据进行分析[12,13]。
常用的方法包括聚类分析、决策树、贝叶斯网络、自然语言处理、图像分析、深度学习以及其他数据可视化方法[14,15,16]。
由于大数据分析注重的不是因果推断,而是相关性或存在于复杂数据中的模式,因此在特定预测因子未知的情况下,仍可通过寻找数据集模式进行相关性分析,这也是大数据分析的标志性特点。
但目前许多已发表的大数据研究仍然采用logistic回归等统计学方法,说明大数据分析的优势尚未在医疗健康分析领域中充分建立。
三、大数据分析在心血管疾病中的应用
大数据分析的目标是形成改善临床治疗和预后的策略。
而大数据分析的应用范围可以从个体化患者的治疗推广到指导大型健康医疗系统或公共卫生资源的有效利用。
1.建立预测模型:
在医疗卫生系统中,鉴别高风险或高医疗费用患者的风险预测模型是最常用的大数据分析工具,有助于提高治疗效率。
近年来有许多应用大数据分析工具预测心血管患者风险的研究(表1)[17,18,19,20,21,22,23],这些研究证实了其在预测模型方面的应用潜能。
2.患病人群管理:
尽管目前大数据分析在人群管理中的应用尚处于起步阶段,但其是大数据分析在健康医疗领域中的主要应用范畴。
患病人群管理通常定义为主动监测医院或者医疗体系中的患病人群。
"病例搜索"是指系统性搜索高危人群,而非被动的等待疾病发生。
以大数据分析工具在人群管理中的应用为例,在电子病历系统中,应用自然语言处理、机器学习或电子病历查找运算等方法,寻找潜在心血管疾病的高危人群,显示糖尿病等心血管疾病危险因素,同时监测其进展。
有研究证实,电子病历系统或大数据分析有助于发现心力衰竭征兆、症状或诊断心力衰竭的证据[24,25]。
另外,通过对来自植入型心律转复除颤器(ICD)的心电图进行评估,可分类和检测心律失常的类型[26]。
3.药物和医疗设备的监管:
大数据分析可用于药物和医疗设备的监管,其对大量电子病历、医疗设备、临床注册、社会媒体都具有评估潜力,对患者用药或所用医疗设备安全性记录的数据也具有评价能力[27]。
心血管疾病需要通过药物或医疗设备进行治疗,因此心血管疾病的治疗也是大数据分析监管的重点。
4.疾病和治疗的异质性:
心血管疾病种类繁多,同一疾病临床表现和伴随症状可有很大差异。
大数据分析通过评价各种繁杂数据,如电子病历、图像及"组学"数据,可显示疾病表型之间的区别,进而提示不同治疗方案。
通过机器学习和自然语言处理等大数据分析工具,实现"表型图谱"的绘制和对患者独特类型的定义,该领域具有广阔的研究前景[28,29]。
治疗方面的异质性、治疗反应的个体差异以及治疗的不同临床转归也是未来医疗健康领域的重要问题[30]。
5.规范性分析:
大数据分析还能通过规范性分析实现精准医疗和临床决策支持。
通过对药物治疗的风险获益进行评估,规范性分析患者的个体化药物治疗。
虽然目前还未见关于大数据分析工具在心血管疾病治疗中规范性分析的研究,但其潜力巨大。
在精准医疗中,大数据分析适用于复杂且数量庞大的组学数据,可促进组学与其他数据资源的整合。
整合分析基因型和表型数据有助于精准医学的发展[31],进而为患者提供精准的治疗方案,规避风险、优化获益。
在临床决策支持方面,大数据分析可通过分析来源于临床试验、观察性注册研究或电子病历等的数据[32],评估患者治疗的获益程度,建立预测模型,并植入到临床决策支持工具中。
6.公共卫生:
大数据分析在心血管疾病公共卫生领域中应用的研究较为少见。
有研究借助网络搜索电子烟应用的情况,间接反映与心血管疾病相关的健康产品的应用情况[33]。
大数据分析同时支持追踪心血管疾病危险因素与疾病,以及心血管疾病与空气污染等暴露因素间潜在相关性[34]。
地理编码数据作为大数据分析的资源之一,有助于改善社区医疗卫生资源。
大数据分析还能够将医疗数据与社会媒体完美结合,有助于更有效地发布公共卫生信息,促进公共卫生运动的开展,从而减少心血管疾病的危险因素[31]。
四、大数据分析应用的挑战
大数据分析虽然在医疗领域中具有巨大的应用潜力,但也面临着严峻的挑战。
1.证据基础:
目前大数据分析在心血管领域还处于起步阶段,研究尚主要关注在大数据分析的概念和潜在作用以及发展大数据分析工具的可行性上。
至今少有直接证据表明大数据分析能够或将会改善心血管疾病的治疗或预后。
2.方法学问题:
为了使大数据分析工具成功应用于心血管领域,大量研究提出了需要解决的方法学问题[35,36,37,38,39,40,41],包括数据质量、数据的一致性和稳定性、观察性数据的局限性,验证和其他分析的局限性,患者隐私、意愿以及其他法律问题。
数据质量:
如果数据质量较差,那么在使用大数据分析工具指导临床决策时就需要充分考虑其合理性。
在医疗领域中,大数据分析所用的大量数据存在严重局限性,尽管大数据分析方法对质量较差的数据具有一定容忍度,但是其临床效果很大程度上取决于临床数据的质量,只有临床数据质量较高时,得出的结果才会真实、稳定、有效,具有临床实用性[28,41]。
数据不一致性:
在医学领域中,由于缺乏数据标准,加剧了数据源中医学用词的不一致性。
观察性数据的限制性:
大数据依然避免不了观察性数据存在的内在局限性。
大数据分析是基于大量但并不完整的数据源,因此患病人群的抽样误差、无法估计的混杂因素以及治疗选择偏倚都会影响大数据分析工具的应用。
验证和其他需要分析的问题:
在临床治疗过程中,即使经过验证,大数据分析工具的表现仍然会有差异,包括数据缺失、预测模型过度匹配、多重比较、出现假阳性的风险等。
因此在使用大数据分析工具之前必须进行再验证。
患者隐私、意愿、数据安全性和其他法律相关注意事项:
大数据分析数据资源越来越丰富,我们需要充分考虑患者隐私及意愿、数据安全性以及其他与电子病历相关的法律问题。
在医疗领域应用大数据分析,法律和监督管理问题可能成为潜在的障碍,包括患者私人信息的泄露、非法使用患者信息,甚至用这些数据分类患者,有差别的提供医疗服务或者医疗资源。
3.临床整合和应用:
大数据分析工具的成功取决于如何与临床整合,然而目前的研究并未注意到这一点[42]。
与临床指南和风险评分类似,单独采用大数据分析难以改变心血管疾病的治疗和预后。
大数据分析工具面临着与其他临床技术相似的挑战,即如何在临床有效实施。
其也需要借助技术组合和资源整合到临床工作流程中,进而取得临床功效。
心血管内科医生对现有的风险预测模型或评分系统都十分熟悉。
然而,已有的心血管风险预测模型和评分很少应用到常规临床实践中,而且证据显示已有模型在改善患者预后方面的作用十分有限[43,44]。
大数据分析风险预测模型的应用是否会比传统临床风险预测模型更有效,目前还不明确。
但比起传统风险模型,大数据分析工具的数据规模更大、种类更多、在预测方面更加精确。
但由于大数据分析是采用所有可获得的数据建立模型,因此存在同义反复性风险。
例如,在门诊复诊率的大数据分析预测模型中,患者重复来访数是其主要影响因素,当某患者在门诊反复出现时,模型预示的复诊率升高,这种情况下该预测模型的临床实用性较差。
大数据分析的临床效用还需要进一步证实。
鉴于大数据分析容量巨大,应用者常会对基于大数据建立的风险预测模型过度信任。
实际上,大数据分析风险模型预测与现有的基于传统统计方法建立的临床风险评分模型具有相似的局限性,为了避免难以预知的后果,仍有必要加强对大数据分析模型的验证和校准。
目前许多已发表的医疗大数据研究应用的是非大数据分析的方法,即传统的统计学分析方法,而且是应用有限的变量建立的更具有临床意义的风险模型。
有研究比较了大数据分析与传统方法建立的预测模型的准确性,结果并未发现差异。
国外的医疗系统,如美国退伍军人医疗管理系统,同时应用大数据分析和传统方法来处理大数据[45];Amarasingham团队提出的电子医疗预测分析(E-HPA)概念也可同时应用大数据分析和传统的统计分析方法[40]。
总之,目前指导心血管疾病临床实践和研究的数据正以惊人的速度增长,大数据分析在改善心血管疾病治疗及预后方面潜力巨大。
行政管理、临床注册及电子病历数据之间相互融合越来越多;患者自我报告、社会媒体、生物计量、组学及其他数据资源也必将加入其中。
心血管医生和医疗行政管理人员在面对如此巨大的数据量时,如何将其用于临床管理,改善临床效果,是一个巨大的挑战。
大数据分析预测模型将通过识别高风险和高成本的患者,帮助心血管医生和医疗管理人员为患者制定个体化医疗方案和分配医疗资源。
大数据分析还能通过匹配治疗建议,评估治疗风险和获益,监测疾病进展,改善疾病表型,实现对患者个体化或群体的管理。
大数据分析不断推进精准医学的概念,并支持学习型医疗系统。
然而,大数据分析在心血管领域中的应用和发展尚不成熟,尚无证据表明其可降低医疗成本、改善治疗和预后,如何将其应用于临床实践的问题也没有受到重视。
单纯的大数据分析并不能改善治疗和预后,大数据分析工具应整合进临床治疗中才能发挥其临床实用性。
在应用大数据过程中,还要充分考虑大数据分析模型的可靠性和有效性等方法论问题,以及观察性数据内在的局限性,避免误导。
据中国互联网数据中心统计,目前我国的数据量占全球的13%,仅次于美国(32%)和西欧(19%),如何充分利用这一优势资源已成为我国各行业面临的重要挑战[46]。
以改善心血管疾病治疗和预后为目标的大数据时代才刚刚开始,相信未来大数据分析方法和工具将会进一步发展,大数据分析工具在心血管领域应用的相关证据也会越来越充分。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 心血管疾病 防治 中的 应用 全文