数据挖掘技术在中医方剂学研究中的应用.docx
- 文档编号:11054253
- 上传时间:2023-02-24
- 格式:DOCX
- 页数:8
- 大小:21.62KB
数据挖掘技术在中医方剂学研究中的应用.docx
《数据挖掘技术在中医方剂学研究中的应用.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在中医方剂学研究中的应用.docx(8页珍藏版)》请在冰豆网上搜索。
数据挖掘技术在中医方剂学研究中的应用
数据挖掘技术在中医方剂学研究中的应
用
(作者:
单位:
邮编:
)
【关键词】方剂学数据挖掘方剂配伍规律
数据挖掘是一种新兴的信息处理技术,它融汇了人工智能、模式识别、模糊数学、数据库、数理统计等多种技术方法,专门用于海量数据的处理。
数据挖掘亦适用于方剂配伍规律研究,一方面,方剂是集中医之理、法、方、药为一体的数据集合,具有以“方-药-证”为核心的多维结构。
从方名到功效、主治,再到药物组成、加减以及剂型、制法和服法等;药物组成又分君、臣、佐、使,以及剂量、气味、归经、升降;主治又有病、证、症之分。
数据之间环环相扣,交相关联,知识集约程度高,信息量巨大,这在技术上只有数据挖掘才能应付和处理。
另一方面,方剂配伍本质上表现为方与方、方与药、药与药、药与剂量,以及方药与证、病、症交叉错综的关联与对应。
配伍研究就是揭示这些关联与对应的模式性和规律性。
数据挖掘正是通过对数据特征、关系、聚类、趋向、偏差和特例现象的深层多维分析,来揭
示数据间复杂和特殊的关系,发现其隐含的规则模式和规律。
再者,方剂是中医辨证论治的完整体现,中医辨治充满非线性思维,“方-药-
证”间的多层关联、序列组合、集群对应,形成了整体论的思维方式和原则。
如何基于中医的理论思维来揭开方剂配伍的奥秘,这成为研
究取得突破的关键。
数据挖掘能以线性和非线性方式解析数据,且能
进行高层次的知识整合,又善于处理模糊和非量化数据,具有解决这一问题的技术特征和条件[1-2]。
1数据挖掘技术在中医方剂学研究中的运用
1.1数据库的创建
佟氏[3]建立蒙药方剂学数据库,按名称、别名、蒙名、藏名、来源、处方、成分数、功能、主治、用法、备注等条目收录了30种蒙
医药经典著作中的5600多条方剂。
其中大部分方剂是第一次译成汉文。
中国藏医药系列数据库[4]采用藏文视窗系统、藏文字处理软件等最新成果,利用先进成熟的数据库管理系统(SQLServer、
Access)、数据库编程工具(VisualBasic)和网络信息资源管理技术(Asp)首次实现藏药名称以藏、汉、拉丁文对照显示;采用多媒体技术,提供藏药材外观及重点部位的图片以及全文;可提供按字段以关键词检索;可实现多字段逻辑检索。
“中医方剂编码及文献数据库系统”[5]是江苏省科委自然
科学基金资助项目成果。
①本项目广泛收录了古今中医方剂文献,收
入方剂101903首,对每一首方剂,根据其药物组成、配伍特点、主治
病情等要素概括其基本作用,对全部方剂进行了功能、主治病证标引,以此统计出每一作用或治疗每一病证的古今方剂数量,并可以依此检
索和归纳任一同类方。
②数据库不仅可以通过索引进行方名、书名、药名、药味、功用、主治等内容的快速单位检索,还可以进行多项目综合检索和任一需要的模糊检索,并且具有很好的动态管理功能。
③以功效与主治病证为条件,为每一方剂编制一代码,使繁琐杂乱的中医方名得以用简明的数学语言表达,为中医药方剂语言国际化奠定了良好的基础。
韩氏[6]等探索将数据挖掘技术应用于中医方剂的证候判定中。
首
先对症状名称、证候名称进行了规范化,接着对证候判定标准进行了规范化,在规范化的基础上建立了数据库,从方剂配伍规律研究的内容和目标,到方剂数据挖掘的理论和技术依据,以及方法意义,进而通过科研实践和结果的示例,肯定了将数据挖掘技术引入到中医证候的研究中是可行的,是完善方剂主治证候的一个很好的方法。
方氏[7]等建立风湿病中成药数据库,并对单味药的用药情况、不同给药途径的用药情况、药物的功效分类及治疗原则等内容进行查询与统计分析。
1.2医学多元统计学
多元分析是定量分析事物复杂关系的一种数理统计方法。
目前,人们在中医药研究中运用的多元分析方法主要有聚类分析法、判别分析法、回归分析法、因子分析法、相关分析法等,多元分析在中医药研究中的应用日趋广泛并凸现其重要性。
1.2.1聚类分析法
聚类分析是研究“物以类聚”的数理统计方法。
聚类是数据挖掘的前期工作之一,通过对有关数据的不同角度类分,为进一步分析提供证据。
如蒋氏[8-9]等对从《中医大辞典•方剂分册》中筛选出1355首脾胃方所含的414种药物,按照数据挖掘技术中的聚类分析、对应分析和频繁集方法,分别采用系统聚类和模糊聚类,从功效、归经、药性和药味等方面进行了分类特征分析,并就脾胃方的核心药物、方剂结构、药对、药组和“方药证”的对应关联方面形成了有关技术规则和处理程序。
聚类的统计值是各统计指标的距离,没有考虑中药传统的分类规范,由计算机自动完成,基本是客观的。
女口:
根据药物性味的聚类,脾胃方所含中药分为37类。
122判别分析法
判别分析法是根据某些指标的观测值对所研究的对象判断其归
属类别的一种统计分析方法。
王氏[10]等采用复杂系统涌现性原理及其分析判断方法对方剂配
伍规律研究相关复杂系统的涌现性及其产生机制进行了分析,表明方
剂形成过程中的多个环节对方剂的最终表现形式都有影响。
由于方剂
形成过程中症状、治则、治法、药性组合、药味等各个环节的差异,
导致了方剂本身的多样性。
方剂的配伍规律表现在其形成过程中各个环节的规律,当对某一个环节的规律进行研究时,应该充分考虑其他环节对这一环节的影响。
而方剂配伍规律的阐明需要多个环节、多个
角度研究结果的有机融合。
123回归分析法
回归分析是研究随机变量之间的统计相关关系的一种数理统计方法。
孙氏[11]等运用信息熵的方法,对中国古代中风病的中医文献进行证候与方剂相关性的定量分析,确定证候与方剂之间的关联度。
方法:
熵可以度量任意形式变量的不确定性,基于熵的关联度法可以度量任意统计相关性,包括线性和非线性,将其用于解决证候与方剂的相关性问题。
结果:
通过关联度方法、logistic回归分析和相关系
数3种方法的分析,可以看出某些中医证候与方药之间具有一定的相关性。
结论:
通过对200例中风患者的古代医案的分析,表明用基于熵的关联度法来定量分析证、方之间的相关性是可行的。
1.2.4数据仓库专业的分析工具联机分析处理
秦氏[12]等给出了一种基于数据仓库对中医方剂进行分析、处理
的模型,首先通过中药和病症数据仓库专业的分析工具一一OLAP产
生中药和病症数据分析结果,然后通过数据绑定技术,把产生的分析结果与方剂数据连接,再通过综合分析揭示方剂和其针对的症状之间的内在联系。
该模型的主要思想是在构建方剂、中药和病症数据仓库的基础上,通过对数据仓库内部各种关联和映射关系,充分利用中药
和病症数据仓库的OLAP功能,使基于海量数据的综合分析系统做到快速、准确地反应。
1.2.5关注频繁项
何氏等[13]用数据挖掘技术研究了中药方剂配伍的规律。
引
入了关注频繁项概念,提出并实现了基于位图矩阵和双支持度技术的BM-DB-Apriori算法来查找药对、药组。
位图矩阵技术使得在找频繁k-项集时无需对数据库扫描,双支持度确保频繁项集中不包含那些因太频繁而失去意义的项集。
以脾胃方剂库为对象分别使用BM-DB-Apriori和Apriori两种算法进行实验,实验表明,BM-DB-Apriori算法能够更快速、更准确地挖掘出药对和药组。
1.3人工智能方法
由于传统的医学统计方法具有局限性,研究者们开始尝试运用模
糊智能技术探索中医证候分类及疗效评估的方法,应用数学建模、神
经网络基于案例的推理、图像处理、遗传算法、智能数据与时序分析模式识别等多种技术深入地研究某种疾病,以建立更为实用、高效的疾病诊断智能系统。
同时对疗效评价、方案选优之类的问题进行辅助决策,充分发挥了数值分析的优势,即定量和定性的分析[14]。
1.3.1模糊数学模型应用
针对中药作用的有关高维空间小样本数据,李梢课题组建立了模式识别、模糊综合评判等方法,应用于评价中药不同配比的分析与优化、寒热方剂的综合作用等方面,取得了较好效果。
通过中药不同配比生物效应的分析,发现适当的配比可以提高疗效,配比不当反而会降低药物各自的疗效,不同配比间存在着非线性关系;以“同病异治”为切入点,发现寒、热方剂在不同环节上均能有效地阻抑炎症动物模型的早期病变,并能够在调控疾病相关基因表达及表达产物上发挥一
定的作用;从“方证相关”的角度出发,寒、热方剂干预机体所引起的部分生物分子的节律变化与寒、热证候临床特征的动态演变具有共同的节律模式。
这提示不同药性配伍方剂的综合效应也具有与证候相关联的时、空特性[14]。
132基于神经网络的运用
雍氏等[15]采用高维数据归约由药物判定方剂功效,探讨以药物高维数据归约方法判断方剂功效的可行性。
方法:
以《中医类方辞典》的方剂为样本数据,将组方药物的数据量化,采用单纯的人工神经网络方法(ANN)和人工神经网络方法结合属性距离矩阵的高维数据方法(SARM),分别由药物判断方剂功效。
发现其准确率分别是87.524%
92.287%,完整率分别为70.346%83.868%。
提示SARMfe相对传统ANN法,在准确率和完整率上均有大幅提高。
结论:
采用人工神经网络方法并结合中医先验知识由药物判断客观方剂功效是可行的。
2评述和展望
方剂有其独特的配伍规律,但所涉信息量巨大,而配伍规律实际上就潜藏在这些错综复杂的方剂变化之中。
对这种海量信息的处理依靠传统方法是不现实的,为此我们必须采用最前沿的现代信息处理技术一—数据挖掘方法,对方剂进行全面和系统的分析。
应用方剂的预处理、专用数据库的研制、数据挖掘方法(频繁集、对应分析、聚类分析等)可能从中发现一些与通常用药不一致但值得进一步研究的配伍现象。
以确有疗效、成分明确的中药组合为探针,可望开启复杂病证研究中
“以药测病”、“以药测证”的思路。
重点解决方剂如何调节病证相关
的复杂生物系统,可望阐发中药方剂的整合调节作用等核心问题。
当前,在中医领域数据挖掘应用最广泛的是中药(复方)的研究,并已经取得了一定的进展。
在新药研究、开发过程中,先导化合物的发掘是关键环节。
以前主要使用的是随机筛选与意外发现的方法,
此法曾取得过一定成效,但是效率很低。
因此,需要应用数据挖掘及知识发现去寻找先导化合物,指导中药的研究和开发,缩短中药研究开发的周期。
以往中药复方新药的开发基本是临床医生利用自己的知识和经验进行组方,并将其用于临床进行验证,获得较好疗效后,再进行药理学、中药化学等方面的研究,这是一种经验开发模式。
最近,利用数据挖掘和知识发现(KDD)技术开发研制中药复方的工作已受到中医药界的广泛重视。
还应该从统计数学方法的角度对名中医的方剂配伍特征和类方予以量化。
在方剂配伍规则研究中,计算机所得出的结果必须依靠领域专家用领域知识对其进行去粗取精、去伪存真的加工,
从中找出真正有用的知识[16]。
【参考文献】
[1]蒋永光,李认书,黎勇.试论中医方剂信息的数据化
[J].中国中医药信息杂志,2001,8(12):
80-81.
[2]李文林,赵国平.数据挖掘技术及其在中医药领域的应
用[J].中华医学图书情报杂志,2004,13(6):
4-6.
[3]佟玉清,建军.蒙药方剂现代化研究与信息技术[J].中国民族民间医药杂志,2006,79:
69-71.
[4]马建霞,孙成权,李可立,等.中国藏医药系列数据库建设与发展[J].图书情报工作,2004,(11):
98-100.
[5]于川.信息技术在中医药领域的应用评述[J].医学信
息,2006,19(12):
2074.
[6]韩佩玉,陈颖,曹莉,等.基于“症-证”关联的方证判定研究[J].辽宁中医杂志,2005,32(12):
1253-1254.
[7]方勇飞,钟兵,王剑莉,等.中药成方制剂中风湿病相关
方剂数据库的建立与处方分析[J].中国药房,2003,14(11):
667
670.
[8]蒋永光,胡波,刘娟,等.方剂配伍的数据挖掘可行性探索[J].四川中医,2004,22(8):
25-28.
[9]蒋永光,李力,李认书,等.中医脾胃方配伍规律的数据挖掘试验[J].世界科学技术一一中药现代化,2003,5(3):
33-37.
[10]王耘,张燕玲,郭亦然,等.应用涌现性原理研究方剂
配伍规律[J].中国临床康复,2005,9(21):
155—157.
[11]孙占全,刘艳骄,西广成,等.证候与方剂相关性的研究
[J].中国中医基础医学杂志,2006,12
(2):
150—152.
[12]秦首科,牛孺子.利用数据仓库分析处理中医方剂评析
[J].中医药学刊,2002,20(3):
341,359.
[13]何雁,谢文光,罗晓健,等.试述方剂配伍规律统计分
析数据库[J].江西中医学院学报,1997,9
(1):
27.
[14]张琴,刘平,张文彤.数据挖掘技术在中医证候学研
究中的应用[J].上海中医药杂志,2006,40(3):
3—5.
[15]雍小嘉,彭京,宋姚屏.采用高维数据归约由药物判定
方剂功效[J].上海中医药大学学报,2006,20
(1):
54—56.
[16]崔蒙.计算机辅助方剂配伍规则研究[J].中国中医药
信息杂志,2004,11(7):
565—566.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 技术 中医 方剂学 研究 中的 应用