多元统计分析方法在中药质量评价中的应用Word格式文档下载.docx
- 文档编号:14255394
- 上传时间:2022-10-20
- 格式:DOCX
- 页数:6
- 大小:21.27KB
多元统计分析方法在中药质量评价中的应用Word格式文档下载.docx
《多元统计分析方法在中药质量评价中的应用Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《多元统计分析方法在中药质量评价中的应用Word格式文档下载.docx(6页珍藏版)》请在冰豆网上搜索。
我国中药材资源丰富,种类繁多,来源复杂,品种混乱,同物异名,同名异
物现象多见。
商品市场上除正品外,尚有代用品、伪品和混淆品,来源不同的药
材,质量差异很大,势必影响临床的疗效,所以对中药质量的评价尤为重要。
过
去基本上是以传统的性状鉴定和显微鉴定确定真伪,以理化鉴定评价优劣。
近年
来发展起来一种新的技术――模式识别,它是根据物质所含的化学成分,利用
TLC、UV、IR、HPLC、GC、MS等方法获得其化学数据,然后利用数学思想和方法
对该类数据进行特征提取,对药材进行分析、决策和判断。
此种方法迅速发展,
逐渐取代了传统的中药材鉴定法。
模式识别所用的方法较多,但最常用的为统计
学方法,它是以数学上决策理论为基础,建立统计学识别模型,找出规律性认识。
1多元统计分析方法在中药质量评价中的应用
11聚类分析(Clusteringanalysis,简称CA)在中药质量评价中的应用
聚类分析法是数值分类学的新的分支,它是对一组尚无明确分类的样本,根据它
们所表现的变量特征,按相似程度的大小加以归类,其目标是在模式空间中找到
客观存在的类别。
按聚类目的不同,可将聚类分析法分为R型聚类法和Q型聚类
法。
其原理为:
对任一含m个指标的样本,可定义为m维空间的点,在m维空间
中的任意两点其相似性可用“距离”度量,定义为“dij”,若将任一样本看作一
类,其类间相似性可用欧氏距离DE表示:
DE=dij=[∑mi=1(xil-xjl)2]1/2,式中:
l=1,2,…m,表示样本的指标数;
i,j表示样
本序号;
xil,xjl表示样本各指标。
系统聚类法即对n个样本计算出两两间的距
离dij,并从中找出距离最小的两类Gp与Gq,合并成一个新类Gr,重新计算新
类与其他各类间的距离,再将距离最小的两类合并,重复以上过程至所有样本聚
为一类为止。
定义类Gk与Gr的距离Drk有以下递推公式:
D2rk=αpD2pk+α
qD2qk+βD2pq+γ|D2pk-D2qk|,式中参数αp,αq,β,γ取值不同对应不同的系
统聚类方法。
该法除常用于中药系列品种的分类外,还可以广泛的引用于真伪鉴别、成分
浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源
等方面[1~7],使中药研究跨进现代电脑量化分析的新阶段。
马英丽等[8]用甲醇回流提取黄芪中的皂苷类成分,以氯仿甲醇水(65:
30:
10)为展开剂,采用双波长薄层扫描法,在λs=390nm,λr=590nm下,对
18个产地的黄芪样品进行了定量分析,以黄芪甲苷为指标成分,选用中位数法
进行聚类,用余弦法计算样品间的相似性程度。
结果系统聚类分析将样品分为3类,大多数产地的黄芪被聚为1类或2类,即质量较好或一般。
表明,蒙古黄芪和膜荚黄芪被列为优质品,该结果与《中华人民共和国药典》2000年版将蒙古黄芪和膜荚黄芪列入正品相一致。
王继国等[9]建立了10种中药血竭样品的HPLC指纹图谱,并把HPLC指纹图谱信息进行数据化及数据标准化处理,用重叠率与相关系数两个参数,从两个方面定量的对这10种样品的HPLC指纹图谱进行了相似性评价;
在此基础上用系统聚类分析法定性的对这10种样品进行了分类和鉴别,从而建立了一种相对完善的中药血竭的化学模式识别技术,为中药血竭的质量评价和分类鉴别提供了一个很好的方法和思路。
田兰等[10]采用HPLC对32个白术样品进行测定,将样品分析中所获得的32个样品的45个特征,采用系统聚类分析和逐步判别分析,进行白术的化学模式识别的研究。
将32个样品分为优等品、一般品和伪品3个等级,优质品集中于浙江、湖南、四川一带,而北方的白术质量一般。
这样就建立了评价白术真伪优劣的新方法。
徐永群等[11]以赤芍的红外指纹图谱为依据,采用主成分分析法对来自18个产地的赤芍进行了聚类分析。
可将18个产地大致分为6类,这一分类与地理位置有较明显的对应关系,同一区域内赤芍的性能较为相似,可作为传统中医界对赤芍药材质量评价的依据。
刘谦光等[12]运用模糊动态聚类分析法对来源于美国、加拿大及我国的共14种不同产地的西洋参样品质量进行了模糊识别研究。
结果与权威部门认定的具有法定地位的西洋参产地进行验证、核对,取得了较为一致的结果。
12判别分析(Discriminantanalysis,简称DA)在中药质量评价中的应用
判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类,而聚类分析是在一批给定样品要划分的类型事先并不知道,正需要通过聚类分析来给以确定类型。
正因为如此,判别分折和聚类分析往往联合起来使用,所以判别分析是要求先知道各类总体情况才能判断新样品的归类,当总体分类不清楚时,可先用聚类分析对原来的一批样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
于承浩等[13]对六味地黄丸及其模拟样品在290nm下进行薄层扫描分析,将所得特征数据利用聚类分析方法进行分类,用逐步判别分析方法优选特征数据、建立判别函数,并对分类结果进行检验。
结果表明,样品及模拟品被分为4类,分类合理,判别函数回判准确率为100%。
从而说明了聚类判别分析方法可较好地评价六味地黄丸的质量。
张亮等[14]采用反相HPLC法对六味地黄丸缺味药模拟方的浸出物进行分析,选取9个色谱峰的峰面积与内标峰面积之比值作为样本特征变量,通过169个训练集样本建立了其中3种缺味药的Bayes法和PRIMA法判别分析数学模型。
结果3种缺味药4种模式的平均正确识别率Bayes法和PRIMA法均为100%,对169个预示集样本的平均预示率Bayes法为100%,PRIMA法为99.6%。
表明Bayes法和PRIMA法能对六味地黄丸3种缺味药进行准确识别。
13主成分分析法(Principalcomponentsanalysis,简称PCA)在中药质量评价中的应用
根据在初选的特征量间可能存在的相关性,找到一种空间变换方式,通过对原始特征(经标准化后的)变量进行线性组合,形成若干个新的特征矢量,要求它们之间相互正交,它既保留了原始指标的主要信息,且又互不相关。
这样一种从众多原始指标之间相互关系入手,寻找少数综合指标以概括原始指标信息的多元统计方法成为主成分分析。
其数学模型为:
设有m个指标X1,X2,…,Xm,欲寻找可以概括这m个指标主要信息的综合指标Z1,Z2,…,Zm。
从数学上讲,就是寻找一组常数ai1,ai2,…,aim(i=1,2,…,m),使这m个指标的线性组合:
Z1=a11X1+a12X2+…+a1mXmZ2=a21X1+a22X2+…+a2mXmZm=am1X1+am2X2+…+ammXm能够概括m个原始指标X1,X2,…,Xm的主要信息(其中,各Zi(i=1,2,…,m)互不相关)。
这些矢量即称为主成分。
该方法就是根据样本特点,选取与问题最相关的特征来参与分类的。
近年来主成分分析法在中药质量鉴别分析中应用比较广泛[15-17]。
张耀奇等[18]运用气相色谱法结合主成分分析对16种苍术及类似品、30种相关成药(二妙丸、三妙丸、四妙丸等)进行了研究。
该方法是将气相色谱分离得到去除杂质峰的整个色谱图化分成237个时间通道,凡在时间通道内不出峰就以“0”表示,出峰的以实际峰面积表征。
由此,每一样本均可用一个237维的向量表示,采用shannon信息量方程计算每一时间通道的信息量,最后选取信息量最大的十几个通道作为分类特征。
结果显示,苍术和白术有明显区别;
茅苍术和北苍术虽为药典规定的正品苍术,但就挥发性化学成分来看,两者有明显区别;
北苍术和关苍术区别不大。
三种相关成药,以三妙丸较有特征,有别于其它两种。
孙红祥等[19]从常用的10种天南星药材中选取与抗肿瘤、镇咳祛痰作用相关的13种成分作为评价指标,并运用主成分分析方法从这13个指标中提取了4个主因子,其累积贡献率达91.4%,能较近似的代表原始数据所反映的信息,得到权重系数较大的X1、X2、X4、X7、X8、X11和X12等7个指标,然后再采用模糊数学的方法对这些药材的质量进行综合评价。
结果表明,一把伞南星最佳,其次为象头花和掌叶半夏,粗序南星质最劣。
因此,应用主成分分析和模糊数学方法建立的数学模型进行中药材的质量评价是可行的。
马龄等[20]采用气相色谱法对中药吴茱萸脂肪酸进行了分析测定,根据测定的数据用主成分分析法进行特征压缩、提取,将代表诸样品特征的点即“星”显示在半圆形极坐标上构成星座图,根据“星”所属的星座和所走的路径,对18种不同品种、不同产地的吴茱萸进行自然分类,为中药吴茱萸的品种鉴别和质量优选提供了依据。
张亮等[21]利用主成分分析法对32个不同品种来源的中药石斛样品质量进行了研究,该法直接用药材粉末的氯仿浸出液的紫外光谱数据进行分析,以每一波长与特定波长的吸光度比值作为分类指标,用Shannon信息理论对全部样品计算每一波长通道的信息量,选取信息量最大的10个通道用作分类特征,取得了满意的分类结果,为从化学角度研究中药质量提供了一种新的方法。
曾明等[22]应用主成分分析法对来源于不同产地的野葛及葛属的其它8种植物进行了化学模式识别研究,为葛属植物的药材质量评价及分类提供了依据。
王秀坤等[23]运用主成分分析法及非线性映射技术,对来源于全国各地的40份苦参药材质量进行了化学模式识别研究,取得了与传统鉴定较为一致的结果。
14逐步回归分析(Stepwiseregression,简称SR)在中药质量评价中的应用
逐步回归分析[24]是进行双向筛选的一种方法,当引入一个自变量进入方程后,要对方程中的每一个自变量作基于偏回归平方和的F检验,看是否需要剔除一些退化为“不显著”的自变量,以确保每次引入新变量之前方程中只包含有“显著”作用的自变量。
这一双向筛选过程反复进行,直到既没有自变量需要引入方程,也没有自变量从方程中剔除为止,从而得到一个局部最优的回归方程。
到目前为止,此种方法在中药质量评价中应用的比较少。
张汉明等[25]为了考察化学成分与药理活性之间的内在联系,建立合理的化学模式识别方程,因此选择了葛根的有效成分总黄酮、葛根素、大豆苷元、大豆苷、3′甲氧基葛根素及多糖的含量和葛根清热解表功效有关的抗内毒素活性强度为化学和药理指标,运用逐步回归法建立了回归方程,同时采用Bayers判别分析法对来自全国不同产地的葛根及同属的其它植物进行了模式识别研究。
结果黄酮类成分未进入方程,而多糖与抗内毒素活性呈显著的负相关;
6因素和单因素的判别正确率分别为94.12%、88.24%。
本研究也为中药材质量评价提供了一个新的依据。
15典型相关分析(Canonicalcorrelationanalysis,简称CCOR)在中药质量评价中的应用
典型相关分析是研究变量之间相关关系的一种统计分析方法,它揭示两组随机变量之间的线性相关情况。
是从整体上把握两组指标之间的相互关系,分别在两组变量中提取有代表性的两个综合变量U1、V1(U1、V1分别是两个变量组中各变量的线性组合),利用这两个综合变量之间的相关性在一定程度上反映了原来两组指标之间的整体相关性。
孙立新等[26]收集不同科属、不同产地的板蓝根样品27个、大青叶样品5个。
对样品的化学成分进行高效液相色谱分析,获得反映样品整体化学特征的数据,同时选择体外抑菌药理指标进行药理活性测定。
用典型相关分析揭示了化学信息和药理指标之间的相关关系,寻找与药理指标密切相关的化学成分,用ISODATA聚类分析技术
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 方法 中药 质量 评价 中的 应用