代谢组学方法与应用许国旺张强.docx
- 文档编号:28417104
- 上传时间:2023-07-13
- 格式:DOCX
- 页数:67
- 大小:107.46KB
代谢组学方法与应用许国旺张强.docx
《代谢组学方法与应用许国旺张强.docx》由会员分享,可在线阅读,更多相关《代谢组学方法与应用许国旺张强.docx(67页珍藏版)》请在冰豆网上搜索。
代谢组学方法与应用许国旺张强
第1章绪论
随着人类基因组测序工作的完成,基因功能的研究逐渐成为热点,随之出现了一系列的“组学”研究,包括研究转录过程的转录组学(transcriptomics)、研究某个生物体系中所有蛋白质及其功能的蛋白质组学(proteomics)及研究代谢产物的变化及代谢途径的代谢组学(metabolomics或metabonomics)(图1-1)。
代谢组学是众多组学中的一种,是随着生命科学的发展而发展起来的。
与其他组学不同,代谢组学是通过考察生物体系(细胞、组织或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学[1]。
所谓代谢组(metabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常功能和生长发育的小分子化合物的集合,主要是相对分子质量小于1000的内源性小分子。
代谢组中代谢物的数量因生物物种不同而差异较大,据估计,植物王国中代谢物的数量在200000种以上,单个植物的代谢物数量在5000~25000,甚至简单的拟南芥(Arabidopsisthaliana)也产生约5000种代谢产物,远远多于微生物中的代谢产物(约1500种)和动物中的代谢产物(约2500种)[2]。
实际上,在人体和动物中,由于还有共存的微生物代谢、食物及其代谢物本身的再降解,到目前为止,还不能估计出到底有多少种代谢产物,浓度分布范围有7~9个数量级。
因此对代谢组学的研究,无论从分析平台、数据处理及其生物解释等方面均面临诸多挑战。
本章对代谢组学发展的历史、国内外现状、研究方法、典型应用领域及研究热点等给予了介绍。
1.1代谢组学简介
1.1.1代谢组学发展的时代背景
生命科学是研究生命现象、生命活动的本质、特征和发生、发展规律,以及各种生物之间和生物与环境之间相互关系的科学。
自从1953年Watson和Crick建立了DNA双螺旋结构模型后,生命科学研究的面貌便焕然一新。
在此基础上发展的分子生物学使得生命的基本问题,如遗传、发育、疾病和进化等,都能从分子机制上得到诠释。
生物学研究进入了对生命现象进行定量描述的阶段。
分子生物学的飞速发展极大地推动了人们从分子组成水平对生物系统进行深人的了解。
基因组计划向人们展示了包括大肠杆菌、酵母、线虫、果蝇、小鼠等模式生物以及人类的所有遗传信息的组成,生命的奥秘就存在于这些序列中。
技术上的突破使得基因组数据的获得已经不再是生命科学的难点。
人类基因组计划的基本完成标志着后基因组时代的到来,在这一时期,基因组功能分析成为生命科学的主要任务,核心思想是以整体和联系的观点来看待生物体内的物质群,研究遗传信息如何由基因经转录向功能蛋白质传递,基因功能如何由其表达产物蛋白质以及代谢产物来体现。
继基因组(genome)后、转录组(transcriptome)、蛋白质组(proteome)等相继出现,并相应形成“omics”学说,如转录组学(transcriptom-ics)、蛋白质组学(proteomics)等。
但是基因与功能的关系是非常复杂的,还不能用转录组、蛋白质组来表达生物体的全部功能。
生物体内存在着十分完备和精细的调控系统以及复杂的新陈代谢网络,它们共同承担着生命活动所需的物质与能量的产生与调节。
在这一复杂体系中,既有直接参与物质与能量代谢的糖类、脂肪及其中间代谢物,也有对新陈代谢起重要调节作用的物质。
这些物质在体内形成相互关联的代谢网络,基因突变、饮食、环境因素等都会引起这一网络中某个或某些代谢途径的变化,这类物质的变化可以反映机体的状态。
起调节作用的代谢物,从生理功能上来说包括神经递质、激素和细胞信号转导分子等,从化学组成上来说包括多肽、氨基酸及其衍生物、胺类物质、脂类物质和金属离子等,这些调节物质绝大部分都是小分子物质,在植物与微生物中还存在着大量的次生代谢产物。
这些分子广泛分布于体内,对多种生理活动都具有普遍和多样的调节作用,仅微量存在就能够发挥很强的生物效应。
不同活性的分子或协同、或拮抗、或修饰而相互影响,在生物学效应以及信号转导和基因表达调控上形成复杂的网络,承担着维持机体稳态的重要使命,是神经内分泌和免疫网络调节的物质基础和自稳态调节的最重要成分。
转录组、蛋白质组的研究很难涵盖这些非常活跃而且非常重要的生命活性物质,然而对这类物质的生理和病理生理学意义如果不能充分认识,就不可能真正阐明生命功能活动的本质。
传统研究方法是以生理学和药理学实验方法为主,缺乏高通量的研究技术,难以建立生物小分子物质复杂体系的研究模式。
在这种情况下,代谢组(metabolome)和代谢组学(metabolomics或metabonomics)应运而生了,并成为系统生物学的一个重要突破口[3],代谢处于生命活动调控的末端,因此代谢组学比基因组学、蛋白质组学更接近表型。
从广义的代谢组学的意义上来说,代谢组学的历史是相当长的,很早以前人们就已经对生物样品中的某些靶标化合物进行分析以了解生命机体的状态。
目前代谢组学所采用的一些技术平台,如NMR和色谱技术以及质谱技术也有比较长的应用历史。
严格意义上的代谢组学(对限定条件下的特定生物样品中所有代谢组分的定性和定量)从提出到现在只有短短数年的时间。
现在一般认为代谢组学源于代谢轮廓(metabolicprofiling)分析,在代谢轮廓分析中体现了代谢组学的“尽可能多地分析生物样本中的代谢产物”这一理念的萌芽。
在这里,我们对从代谢轮廓分析发展到代谢组学这一过程[4](图1-2)做一简单的介绍。
早在20世纪70年代初,Baylor医学院就发表了有关代谢轮廓分析方面的论文,在他们的工作中采用了GC-MS的方法对多种类固醇、有机酸以及尿中药物的代谢物进行了分析,并将这种多组分分析的方法称为代谢轮廓分析,开创了对复杂样品进行代谢轮廓分析的先河。
此后代谢轮廓分析广泛应用于血、尿等生物样本中代谢物的定性与定量分析,以对疾病进行筛选和诊断。
在临床上使用GC-MS的方法来诊断疾病的方法一直沿用到今天。
紧接着,人们把重点主要放在分析的自动化上,并将GC的方法用于其他类型化合物的分析。
进入20世纪80年代,人们开始使用高效液相色谱和核磁共振的技术来进行代谢轮廓的分析,如1982年,荷兰应用科学研究所(TNO)的vanderGreef[5]在国际上首先采用质谱对尿中代谢指纹进行研究。
1983年,Sadler、Buckingham和Nicholson发表了第一个有关全血和血浆的1H-NMR谱[6]。
在1986年,色谱杂志JournalofChromatography发表了一期有关代谢轮廊(metabolicprofiling)分析的专辑。
进入90年代,代谢轮廓分析技术一直平稳发展,每年都有10~15篇的论文发表,不过这一时期人们的目标更多地集中于某些特定的标靶化合物上。
在90年代初,Sauter等人用基于GC-MS代谢轮廓分析的方法研究了不同除草剂对大麦的影响,这种用代谢轮廓分析来研究各种因素对生物功能的影响的研究思路随即被人们认可。
1997年,StevenOliver研究小组提出了通过对代谢产物的数量和定性来评估酵母基因的遗传功能及其冗余度,并率先提出了代谢组的概念[7]。
1999年,J.Nicholson等提出metabonomics的概念[8],并在疾病诊断、药物筛选等方面做了大量卓有成效的工作[1,9~11]。
接着,德国的Max-Planck-Institut的科学家们开始了植物代谢组学的研究[12],使代谢组学得到了极大的充实。
代谢组学的特点为:
(1)关注内源化合物。
(2)对生物体系中的小分子化合物进行定性定量研究。
(3)上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响。
(4)上述内源性化合物的知识可以被用于疾病诊断和药物筛选。
与转录组学和蛋白质组学比较,代谢组学有以下优点[13]:
(1)基因和蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易。
(2)代谢组学的研究不需建立全基因组测序及大量表达序列标签(EST)的数
据库。
(3)代谢物的种类要远小于基因和蛋白质的数目(每个组织中大约为1〇3数量级,即使在最小的细菌基因组中也有几千个基因)。
(4)研究中采用的技术更通用,这是因为给定的代谢物在每个组织中都是一样的缘故。
代谢组学是近几年才发展的一门新兴的技术,如何对这种技术进行命名曾经有争议,国际上存在metabolomics和metabonomics两个词汇,一般认为,metabolomics是通过考察生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)代谢产物的变化或其随时间的变化,来研究生物体系的代谢途径的一种技术。
而metabonomics是生物体对病理生理刺激或基因修饰产生的代谢物质的质和量的动态变化的研究。
前者一般以细胞作研究对象,后者则更注重动物的体液和组织。
在植物、微生物领域一般用metabolomics,在药物研究和疾病诊断中,一般用metabonomics。
现在这两个定义已经模糊化[6],没有特别的区分。
1.1.2代谢组学研究现状
目前,代谢组学正日益成为生命科学研究的重点之一,在世界范围越来越多的科学工作者已加入到代谢组学的研究中。
这可以从以下几个方面体现。
1.1.2.1有关代谢组学的文献数量增长迅速,学术活动活跃
“Webofknowledge”是检索科学文献最好的网站之一,在该网站以metabolomicsormetabonomics和metabolicprofiling为主题词进行检索,可得图1-3。
以metabolomicsormetabonomics检索可得1950篇,以metabolicprofiling检索可得4581篇(2008年1月5日)。
类似地,从“Webofknowledge”使用proteomics和metabolome分别检索到总文献9361篇和1000篇(图1-4),发现引用次数分别为112566和8355,平均每篇引用分别为12.02和8.35,h指数分别为113和39。
从中可知,尽管代谢组学比较年轻,是新兴技术,文献的总量不多,但与蛋白质组学相比,它们具有非常类似的发展趋势。
代谢组学的学术活动也在蓬勃进行,2001年12月在美国举行了题为“MetabolicProfiling:
PathwaysinDiscovery”的专题会议,一年后(2002年11月)在加利福尼亚州召开的系统组学国际会议也特别强调了代谢组学。
有关植物代谢组学方面的会议更多,2002年4月、2003年4月、2004年6月及2006年7月分别在荷兰、德国、美国和英国举行了第一届、第二届、第三届和第四届植物代谢组学国际会议,会议就分析技术的发展、代谢数据的生物信息和数据统计分析、标准化及数据库、代谢组学在解决生物技术问题中的作用和发展农作物等方面进行了广泛的探讨。
2008年7月,国际植物代谢组学会议将在日本的横滨召开。
为与代谢组学的迅猛发展相适应,国际代谢组学学会(http:
//metabolomicssociety.org/)应运而生,并创刊了专业杂志Metabolomics(FirstInternationalConferenceoftheMetabolomicsSociety)。
在取得成功的基础上,2006年和2007年分别在美国和英国召开了第二届、第三届代谢组学学会的国际会议。
这些会议的召开加速了代谢组学的发展。
国内在这一领域也紧跟国际前沿,中国科学院大连化学物理研究所在2001年学科规划时就将代谢组学列为中国科学院知识创新工程(二期)重要方向予以支持。
自2003年较全面地介绍代谢组学的综述发表后[14],又陆续有许多综述性的文章发表,内容涉及代谢组学的技术平台以及在医药、疾病、植物学等诸多方面的应用[15~18]。
2003年9月,中国科学院生物局在上海召开了“植物、微生物的代谢组学、代谢工程”学术研讨会。
2004年10月10~11日在上海威斯汀大饭店,中国科学院大连化学物理研究所和美国Waters公司合作举办的代谢组学高层研讨会及技术报告会隆重举行,英国伦敦帝国理工学院的JeremyNicholson教授受邀首次访问中国。
此次研讨会的成功召开,进一步拉近了中国代谢组学与国际的距离,也标志着中国科学院大连化学物理研究所和美国Waters公司“代谢组学联合实验室”的正式运行。
2004年11月,中国科学院启动了知识创新方向性项目“植物、微生物代谢组学的初步研究”。
2004年12月18日,天津药物研究院与天津大学共同主办的“代谢物组学与药物研究高层研讨会”在天津大学化工学院举行,就“代谢物组学与重大疾病药物治疗相关基础和应用研究”进行了深入探讨。
2005年4月5~6日,Waters公司首届制药技术论坛在上海虹桥宾馆召开,JeremyNicholson教授和许国旺研究员等做了关于代谢组学、新药发现和研究等方面的报告,探寻代谢组学脉动对制药业的深层影响及其对中草药开发方向的揭示[19]。
在这期间,国内众多科研机构也纷纷加入代谢组学研究的行列。
2005年,许国旺受SpringerLink邀请,正式成为Metabolomics杂志编委。
在“大连化学物理研究所科学论坛(DICPSYMPOSIUM)专项基金”资助下,中国科学院大连化学物理研究所分别在2005年4月和2006年9月组织了“现代分离/分析化学和代谢组学”和“分析生物化学和中医药代谢组学”科学论坛,邀请了数十位来自英国、美国、德国、荷兰、日本、比利时、中国、中国香港、中国澳门等国家和地区的著名专家和学者参加。
在国家有关部门和单位的配合下,2006年9月13~14日在中国科学院大连化学物理研究所召开了为期2天的主题为“医学代谢组学”的第284次香山科学会议,国内数家相关研究机构、大专院校和国外多个从事代谢组学研究的团体近50余位专家学者应邀出席。
由中国工程院医药卫生学部等主办的2007年“环渤海医药发展前沿论坛”暨“代谢组学与中药研究”调研汇报会于2007年12月21~22日在天津举行,在刘昌孝、张伯礼和杨胜利三位院士的组织下,中药代谢组学研究的部分优势单位(中国科学院大连化学物理研究所、天津药物研究院、上海交通大学、中国药科大学、浙江大学、中国科学院武汉物理与数学研究所、天津中医药大学、沈阳药科大学等)的专家就代谢组学的技术平台、生物信息学、中药安全性、中药资源和质量、中药方剂作用机制和中药作用物质基础等报告最新的研究进展。
所有这些学术研讨会,一方面提供了与国内外一流科学家交流的机会,另一方面也使得我国的研究队伍不断扩大和加强。
1.1.2.2代谢组学在各国的科研战略上得到了重视
美国GlobalInformationInc.的市场调查报告显示,2002~2007年代谢组学技术工业的市场年增长率将达到46%[20]。
2003年,美国国立卫生研究院(NationalInstitutesofHealth,NIH)在其中长期发展规划(NIHRoadmap)中[21],设立代谢组学专题,提出了要建立专门收集小分子信息并从事高通量筛选的研究中心,发展代谢组学技术平台,更快、更多地发现具有生物活性的小分子的构想。
其下属的TheNationalInstituteofGeneralMedicalSciences已在2003年批给加州大学3500万美元的一个5年计划做鼠巨噬细胞的类脂组学(lipidomics)研究。
与此类似,日本政府也专门设立了“ConstructionofBasicTechniquesforLipidomicsandTheirApplication”国家项目,建立类脂的代谢途径数据库。
2005年1月,加拿大启动7“人类代谢组项目”(http:
//www.metabolomics.ca/),希望从组织和体液中识别、定量和分离出浓度大于1μmol/L的所有代谢物。
到2006年底,已定性出800个代谢产物。
预期有1400个代谢产物可被定性、定量,其信息可放到公共数据库中,并可制备出单体保存到一80℃的冰箱中。
至2008年1月5日,该项目已从数千种书籍、杂志文献和电子数据库中收集了2500个内源性代谢产物,建立了人类代谢组数据库(http:
//www.hmdb.ca/)[22]。
库中每种代谢产物都有其相应的化学、临床、分子生物学和生化数据,据说是目前世界上最全的关于人类代谢物和人类代谢的数据库。
我国政府也十分重视代谢组学的研究,科技部早在2003年就将代谢组学平台技术的建立列入了国家“863”计划,并交给大连化学物理研究所所承担。
在“十一五”期间,科技部先后在国家重大研究计划“蛋白质科学”、国家重点基础研究发展规划(“973”)、国家高技术研究发展计划(“863”计划)和“十一五”科技支撑项目、食品安全等方面支持了代谢组学的研究。
国家自然科学基金委员会化学科学部连续多年将“组学分析中的新原理、新方法和新技术”列为重点项目支持方向。
代谢组学有着巨大的理论价值和应用前景,企业界对此也非常关注,西方国家先后成立了多个关于代谢组学研究的研究中心或公司,如德国MAX-PLANCK-INSTITUT的分子植物生理所、英国的MetabometrixLtd、荷兰的PlatformPlantMetabolomics(PPM)、美国的TheMetabolomicsGroup、加拿大的PhenomenomeDiscoveriesInc.等。
PFIZER等六个大制药公司与英国帝国理工学院的科学家们一起组织了一个为期3年的关于药物毒性研究的研究小组(COMET1),拟在药物的发现(discovery)到开发(development)阶段用代谢组学的方法来评价药物的毒性(详见第13章)。
在第一期取得成功的基础上,第二期项目(COMET2)也于2006年3月正式启动,目标是研究标准毒物的分子机制,进而建立具预测性的构效关系专家系统。
以代谢组学为核心的系统生物学技术建立的BGMEDICINE公司(http:
//www.bg-D.AndersonCancerCenter合作以识别新的、专一性好的、敏感的用于监测乳腺癌患者治疗效果的血中蛋白质和小分子标志物。
并从ACSBiomarkerB.V获得授权来开发和商品化基于生物标志物的分子诊断测试方法以预兆充血性心力衰竭(congestiveheartfailure)。
与MultipleSclerosisResearchCenterofNewYork(MSRCNY)合作以发现针对疾病和市场上现有药物疗效、安全性的新标志物。
正在与FDA及7个制药公司合作以发现肝毒的生物标志物。
Metabolon与美国传染病军队医学研究所(U.S.ArmyMedicalResearchInstituteofInfectiousDiseases,USAMRIID)签署协议[23],军队将使用Metabolon的代谢组学技术平台来研究接种AVA炭疽热疫苗(anthraxvaccine)的人的生化轮廓(biochemicalprofile)。
AVA疫苗是FDA许可的唯一接种人的炭疽热疫苗。
这也是第一个对接种疫苗的人的大规模代谢组学研究,这种生化轮廓将帮助USAMRIID较好地了解疫苗的安全性、有效性及其作用机制。
所有这些说明,代谢组学得到了学术界、政府和工业界的极大重视。
1.1.3代谢组学与系统生物学
在几种常见的组学研究中,基因组学主要研究生物系统的基因结构组成,即DNA的序列及表达。
蛋白质组学研究由生物系统表达的蛋白质及由外部刺激引起的差异。
代谢组学是研究生物体系(细胞、组织或生物体)受外部刺激所产生的所有代谢产物的变化,可以认为代谢组学是基因组学和蛋白质组学的延伸。
随着这些组学研究的深入,科学家们逐渐认识到:
基因组的变化不一定能够得到表达,从而并不对系统产生实质影响。
某些蛋白质的浓度会由于外部条件的变化而升高,但由于这个蛋白质可能不具备活性,从而也不对系统产生影响。
同时,由于基因或蛋白质的功能补偿作用,某个基因或蛋白质的缺失会由于其他基因或蛋白质的存在而得到补偿,最后反应的净结果为零。
而小分子的产生和代谢才是这一系列事件的最终结果,它能够更准确地反映生物体系的状态[24]。
因此,系统生物学的研究应涵盖基因组学、转录组学、蛋白质组学和代谢组学,任何单一组学的研究对生物问题的理解都是不全面的。
系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为的科学[25~28]。
系统生物学从基因组序列开始,完成从生命密码到生命过程的研究。
如果将生命体看成一个在基因调控下的无数的相互关联的生化反应所组成的一个新陈代谢网络,那么系统生物学将要鉴别每一个反应节点的各种分子及其相互作用,从局部到整体,最终完成整个生命活动的路线图。
系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学等,这些“组学”分别在DNA、mRNA、蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能以及各种分子之间的相互关系。
进而发现生化反应的途径和网络,构建生物学模块,并在研究模块相互作用的基础上绘制生物体的相互作用图谱。
代谢组学与其他组学结合对阐明生命的奥秘具有重要意义。
1.2代谢组学的研究方法
代谢组学研究一般包括样品采集和制备、代谢组数据的采集、数据预处理、多变量数据分析、标志物识别和途径分析等步骤(图1-5)[29]。
生物样品可以是尿液、血液、组织、细胞和培养液等,采集后首先进行生物反应灭活、预处理,然后运用核磁共振、质谱或色谱等检测其中代谢物的种类、含量、状态及其变化,得到代谢轮廓或代谢指纹。
而后使用多变量数据分析方法对获得的多维复杂数据进行降维和信息挖掘,识别出有显著变化的代谢标志物,并研究所涉及的代谢途径和变化规律,以阐述生物体对相应刺激的响应机制,达到分型和发现生物标志物的目的[29,30]。
根据研究的对象和目的不同,OliverFiehn将对生物体系的代谢产物分析分为四个层次[12]。
(1)代谢物耙标分析(metabolitetargetanalysis):
对某个或某几个特定组分的分析。
在这个层次中,需要采取一定的预处理技术,除掉干扰物,以提高检测的灵敏度。
(2)代谢轮廓分析(metabolicprofilinganalysis):
对少数所预设的一些代谢产物的定量分析。
如某一类结构、性质相关的化合物(如氨基酸、顺二醇类)、某一代谢途径的所有中间产物或多条代谢途径的标志性组分。
进行代谢轮廓分析时,可以充分利用这一类化合物的特有的理化性质,在样品的预处理和检测过程中,采用特定的技术来完成。
(3)代谢组学(metabonomics,metabolomics):
限定条件下特定生物样品中所有内源性代谢组分的定性和定量。
进行代谢组学研究时,样品的预处理和检测技术必须满足对所有的代谢组分具有高灵敏度、高选择性、高通量的要求,而且基体干扰要小。
代谢组学涉及的数据量非常大,因此需要有能对其数据进行解析的化学计量学技术。
(4)代谢指纹分析(metabolicfingerprintinganalysis):
不具体鉴定单一组分,而是通过比较代谢物指纹
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 代谢 方法 应用 许国旺张强