古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计毕业论文文档格式.docx
- 文档编号:16882292
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:18
- 大小:322.52KB
古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计毕业论文文档格式.docx
《古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计毕业论文文档格式.docx》由会员分享,可在线阅读,更多相关《古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计毕业论文文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
关键词:
生物信息学
ABSTRACT
Glucoseisdegradedtopyruvateviathesocalled“centralmetabolicpathways”thatplayvitalrolesinthecarbohydrateandenergymetabolismoforganisms.Somevariancestotheclassicalglycolyticpathwaysinbacteriaandeukaryaarepresentedintheglycolysisofarchaea.
Bioinformaticsplaysanimportantroleingenomicsandproteomicstoanalyzethevastdatafromexperiments.Recently,manylabsestablishedalotofproteomicdatabases.Bioinformaticsisthesubjectofusingcomputertostore,retrieveandanalyzebiologicalinformation.SequencealignmentisabasicprobleminBioinformatics,anditsmainresearchworkistodeveloprapidandeffectivesequencealignmentalgorithms.Wemaydiscoverfunctional,structuralandevolutionaryinformationinbiologicalsequencesbysequencecomparing.Thispaperintroducesthedevelopmentactualityofsequencealignmentalgorithms,describesvarietyofsequencealignmentalgorithmandanalysestheadvantagesanddisadvantagesofthem.
Theexperimentthroughthebioinformaticsanalysis,useGenBank,ClustalX,ClustalW,Swiss-Model,BLASTandotherdatabasesandtools,hasbeenwiththeancientwaysofbacterialenzymesofglycolysis.
Keywords:
Bioinformatics
第一章前言
1.1古细菌概述
古细菌(archaeobacteria)(又可叫做古生菌、古菌、古核细胞或原细菌)是一类很特殊的细菌,多生活在极端的生态环境中。
具有原核生物的某些特征,如无核膜及内膜系统;
也有真核生物的特征,如以甲硫氨酸起始蛋白质的合成、核糖体对氯霉素不敏感、RNA聚合酶和真核细胞的相似、DNA具有内含子并结合组蛋白;
此外还具有既不同于原核细胞也不同于真核细胞的特征,如:
细胞膜中的脂类是不可皂化的;
细胞壁不含肽聚糖,有的以蛋白质为主,有的含杂多糖,有的类似于肽聚糖,但都不含胞壁酸、D型氨基酸和二氨基庚二酸。
自古细菌被分为一个单独域以来,随着其新类群的不断发现,现在古细菌可分为广古细菌(Euryarchaeota)、泉古细菌(Crenarchaeota)、古古细菌(Korarchaeota)以及纳米古细菌(Nanoarchaeota)4个门古细菌介于细菌和真核生物之间,它的结构较真核生物简单,类似于细菌,而很多信息处理过程的组分更接近于真核生物,在DNA复制装置中该现象尤其显著。
因此,很多古细菌可以作为研究真核生物DNA代谢过程的模型,是较好的模式生物。
然而,古细菌发现比细菌晚,它的结构又与细菌有所区别,很多在细菌中可以使用的遗传操作技术无法在古细菌中使用。
1.1.1掘越氏热球菌(Pyrococcushorikoshii)
掘越氏热球菌(Pyrococcushorikoshii)生存于冲绳岛附近海底约1395米的火山口,发现并报道于1998年。
其最适生长温度为摄氏95-105℃,分类上属广古细菌。
该菌的完整基因组已测序。
1.2糖酵解途径
在机体缺氧条件下,葡萄糖经一系列酶促反应生成丙酮酸进而还原生成乳酸的过程称为糖酵解‘亦称糖的无氧氧化。
糖酵解途径是指细胞在细胞质中分解葡萄糖生成丙酮酸的过程,此过程中伴有少量ATP的生成。
这一过程是在细胞质中进行,不需要氧气,每一反应步骤基本都由特异的酶催化。
在缺氧条件下丙酮酸被还原为乳酸,有氧条件下丙酮酸可进一步氧化分解生成乙酰CoA进入三羧酸循环,生成CO2和H2O。
糖酵解总共包括10个连续步骤,均由对应的酶催化。
总反应式为:
葡萄糖+2ATP+2ADP+2Pi+2NAD+—>
2丙酮酸+4ATP+2NADH+2[H]++2H2O
1.2.1古细菌的糖酵解途径
迄今,对于真核生物与细菌的糖酵解过程已经进行了深入的研究,其糖酵解途径可分为:
经典的EM途径与ED途径以及氧化的磷酸戊糖途径。
古细菌,作为生命的“第三种形式”,其生理习性、代谢途径、遗传机制等均呈现出不同于真核生物与细菌的特点。
研究古细菌的代谢过程不但有可能揭示生命起源的机制,而且对于有效的利用这种微生物以及来自其中的极端酶类等也具有重要的现实意义。
古细菌糖酵解的研究在Woese等提出生命三域学说的90年代初开始起步。
目前,国际上关于古细菌糖酵解代谢的综述多报道于2005年前,而近年来随着许多新的研究成果的出现,古细菌中心代谢途径已成为极端微生物研究的一个热点领域。
与真核生物与细菌不同,古细菌中仅存在EM途径与ED途径,而缺少氧化的磷酸戊糖途径。
古细菌EM与ED途径具有与真核生物及细菌经典的EM与ED途径显著不同的特点。
这主要体现在:
第一,糖酵解过程中的部分路径即经过的中间代谢物转化过程不同;
第二,许多新的酶或酶家族催化糖酵解过程中的同一或不同代谢步骤。
1.3生物信息学
生物信息学中途径的发展背景伴随着人类基因组计划的启动,生物信息学这一新兴交叉学科的蓬勃发展,目前已经产生了大量的以核酸和蛋白质等生物大分子数据库及其相关的文献、资料图书。
从1994年开始,《核酸研究》杂志每年第一期是生物数据库专辑。
国际上3大核苷酸、蛋白质数据库分别是:
美国国家生物技术信息中心(NCBI)的GenBank数据库、欧洲生物信息学研究所(EBI)的核酸序列数据库EMBL和日本信息生物学中心(CIB)的DNA数据库DDBJ。
随着生物信息数据库的不断发展,生物信息学的研究方向划分的越来越细致,代谢途径研究则成为其中的一个研究热点。
途径作为一条维持生命的分子反应链,不同的生命过程有不同的途径。
比如细胞对外界环境变化响应的途径、细胞代谢、凋亡途径和信号途径。
一条途径功能的中断可能引起严重的疾病,如癌症。
由多条途径整合起来可形成蛋白质和基因的调控网络。
因此,理解途径是理解细胞过程和细胞过程药物的重要步骤。
目前对于途径的研究已经成为一个非常活跃的领域。
1.3.1生物信息学的研究领域
生物信息学的研究领域包括:
(1)大规模基因组测序中的信息分析;
(2)大规模基因功能表达谱的分析;
(3)序列片段的拼接;
(4)新基因和新SNP的发现与鉴定;
(5)非编码区信息结构分析;
(6)密码起源和生物进化的研究,包括序列相似性比较,序列同源性分析和构建系统进化树。
1.3.2主要的生物信息学数据库
国际上主要的DNA序列数据库有GenBank、EMBL、DDJB、ESTdb、OMIM、GDB、GSDB等;
蛋白质一级结构数据库有SWISS-PROT、PIR、OWL、ISSD、MIPS等;
蛋白质二级结构数据库有PROSITE、BLOCKS、PRINTS等;
蛋白质和其他生物大分子的三维结构数据库有PDB、NDB、CCSD等;
与蛋白质结构分类有关的数据库有SCOP、CATH、FSSP等。
1.3.3生物信息学的基本分析方法
随着生物信息的急剧增长,如何从浩瀚的数据库中获取有用信息,怎样处理提取的数据,进而从中获得与生物结构、功能相关的信息是一个使理论生物学家感到棘手的难题。
借助于计算机科学、信息科学及其它学科的共同参与,人们发展了生物信息的多种分析方法,其中最基本的方法有序列对比、结构对比及功能对比预测法等。
(1)序列比对预测法
序列比对是以核酸和蛋白质序列为依据,来比较两个或两个以上核酸或蛋白质在碱基(A、T、C、G)、氨基酸(20个氨基酸)水平上的相似性和不相似性。
序列比对是生物信息学最基本的分析方法。
常用的序列比对方法有两两序列比对和多序列比对。
两两序列比对是比较两序列之间的相似性区域和保守位点来寻找两序列可能存在的历史进化关系。
两两序列比对又分为总体序列比对和局部序列比对。
两个序列的比对有较成熟的动态规划算法:
总体序列比对是以Needleman-Wunsch的算法为理论体系发展的完善的比对方法;
当两个序列总体并不很相似,但某些局部片段相似性较高时,Smith-Waterman算法是解决局部比对的好算法,局部序列比对正是以Smith-Waterman动态规则算法为理论依据的比对方法。
多序列比对是以两两序列比对为基础,逐步优化两条或多条序列比对结果的方法,其目的是建立两条以上序列可能存在的进化关系。
最常见的多序列比对方法有Pileup算法和ClustalW算法。
(2)结构比对预测法
结构对比的基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性;
蛋白质结构预测包括二级和三级结构预测。
从方法学上来看有演绎法和归纳法两种途径。
前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。
后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。
以核酸和蛋白质的序列为基础来预测其生物学结构,是生物信息学的核心研究内容。
基于核酸序列的预测分析方法就是以核酸序列为基础来分析预测其功能基因的位置。
其分析内容常常包括:
密码子的偏向、内部重复序列、特殊位点、编码蛋白区和二级结构的预测。
(3)功能比对预测法
组成蛋白质的氨基酸序列不仅决定着蛋白质的三维结构,而且也决定着它的功能。
首先以蛋白质的序列为依据来预测蛋白质的物理性质,如分子量、等电点、亲水性和疏水性、跨膜区域、信号肽和蛋白定位等。
蛋白质的功能预测是以目的蛋白为线索力图发现它和功能已知蛋白质的相似性。
蛋白质的功能预测主要侧重在序列同源性和功能区序列的保守性。
蛋白质二级结构预测有两种策略:
以单一序列为基础和以多重序列对齐为依据的分析方法。
常用的三级结构预测方法有同源模建和穿针引线算法。
1.3.4与生物信息学关系密切的数学领域
统计学,包括多元统计学,是生物信息学的数学基础之一;
概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;
运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;
函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;
信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;
计算数学,如常微分方程数值解法是分子动力学的基本工具;
群论,在研究遗传密码和DNA序列的对称性方面有重要应用;
组合数学,在分子进化和基因组序列研究中十分有用。
原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。
而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。
1.3.5与生物信息学密切相关的计算机科学技术
首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。
其它诸如数据整合和可视化、数据挖掘(DataMining)、基于Unix操作系统的各种软件包以及人工智能,和一些重要算法的复杂性研究。
1.3.6生物信息学工业
生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。
它既属于基础研究,以探索生物学自然学自然规律为己任;
又属于应用研究,它的许多研究成果可以较快或立即产业化,成为价值很高的产品。
生物信息学的这一特点在现有的许多学科中几乎是独一无二的。
这里仅举一个例子来说明生物信息学工业的潜力。
据报导,只有50名员工的德国Lion生物信息学公司,将通过扫描公共数据库中的序列来发现500个可能的药物作用靶点,以一亿美元的价格预售给德国Bayer公司。
又据报导,生物信息学产业的市场在1998年已经达到10亿美元,而到2002年估计可增长到2000亿美元以上。
这是一笔巨大的财富,任何政府的科技决策人都不能对此视而不见。
NIH已向美国国会建议投资160亿美元在美国建立5~20个将生物学与计算结合起来的中心。
法国议会科技决策评估办公室,最近评估了基因工程、生物信息学和组合化学等学科的应用前景及法国的对策。
美国出现了大批的基于生物信息学的公司,实施了许多生物信息学研究计划,主要与药物设计,基因工程药物,生物芯片,代谢工程与化学工程密切相关。
生物信息学工业是知识经济的一个典型,潜力巨大。
1.3.7NCBI
NCBI是NationalCenterofBiotechnologyInformation的简称,既美国国立生物技术信息中心,NCBI是在NIH的国立医学图书馆(NLM)的一个分支。
NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。
NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。
1.3.8ClustalW
ClustalW是一种渐进的多序列比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;
然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;
然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。
1.3.9ClustalX
在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。
根据相似性分值继续分组比对,直到得到最终比对结果。
在比对过程中,相似性程度较高的序列先进行比对而距离较远的序列添加在后面。
1.3.10Swiss-Model
SWISS-MODEL是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。
该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。
同源建模方法预测蛋白结构一般包含以下四步:
①模板选择;
②目标序列模板序列比对;
③构建模型;
④评价。
不断重复如上步骤直到找到一个令人满意的模型。
SWISS-MODEL开发了几套不同的建模技术。
SWISS-MODEL的预测方法可以被描述为以α-螺旋和β-折叠为基础的"
刚性片段组装"
。
1.3.11BLAST
BLAST(BasicLocalAlignmentSearchTool)是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。
BLAST是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。
BLAST程序能迅速与公开数据库进行相似性序列比较。
BLAST结果中的得分是对一种对相似性的统计说明。
现在常见的BLAST形式有五种,如下图
名称
目的
方法
BLASTP
蛋白序列到蛋白库
库中存在的每条已知序列将逐一地同所查序列作一对一的序列比对
BLASTX
核酸序列到蛋白库
先将核酸序列翻译成蛋白序列,再对每一条作一对一的蛋白序列比对
BLASTN
核酸序列到核酸库
库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对
TBLASTN
蛋白序列到核酸库
将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对
TBLASTX
将库中的核酸序列和所查的核酸序列都翻译成蛋白,这样每次比对会产生36种比对阵列
1.3.12ORF
开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。
当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。
这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。
ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。
ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。
1.3.13FASTA格式
FASTA算法是1985年由Pearson和Lipman提出并在1988年做了进一步改进的双序列比对启发式算法,采用了改
进了的Wobir和Lipman算法以集中反映具有显著意义的比对结果。
其基本思想是:
一个能揭示出真实序列关系的比对至少包含一个两个序列都拥有的字(片段),把查询序列中的所有字编成Hash表,然后在数据库搜索时查询这个Hash表,以检索出可能的匹配,这样那些命中的字就能很快地被鉴定出来。
算法过程简单描述为:
(1)根据点阵图逻辑,从比对的所有结构中计算出最佳的对角线。
(2)使用字符方法寻找查询字符和测试序列之间的精确匹配。
(3)当所有的对角线发现之后,通过增加空位来连接对角线。
(4)在最佳对角线区域中计算出比对结果。
1.3.14序列比对算法评价
目前生物信息学领域对于序列比对算法的评价有两个标准,一为算法的运算速度,二为获得最佳比对结果的敏感性。
双序列比对中的典型算法Smith-Waterman、BLAST与FASTA,三者比较而言,Smith-Waterman敏感性最强,但算法的复杂度最高,需要在具有极高计算能力的超级计算机上实现。
FASTA较mith-Waterman快速而精确性相近。
BLAST运算速度最快,但敏感性最差。
多序列比对的典型算法主要是Clustal算法,此算法敏感性比较差,但目前在多序列比对中,尚缺乏比之更快速更有效的算法。
由此可见,目前序列比对中面临的问题就是如何研究和设计同时能满足高敏感性和高速度的算法。
1.4多序列对比
多序列对比就是把两条以上可能有系统进化关系的序列进行比对的方法。
目前对多序列对比的研究还在不断前进中,现有的大多数算法都基于渐近的比对的思想,在序列两两对比的基础上逐步优化多序列对比的结果。
进行多序列比对后可以对比对结果进行进一步处理,例如构建序列模式的profile,将序列聚类构建分子进化树等等。
意义在于通过多个相关蛋白质的相似性,了解其在进化上亲缘关系的远近,推断分子起源的进化规律等。
同时研究多个序列中的保守区域,就可以猜测这些区域对蛋白质结构、功能的重要性,从而进行分子设计。
1.5与古细菌糖酵解途径有关的酶类
与古细菌糖酵解途径有关的酶主要有
(1)ST2037-glyceratekinase甘油酸激酶
(2)ST1212-Enolas烯醇化酶
(3)ST0064-aldehydedehydrogenase乙醛脱氢酶
(4)ST1302-ribulose-5-phosphateisomerase5-磷酸核酮糖异构酶
(5)ST2268-transketolase转酮醇酶
(6)ST2269-transketolase转酮醇酶
(7)ST2245-Phosphoglucoseisomerase磷酸葡萄糖异构酶
(8)ST2484-aldehydeoxidoreductase乙醛氧化还原酶
(9)ST2477-glyceraldehyde-3-phosphatedehydrogenase甘油醛3磷酸脱氢酶
1.6选题的目的与意义
第二章材料与方法
2.1.1材料
各物种与古细菌糖酵解途径有关的酶的基因及蛋白序列从美国国家生物技术中心(NCBI)GenBank下载。
以下以烯醇化酶(ST1212)为例阐述方法步骤。
2.1.2方法
(1)在NCBI网站(http:
//www.ncbi.nlm.nih.gov/)上方搜索栏中输入ST2037(如图1)。
图1
(2)选择蛋白质序列数据库(Protein:
sequencedatabase)。
(3)第一个既是ST1212基因在GenBank中的信息。
其中ACCESSION:
NP_377144为此基因在GenBank中的序列号,ORIGIN表示编码该蛋白的氨基酸序列,为MNDYFRIKKIKGYQILDSRGNKTIRVKIETYGGISETGDAPAGASKG
SREAIELRDKDGGVTRAVELVNTLINDSLRDFDVRNQLGIDQTLIRMDGTPNKSRVGGNTTIATSIAVAKTAAKAMGLEIFQYIGGPRVRYLPIPLLNILNGGLHAGNELKIQEFI
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 古细菌Pyrococcus horikoshii糖酵解途径酶类的生物信息学统计毕业论文 细菌 Pyrococcus horikoshii 酵解 途径 生物 信息学 统计 毕业论文
链接地址:https://www.bdocx.com/doc/16882292.html