第五章序列的同源比较及分子系统学和分子进化分析PPT格式课件下载.ppt
- 文档编号:14695094
- 上传时间:2022-10-24
- 格式:PPT
- 页数:63
- 大小:254.50KB
第五章序列的同源比较及分子系统学和分子进化分析PPT格式课件下载.ppt
《第五章序列的同源比较及分子系统学和分子进化分析PPT格式课件下载.ppt》由会员分享,可在线阅读,更多相关《第五章序列的同源比较及分子系统学和分子进化分析PPT格式课件下载.ppt(63页珍藏版)》请在冰豆网上搜索。
现如今,以大量公开的核酸和蛋白质数据为基础,利用序列分析的计算机软件构建生物进化树来研究各物种间的进化关系。
10/24/20222.n在本章里研究进化关系所用的软件,我们在应用这些软件时会遇到很多专业术语和应用的计算机程序。
这些陌生的术语对于初学者的我们没必要搞清,只要会用就可以了,但要做出非常专业的进化分析则必须搞清每个专业术语的含义。
n构建系统树有很多的方法和步骤,我们会逐步学习,但不管采用什么样的方法,都有一些值得注意的问题:
10/24/20223.第二节:
相似序列的获得n对一段序列进行进化分析的基础是获得此序列大量的同源序列,包括同一物种和不同物种之间,当序列有足够的相似性性,我们才能推断序列之间是否具有同源性。
n同源性的判断是质的判断,进化分析是量的结果,两者之间如何进行统一,就是要有假设,当序列之间相似性超过一个值时,认为其是同源的。
n序列相似的原因有两个:
一是来自于同一祖先,然后发生分歧,二是两个序列来自于不同的祖先,在相似的选择压力下发生趋同进化,形成相似序列。
10/24/20224.n三、VASTnVAST是NCBI的相似结构搜索工具,它将一个新的蛋白质三维结构与PDB或MMDB数据库中的结构进行比较,通过结构比较,可以发现通过序列比较而无法发现的远程同源蛋白质。
nVAST算法是基于统计以下的结构相似性比较算法,VAST在评价结构相似显著性时,不过多的考虑微小子结构因偶然因素而形成的相似关系,而是着重考虑结构域的相似性。
nhttp:
/www.ncbi.nlm.nih.gov/structure/VAST/10/24/20225.nVAST的比较有三个步骤:
n首先,在数据坐标的基础上,标出所有构成蛋白质核心部分的螺旋和片层。
n然后根据这些二级结构单位的位置计算向量。
使用这些向量进行结构比对而不是整个一套坐标。
然后算法试图最佳地匹配这些向量,寻找类型和相对方向相同的成对结构单位,并且在这些单位之间还要有同样的连接方式。
n最后,在每个残基位置上使用蒙特卡洛方法对结构的比对进行优化。
(1LFL)10/24/20226.第三节:
多序列比对n用于多序列比对的程序开发是一个很活跃的领域,目前,绝大多数的方法均是基于渐进比对的概念。
n渐进比对的方法假设了参与比对的序列存在亲缘关系,在算法上下功夫,以寻求计算速度与获得最佳比对之间的平衡。
n一、CLUSTAL.W10/24/20227.nCLUSTAL是一个单机版的基于渐进比对的多序列比对工具,由HigginsD.G.等开发。
有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,clustalx等。
nCLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;
然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;
然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。
10/24/20228.CLUSTAL.W工作原理工作原理Clustal输输入多个序列入多个序列快速的序列两两比快速的序列两两比对对,计计算序列算序列间间的的距离,距离,获获得一个距离矩得一个距离矩阵阵。
邻邻接法接法(NJ)构建一个构建一个树树(引(引导树导树)根据引根据引导树导树,渐进渐进比比对对多个序列。
多个序列。
10/24/20229.CLUSTAL.W应用1.输输入入输输出格式。
出格式。
输入序列的格式比较灵活,可以是前面介绍过的FASTA格式,还可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。
输出格式也可以选择,有ALN、GCG、PHYLIP和NEXUS等,用户可以根据自己的需要选择合适的输出格式。
10/24/202210.2.两种工作模式。
两种工作模式。
a.多序列比多序列比对对模式。
模式。
b.剖面剖面(profile)比比对对模式。
3.一个一个实际实际的例子。
的例子。
CLUSTAL.W的应用10/24/202211.多序列比对实例步骤输入文件的格式(fasta):
KCC2_YEASTNYIFGRTLGAGSFGVVRQARKLSTNDMK_HUMANDFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK.KPRO_MAIZETRKFKVELGRGESGTVYKGVLEDDRHVAVKKLENDAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD1CSNHYKVGRRIGEGSFGVIFEGTNLLNN10/24/202212.第一步:
输入序列文件。
10/24/202213.第二步:
设定比对的一些参数。
10/24/202214.第三步:
开始序列比对n第三步:
开始序列比对10/24/202215.第四步:
比对完成,选择保存结果文件的格式n第四步:
比对完成,选择保存结果文件的格式10/24/202216.n二、BioEditnBioEdit程序非常适合序列比对、编辑和分析,是基于Windows平台的一种比对程序,目前应用最多,可免费下载。
nBioEdit具体用法见n三、MultAlinnMultAlin从一系列的两联比对开始,得到分值,然后根据这个分值进行分层次的聚类。
/multalin.toulouse.inra.fr/multalin/multalin.htmln四、GCG数据库nGCG软件是一套蛋白质、核酸序列分析软件。
10/24/202217.nGCG支持五种数据库供Wisconsin软件包使用,其中包括两种核酸数据库(GenBank数据库、由GenBank中没有的序列组成的简化版的EMBL核酸序列数据库)和三种蛋白质数据库(PIR、Swiss-Prot、SP-TrEMBL数据库)。
GCG支持的数据库两个月更新一次。
10/24/202218.第四节:
系统发育分析课本104页n系统发育分析是根据同源性状的分歧来评估物种或分子之间的进化关系。
这种进化关系通常用分支图(系统树)来描述。
对序列的系统发育分析又称为分子系统学或分子系统发育研究。
n比起其他实验性学科,分子系统学与其他进化研究一样有其局限,即系统发育的发生过程都是已经完成的历史,不能再现。
n如何从序列中得到有用的信息,如何用计算的办法得到可信的进化树,如何从有限的数据得到进化模式已成为这个领域的研究热点。
n系统发育树是什么?
n对一组实际对象的世系关系的描述(如基因,物种等)。
10/24/202219.一个系统发育树末端物种顶端中间节点中间枝条根末端分支叶子节点10/24/202220.ABCDEFG树只代表分支的拓扑结构FGCDEAB10/24/202221.n一般来说,系统树是一种两叉树,由一系列节点和分支组成,每个节点代表一个分类单元(物种或序列),而节点之间的连线代表物种间的进化关系。
树的节点又分为外部节点和内部节点。
n系统发生树有多种形式:
可能是有根树(rootedtree),也可能是无根树(unrootedtree);
可能是一般的树,也可能是二叉树;
可能是有权值的树(或标度树,树中标明分支长度),也可能是无权值树(非标度树)。
n在有根树中,有一个唯一的根节点,代表所有其他根节点的共同祖先,这样的树能够反映进化层次,从根节点历经进化到任何其他节点只有唯一的路径。
10/24/202222.Rootedbyoutgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteriaoutgrouprooteukaryoteeukaryoteeukaryoteeukaryote无根无根树archaeaarchaeaarchaeaMonophyleticgroup(单源群源群)Monophyleticgroup有根有根树,无根,无根树,外,外围群群有根有根树外外围群群10/24/202223.n分子进化研究的基础(假设)n核苷酸和氨基酸序列中含有生物进化历史的全部信息。
n分子进化研究的基础(理论)n在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。
(分子钟理论,1965)n分子进化研究的基础(实际)n虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律。
10/24/202224.从一个分歧数据可以推测其他序列分歧度分歧时间xy分子钟理论10/24/202225.n一、系统树的构建方法n系统树的构建主要有三种方法:
距离法、最简约法、最大似然法。
n1、距离法n距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。
进化树的构建则是基于这个矩阵中的进化距离关系。
计算序列的距离,建立距离矩阵通过距离矩阵建进化树10/24/202226.一种简单的距离矩阵10/24/202227.由进化距离构建进化树的方法有很多,常见有:
(1).Fitch-MargoliashMethod(FM法)
(2).Neighbor-JoiningMethod(NJ法/邻接法)(3).NeighborsRelatonMethod(邻居关系法)(4).UnweightedPairGroupMethod(UPGMA法)通过矩阵建树的方法10/24/202228.Fitch-Margoliash方法(FM法)10/24/202229.1.找出关系最近的序列对,如A和B2.将剩余的序列作为一个简单复合序列,分别计算A、B到所有其他序列的距离的平均值3.用这些值来计算A和B间的距离4.将A、B作为一个单一的复合序列AB,计算与每一个其他序列的距离,生成新的距离矩阵5.确定下一对关系最近的序列,重复前面的步聚计算枝长7.从每个序列对开始,重复整个过程8.对每个树计算每对序列间的预测距离,发现与原始数据最符合的树Fitch-Margoliash方法(FM法)小结10/24/202230.NJ/邻接法任意两个节点选为相邻序列的总支长计算公式10/24/202231.把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程。
10/24/202232.邻居关系法AB组合出现3次,DE组合出现3次,CD、AC、BC组合各一次,则AB和DE各为两对关系最近的邻居。
(关系最近的邻居作为邻居的次数最多),将邻居看成一个新的复合序列,重复这个过程。
10/24/202233.UPGMA法d=e=10/2=510/24/202234.c=19/2=9.5g=c-d=9.5-5=4.510/24/202235.a=b=22/2=1110/24/202236.f1+a=f2+c=40.5/2=20.25f1=9.25,f2=11.7510/24/202237.n2、最大简约法n简约法是分子系统学中应用最广的一种方法。
该方法的原则是在所有可能的物种中,最能反映进化历史的树具有最短的树长,即进化步数最少(形状在系统树种改变的次数)n树长是所有形状在所有分支上发生的状态改变的总和。
10/24/202238.n最大简约法(maximumparsimony,MP)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。
最大简约法的理论基础是奥卡姆(Ockham)哲学原则,这个原则认为:
解释一个过程的最好理论是所需假设数目最少的那一个。
对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 序列 同源 比较 分子 系统学 进化 分析