构建生物进化树的方法比较.docx
- 文档编号:3992601
- 上传时间:2022-11-27
- 格式:DOCX
- 页数:19
- 大小:802.50KB
构建生物进化树的方法比较.docx
《构建生物进化树的方法比较.docx》由会员分享,可在线阅读,更多相关《构建生物进化树的方法比较.docx(19页珍藏版)》请在冰豆网上搜索。
构建生物进化树的方法比较
极为详细的建树方法,新手入门推荐
生物进化树的构建
前言2
一、NCBI6
二、Mega9
三、DNAMAN15
四、DNAStar18
五、Bioedit21
前言
1.背景资料
进化树(evolutionarytree)又名系统树(phylogenetietree)进化树,用来表示物种间亲缘关系远近的树状结构图。
在进化树中,各个分类单元(物种)依据进化关系的远近,被安放在树状图表上的不同位置。
所以,进化树简单地表示生物的进化历程和亲缘关系。
已发展成为多学科(包括生命科学中
的进化论、遗传学、分类学、分子生物学、生物化学、生物物理学和生态学,又包括数学中的概率统计、图论、计算机科学和群论)交叉形成的一个边缘领域
归纳总结生物进化的总趋势有以下几类:
1结构上:
由简单到复杂
2生活环境上:
由水生到陆生
3进化水平上:
由低等到高等
般来说,进化树是一个二叉树。
它由很多的分支和节点构成。
根据位置的不同,进化树的节
点分为外部节点和内部节点,外部节点就是我们要进行分类的分类单元(物种)。
而物种之间的进化关系则用节点之间的连线表示。
内部节点表示进化事件发生的地方,或表示分类单元进化的祖先。
在同一个进化树中,分类单元的选择应当标准一致。
进化树上不同节点之间的连线称为分支,其中有一端与叶子节点相连的分支称为外枝,不与叶子节点相连的分支称为内枝。
进化树一般有两种:
有根树和无根树。
有根树有一个鲜明的特征,那就是它有一个唯一的根节点。
这个根节点可以理解为所有其他节点的共同祖先。
所以,有根树能可以准确地反映各个物种的进化顺序,从根节点进化到任何其他节点只有能有一条惟一的路径。
无根树则不能直接给出根节点,无根树只反映各个不同节点之间的进化关系的远近,没有物种如何进化的过程。
但是,我们可以在无根树种指派根节点,从而找出各个物种的进化路径。
无根树
有根树
Pi-aυ Ii昨沪加沁込訴缈吋 HiHiOAD栽陶瓯目LQdKi颐* 5gS*回皿跡評lΛ⅛W^yw^λ皿 WEIA fjf WWdDaLo⅜LL KIjSMBr 何亞口羽 BaPfMt3ntg MfMffia≡∣⅛4ijι WrWalXtJ^u 分子进化树(以分子数据为依据构建的进化树)不仅精确地反映物种间或群体间在进化过程中发生的极微细的遗传变异(小至一个氨基酸或一个核昔酸差异),而且借助化石提供的大分子类群的分化年代能定量地估计出物种间或群体间的分化年代,这对进化论的研究而言无疑是一场革命。 序列比较是生物信息学中最频繁也是最有价值的工作。 要知道一个序列(结构)与另一个序列(结 构)或者与一批序列(结构)之间的差异,唯一的途径就是序列(结构)的比较分析。 序列水平上的比较反映的是字符串之间的差异,能够发现碱基序列或者氨基酸序列的保守模式。 但是,在分子生物学中,比较是多方面的,除了核酸或蛋白质序列的比较,也可以是结构的比较等。 事实上,相差很大的序列可以形成具有相同功能的分子。 而结构水平上的比较更能反映功能上的差异,能够发现与功能紧密相关的结构域。 结构比较方面的工作都是围绕蛋白质及RNA展开的。 构建进化树的方法包括两种: 一类是序列类似性比较,主要是基于氨基酸相对突变率矩阵(常用PAM250)计算不同序列差异性积分作为它们的差异性量度(序列进化树);另一类在难以通过序列比较构建序列进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立结构进化树。 三种主要的建树方法分别是距离法(distancemethod)、最大节约法(maximumparsimony,MP)和最大似然法(maximumlikelihood,ML)。 2.同源性 同源性(homology)是比较生物学中的一个中心概念。 同源,最基本的意义就是具有共同祖先。 一般来说,如果两个物种中有两个性状满足一下两个条件中的任意一个,就可以称这两个性状为一对同源状。 在分子进化研究中,同源性一般是指两个核酸分子的核苷酸序列或者两种蛋白质的氨基酸序列质检的相似程度。 序列分析是最终测定同源性程度的方法。 1直系同源(orthology)可以反映物种血统上的同源性,即物种进化的历史 2并系同源(paralogy)只反映基因进化的历史。 3异同源(xenology)仅仅部分反映基因进化历史。 4多异同源(paraxenology)与异同源的不同点在于主要基因组中它拥有的两个或者更多的外源基因拷贝。 5部分同源(plerology)由许多不同功能部分组成,而一个基因的组成中包含其他基因的片段。 、NCBI 1.进入NCBIStandardNucleotideBLAST标准界面,输入要比对的序列、名称,后BLAST ①血缘分类报告 ②距离进化树分析结果 根据实际情况适用Treemethod,MaxSeqDifference,SequnceLabel等信息 、Mega 1.将基因序列,导入软件中,比对 比对完成后,查看进化树 首先显示比对后文件到PhylogeneticAnalysis 查看比对结果 显示进化树 查看进化树 三、DNAMAN 插入序列,多序列比对 比对后进化树分析,可以导出为Clustal格式,可以用bioedit来查看 3文伴(D進墓©序列⑸^E)限屯占切®弓DcgP•仏电6∖αv<⅜q何阖I盂¾⅝赣空鴛固鉢血W耀t ①J今命6~可呗譏I 亦多厚刊比对I鋼无标禺SeC 23456789l0nl2l3Ml5l6l7l8HE 迭项 ^(D DNAMAN1 DNAMAN2 琨制S析®蛋自质二级结耐≡7K1≡KW 字水性M)垂刊氐所有宇列®濟B≡蚩三分祈(M) KC4"? 0223.1 KC⅞70222•二 KC470221•二 XC470220•二 KC470219.1 KC⅛7O215•二KC47O217.1 ZC47O216•二 KC470215.1 KC⅞702ie・: . KC<⅞70213.1 ZC47O212.1XC470211・1 KC470210.1 KC⅛702D9•二 ZC47O2D2・: TGGCTGGfTGGcTGGtTGG(TGGfTGGtTGGCTGGfTGGtTGGeTGGCTGGCTGG(Tgf GCG理式 GDE0: PHYLIP悟式 NBRF* ClUStaI式 MA≠1: Ca-CU-atz∏ffALignnentSCare-..1: DoZ 信冃∏[≡ι⅛^r <;DNAMAN-[多降列删・MSD] 0文件(D逾璟⑥序列⑸限剖性菊切IW弓I叨 IDfigEa昂fat⅞¾显⅜>KZ(⅝l⅝irf∣⅞⅞t鞘 甯管豚回i⅜ι≡经迥冷Ig西g⅜⅞瑚 N0Q4心©RURl I迹 1 2= 3S“・- 多序列比对NSD 选项 ^lI,ι∣∣ιrιιπIrl HOmOlOgVJTree 库列艾件⑸ 5 6 7 S 9 10 11 12 WcD 至形文件(EMF)g)限司性分析迟)枣自质二级结构 (2)號水性(W 亲水性(Y) 重尹比沱丽肓序列®稔腔蚩白分析(M) 育沟 IE)IS Hla—∣.ff ZxxJLA : TTTTAg: TTTTAB ZTTTTAg: TTTTAg: TTTT电: TTTTAB JCf⅛ CAft1CAA1CAA1CAACAACAA —口2亠X⅛k□akT IWGTAGTIBGHAGTqTM 打开DNAStar下MegAlign软件,将要分析的基因系列导入。 比对 基因系列具有同源性的用JotunHeinMethod比对,基因系列无关联的用ClustalW/Vmethod比对 查看比对报告 查看基因序列相似度 查看进化树 五、Bioedit 将要分析的基因序列导出软件,执行多系列比对 YBioEditSeqUenCeAlignmentEditOr IFiIeEditSeqUenCeAIignmentYieWI ACCeSSOryAPPliCatiQn BNAWOrIdWideWebQPtiOnSWndowHelp Add/MOdify/RemOVeanACCeSSOryAPPIiCatiOn C: \DocumcntsandScttingsXAdmii Q星)ICOUrierNeW-∣∣11▼[J ClUStaIW.Multiplealignment BLAST Mode: ISeleCt/Slide Seteelion;PoSition: CIUStalWEXamPIeAPPliCatiOn IDTEftGDd→ gi∣537801974 9i∣s∣y÷沪丨gχ∣g*l屛丨沪I 10 ATTAATACTTTTAAC 537801963537801954537801945537801335537801926537801916537801906537801895537801886 gi∣537801877gi∣537801868gi∣537801859gi∣^^^沪丨g丄丨g丄Ig"g丄丨g^∣g^∣qi∣537801773 5378018505378018405378018305378018205378OIalI5378OIaOO537801791537801782 DNADiSt—>NeighbOrPhylOgenetiCtree DNADiStDNAdistancematrix DNAmlDNAMaXimUmLikelihOOdPrOgram DNAmlkDNAMaXimUmLikelihOOdPrOgramWithmolecularCIOCk DNAParSDNAParSimOnymethod FostDNAmIDNAmaximumIikClihOOd FitCh-FitCh-MargOliaShandLeaSt-SqUareSDiStanCeMethOdS KitSCh-FitCh-MargOIiaShandLeaStSqUareSMethOdSWithEVOlUtiOnaryClOCk NEIGHBOR・・NeighbOr-JOiningandUPGMAmethods PrOMLPrOteinMaXimUmLikeIihOOdPrOgram PrOtdiSt∙∙∙>FitChPhylOgenetiCtree PrOtdiSt・・•>NeighbOrPhylOgenctictree PrOtdiStPrOteindistancematrix PrOtParSPrOteinParSimOnymethod □回 ClUStaIWOPtiOnS ClUStalWMUItiPlealignment Refefence: THomPSOnJ.D.,Higgins,D.G.andGibson,TJ.(1994) CLllSTALW: improvingthesδħsitivits∣OfPrOgreSSiVemultiple SeqUenCealignmentIh(OUghSeqUenCeWeightIng,POSitiOnSPeCifIC gapPenaItieSandWeIghtrr‰atrixchoice. NucIeicAodsReSearch,SUbmittedZJUne1994. *∙∙∙∙∙^∙∙∙∙∙*∙∙••»•*«••••«•••••«*•••••M∙∙∙∙M∙∙∙∙*∙ &FUllMUltiPIealignment ••・∙∙∙∙∙∙∙∙∙∙≡∙∙∙∙∙∙∙∙∙∙∙∙∙∙β∙∙∙∙∙*∙∙∙∙∙eβ∙∙∙∙*^ FCalCuIateNJTfee FFASTalgorithmforguideIree l√BOOtstfaPNJTfeeNlJnnberOfbootstraps: IlOoo GdPpenalties: Blank=default PalrWlSeBhgnmerits MUlIiPIealignment GaPOPen GaPOPen GaPextend GaPθxt9∩d OtherParameters: Note: enteradditionalparametersasaSingleline. 厂DUtPUtClUStaIformatWithClu^talCOnSenSMSSeqUenCegeneration AddIliOnalParametersforCIUSlalW: XXKGenefalSettings;MKMW XQUICKTREE: USeFASTalgorithmforthealignmentguidetree∕NEWTREE=: filefαnewguidehee /USETREE=: hieforOldguideIree /NEGATIVE: P(OteinalignmentWithnegativeValUeSInmatrix i ⅝∣ VieWCIUSfaK√DOC CanCel 比对完成后,进化树分析 BioEditSeqUenCeAIignmentEditOr FileEditFOrmatFileACCeSOryAPPIiCatiOnRNAWOrIdWideWebC 毬INeighbOrIinkforDNADiSt->NeighbOrOIrtPUtfiIeO: OUtfile —88÷gi∣399525912IgbIH¢644267.1IKUnlarLPaPillOmavιrnstype +ξι∣399525885Igb∣HQ644264.1∣HwnuiPalIlIoniaVrIrUStype16 ! ! +ξi1399526182Igb∣}{Q644297.1IHuJnaJIpa.jilLoiftavirusIyPe18 KD! 161s isola isola +ςi156463023Ig"b∣λY686584.1IHUjnanfapιIlOlTlaVirUStyp⅛16iso* ÷gi1564629961gb∣λY68658L.1∣HunanPaPIlIo ! ! I+-55+gi13⅞9526065∣gb∣HQ644284.1∣HiimanPaPilIomaVirUSt: *-9iI! I +gi∣3θθ525θO3Igb∣HQ644266.1IHumanPaPiLlonlaVirUStype +gi∣242347716Igb∣FJ610149.LIHumanPaPilloniaVirUStype gi13^9525994IgbIHQ644275.1∣H-Umanpapillomavirust: +gi15646: +-92! +-8 II+-A ”EbE∙qAccesoryAPPlkdtiOn^NAW(XIdwideWebQPtIOnSWlrXiOW冰IP Jl BnW€ r∙ J〜;,入・■∙rw***r⅛rw*<∙ι ^^llnhK∩>718.1FPH16HimanPQ)OrIi忻gIe *,? ***λ',I7IrrAnWdHrVV√Qιe22"lhα(‰ "f*MhlΓ>C"7卷1PFH1≡Hι∣IhjrlPhtiIOmiU01心16UUnk∣EBPIQ 'Γ*L∙^fF,怅厂7τFH7q"UX訂p⅜∙rLmilnnWlMGrC∙<∣np16F? n^^*∙∙∙,Vr*-^∙.l÷KΠAIZlRIIHc*W.∣Λrr.v∕rnkrr1K.*λL*^ASCOlL2Mate=F~β.7V^∏1IIHn^Fnilgw爪^nAW「7什" ~∙VHtΓ.7并朋“11H∣4r^=rPnilgR"zVnAIRFRanrQυ4∩Ad42R7IlHl^nn^⅞∣h0V6⅛ιtIUrWbIRN3aCEW¢3 ∙<ΓJA4427l? 1MlHΛ,^lhr^*v∙mxlur⅞*IRRrI^RIJVl7∕^f⅜-ia ∕RR⅛r和TIHm-r∣rvrulnrzwzkr∣⅛IR∣*mUI*CvlFj⅛>β! F7R41: MlrVAnHΛ∙^lhr^*v∙t∣ιxIurv*IARrl⅛rIJVyfllflPARIiHlrfAnnΛ^lk∩r%-A∙∙ιι∙I∣*v∙IPΠ√C⅞49D 讣厶"I JrJg: N— p,Jκ1rt1gIlHlJTΛ∏nΛ∏∣lrιrfc-∣vi∙tiΛ”y1「vr.-inCl14-JnPX! 427c.IlMuTλπnΛ^llnr∖∙*√rι∣ftIJrtrIArclvπ,βftRTflz11HFixniInmAVfa⅞IVrlUIAimbZHVlH⅛ιlAAIlHunrΛ∏n√*rv∣⅛n*^wv∙'∣∣τIJrWIAvnl√H∩w99J7R4∏F∙fl477^IlHlrTΛr∙∣∣λ->IhnRvnixIULIBPnWrΠv1! 1∩F*74∏P4X7R1IlHlfRnAnr⅛Aribrvw⅛mIA"3∙.∩rx4>7√IMj-τΛnnΛ->Hrr⅛∙^rι∣∆tjnrIA仃QMTl df)RZ"R11-4u∙»«r»πa-∙I⅛π<∣^∙115: IAirrl^∣^*∩vΓ4ftV*<ΓJhZ42*κ⅛1Hu・Atlf∣∕4^B∣h∏fi^A.aH2∣jr>-IHKnMnIJvΓ∣ΓH/4f,FiAff-7ATlMmw⅛r⅛-tι∣inrrΛV<∣∙cIVrtKIfiι∙nUMOVl⅛⅛>∏∆Λ<("HTnIlHlrrΛr.n^∙lh∙r⅜R∖lfn∣χIUnRIF.PnWFΠv137,¾1^ΩP442<^jlHlJnrλπn,、rIhrvAiiw>urv*IA^lVλΓΠAA⅛? 4? 41IlMIJYAn∏Λ-⅝lk∩rb¾Mιι⅛rrlvftΓιf∙⅝O(J⅛ ∙∩∩1"MIlMX・icGhw"∙zk∏HIA: i∣,⅛-.∏∣14IJIIIlRiliXIdsYIinrV^∙√Itok∏HIRfi∣A∙r∣ΓlHl4∩PZZ9471H∣>vλπ∏Λrιlbm*MinIlIrV-IRc%r∣√rINnTf7θ4nP447QRIlUHVλhr*Ari⅛∙r⅛f∙∙∣ι∙Nr⅝^1P∙dci—oIIPAX)IJTAn∏Λ-∙llr
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 构建 生物 进化 方法 比较