生物信息学第五章多序列对位排列和进化分析PPT推荐.ppt
- 文档编号:14694784
- 上传时间:2022-10-24
- 格式:PPT
- 页数:67
- 大小:4.77MB
生物信息学第五章多序列对位排列和进化分析PPT推荐.ppt
《生物信息学第五章多序列对位排列和进化分析PPT推荐.ppt》由会员分享,可在线阅读,更多相关《生物信息学第五章多序列对位排列和进化分析PPT推荐.ppt(67页珍藏版)》请在冰豆网上搜索。
为什么要做为什么要做MSA?
abcGenetreeABCSpeciestreeWeoftenassumethatgenetreesgiveusspeciestrees注意概念:
Paralogy(旁系同源/并系同源)&
Orthology(直系同源)Paralogy(旁系同源/并系同源)&
Orthology(直系同源)Orthologs:
物种形成过程中源自同一祖先,通常功能保守Paralogs:
基因组内基因复制产生,较易发生功能分化为什么要做为什么要做MSA?
不同物种不同物种基因组范围基因组范围的的MSA能分析基因组结构变异和共线性能分析基因组结构变异和共线性Nature423,241-254为什么要做为什么要做MSA?
Contigassembly怎么做怎么做MSA?
动态规划算法(dynamicprogramming):
MSA改进算法(启发式算法):
1.渐进法(progressivemethods):
Clustal,T-Coffee,MUSCLE2.迭代法(iterativemethods):
PRRP,DIALIGN3.其它算法:
PartialOrderAlgorithm、profileHMM、meta-methods(MAFFT)http:
/en.wikipedia.org/wiki/List_of_sequence_alignment_softwareCurrentOpinioninStructuralBiology2006,16:
368373两条及三条序列的动态规划算法VSNSSNAASStartVSNSSNAAS五条长度为200-250aa的蛋白质序列使用动态规划比对需要运算超过12小时uClustal:
目前目前被最广泛应用的被最广泛应用的MSA方法方法u可可在线分析在线分析u可可在本地计算机运行在本地计算机运行Clustal使用方法使用方法u序列输入序列输入、输出、输出格式格式FASTANBRF/PIREMBL/SWISSPROTALNGCG/MSFGCG9/RSFGDEALNNBRF/PIRGCG/MSFPHYLIPNEXUSGDE/FASTAInputOutputsequence1ATTGCAGTTCGCAsequence2ATAGCACATCGCAsequence3ATGCCACTCCGCC两两比对两两比对构建距离矩阵构建距离矩阵构建指导树构建指导树(guidetree)将距离最近的两条将距离最近的两条序列用动态规划的序列用动态规划的算法进行比对;
算法进行比对;
“渐进渐进”的加上其的加上其他的序列他的序列ClustalW/X算法基础算法基础“渐进渐进”比对(比对(Progressivealignment)uClustal在线分析方法在线分析方法(ClustalW)EBI的的ClustalW分析网页分析网页http:
/www.ebi.ac.uk/Tools/msa/clustalw2/粘贴或上载序列粘贴或上载序列调整参数调整参数http:
/www.ebi.ac.uk/Tools/msa/clustalw2/help/帮助文档帮助文档uClustal在线分析方法在线分析方法(ClustalW)自带自带Help文件文件UsingClustalXformultiplesequencealignmentbyJarnoTuimala两种工作模式两种工作模式:
MultipleAlignmentProfileAlignmentuClustal离线分析方法(离线分析方法(ClustalX)下载安装下载安装第一步:
输入序列第一步:
输入序列FileLoadsequences注意:
该软件不能识别中文。
因此序列不能位于XP系统的桌面,应放于C:
或D:
等纯英文路径下。
第二步:
设定比对参数第二步:
设定比对参数第三步:
进行序列比对第三步:
进行序列比对第四步:
比对完成,选择结果文件的保存格式第四步:
比对完成,选择结果文件的保存格式conservedresiduesconservationprofileu可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰
(1)Boxshade突出相同或相似位点突出相同或相似位点(http:
/www.ch.embnet.org/software/BOX_form.html)在在EBIClustalW结果网页结果网页复制复制序列比对结果序列比对结果在在“Boxshade”网页粘贴序列,在网页粘贴序列,在“Inputsequenceformat”栏目栏目选择选择“ALN”,在,在“Outputformat”栏目选栏目选择择“RTF_new”修饰过的排列结果修饰过的排列结果在结果网页点击在结果网页点击“hereisyouroutputnumber1”u可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰
(2)ESPript多种修饰多种修饰功能功能,突出相同或相似位点,突出相同或相似位点在在ESPript分析网页分析网页“AlignedSequences”栏上载栏上载ALN文件文件在在“Outputlayout”和和“Outputfileordevice”栏选择栏选择修饰后的比对结果修饰后的比对结果http:
/espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi在在EBIClustalW结果网页结果网页下载下载“Alignmentfile”(ALN文件文件)GeneDochttp:
/www.nrbsc.org/gfx/genedocFileImport修饰排列结果修饰排列结果选择输入文件的选择输入文件的格式(如格式(如ALN)u可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰(3)2.系统发生分析(系统发生分析(Phylogeneticanalysis)u分析基因或蛋白质的进化关系分析基因或蛋白质的进化关系u系统发生(进化)树(系统发生(进化)树(phylogenetictree)Atreeshowingtheevolutionaryrelationshipsamongvariousbiologicalspeciesorotherentitiesthatarebelievedtohaveacommonancestor.经典进化生物学:
经典进化生物学:
比较:
形态形态、生理结构生理结构、化石化石分子进化生物学:
分子进化生物学:
比较比较DNA和和蛋白质蛋白质序列序列研究系统发生的方法研究系统发生的方法Residuesthatarelinedupindifferentsequencesareconsideredtoshareacommonancestry(i.e.,theyarederivedfromacommonancestralresidue).AnAlignmentisanhypothesisofpositionalhomologybetweenbases/AminoAcidsEasyonlywithsubstitutionsDifficultalsowithindels=(A,(B,C),(D,E)Newickformat节点节点Node分支分支BranchABCDE末端节点末端节点可以是物种,可以是物种,群体,或者群体,或者蛋白质、蛋白质、DNA、RNA分子等分子等OTU祖先节点祖先节点/树根树根Root系统发生树术语系统发生树术语内部节点内部节点/分歧点分歧点该分支可能的祖先该分支可能的祖先HTUAclade(进化支进化支)isagroupoforganismsthatincludesanancestorandalldescendentsofthatancestor.geneticchangenomeaningPhylogramCladogramtimeTaxonATaxonBTaxonCTaxonD111635TaxonATaxonBTaxonCTaxonDTaxonATaxonBTaxonCTaxonDUltrametrictree时间度量树时间度量树进化树进化树分支树分支树系统发生树术语系统发生树术语Scaledbranches:
thelengthofthebranchisproportionaltothenumberofchanges.Thedistancebetween2speciesisthesumofthelengthofallbranchesconnectingthem.进化树分进化树分支的长度支的长度系统发生树术语系统发生树术语Rootedtreevs.Unrootedtreetwomajorwaystoroottrees:
ABCD102352d(A,D)=10+3+5=18Midpoint=18/2=9Bymidpointordistance有有根根树树ACBD无无根根树树系统发生树术语系统发生树术语outgroup外群、外围支外群、外围支系统发育树构建步骤系统发育树构建步骤多序列比对(自动比对、手工校正)多序列比对(自动比对、手工校正)选择建树方法(选择建树方法(替代模型替代模型)建立进化树建立进化树进化树评估进化树评估最大简约法最大简约法(maximumparsimony,MP)距离法距离法(distance)最大似然法最大似然法(maximumlikelihood,ML)贝叶斯法贝叶斯法(Bayesianinference)统计分析统计分析BootstrapLikelihoodRatioTestUPGMA邻近法邻近法(Neighbor-joining,NJ)最小进化法最小进化法(minimumevolution)距离法距离法距离法又称距离矩阵法,首先通过各个序列之间的比较,根据一定的假设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 第五 序列 对位 排列 进化 分析