多基因联合建树图解教程(引用高老师).docx
- 文档编号:1701731
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:7
- 大小:614.87KB
多基因联合建树图解教程(引用高老师).docx
《多基因联合建树图解教程(引用高老师).docx》由会员分享,可在线阅读,更多相关《多基因联合建树图解教程(引用高老师).docx(7页珍藏版)》请在冰豆网上搜索。
多基因联合建树图解教程(引高老师原创)
工具】(引用高老师原创)
MAFFT(多序列比对及序列排序)、SequenceMatrix(多源数据合并)、PAUP(同质性检验)、Mrbayes(支持分源数据集建树)
【流程】
1.序列比对及排序
在MEGA中打开序列进行逐一进行多重比对,并对序列名称进行排序。
排序的目的主要是避免后续序列串联拼接时发生错位,如上图所示,点击MEGA比对浏览器界面的左上角"Species/Abbrv"即可进行升序/降序排列,最后导出Fasta格式的多重序列比对文件。
2.序列合并
运行SequenceMatrix,在菜单上依次点击“Import”-“AddSequence”-选择待目的序列,如下图:
导出过程会提示是否将空位标记为问号,建议选择选择“全否”。
逐一添加不同基因的多重比对序列后,同样点击菜单栏上方的“Export”导出nexus文件的合并序列文件,这里注意不同基因的前后顺序。
导出的nexus带序列长度的标识,建议用PAUP等软件对序列文件进化格式化,建议保存为non-interleaved的nexus文件。
3.同质性检验
同质性检验(Testingforhomogeneity)两种方法的参考脚本:
(1)不相合长度差异检验(Incongruencelengthdifferencetest, ILDTest)
------------------------------------------------
beginset;
CHARSET01P1=1-825;
CHARSET02HC=826-2220;
CHARSET03Vpg=2221-2784;
charpartitiongenes=gene1:
01P1,gene2:
02HC,gene3:
03VPg;
end;
BeginPAUP;
logfile=ildtest.log;
hompartpartition=genesnreps=100/start=stepwiseaddseq=randomnreps=10savereps=norandomize=addseqrstatus=nohold=1swap=tbrmultrees=yes;
logstop;
End;
-------------------------------------------------------------
(2)同质性检验(Partitionhomogeneitytest,PHT)
--------------------------------------------------
beginsets;
charpartitionfavored=1:
1-825,2:
826-2220,3:
2221-2784;
end;
beginpaup;
hompartpartition=favorednreps=100search=bandb;
end;
-------------------------------------------------
这里仅演示 ILDTest检验,将上述参考文件添加在第2步得到合并的nexus文件尾,如下图
添加脚本完毕,在PAUP中打开添加脚本后的nexus文件,运行如下图所示
当异质性检验完成后,同一目录下会生成一个日志文件(*.log),即为检验结果,如下图所示,p值0.01远小于数据集可联合与不可联合的阈值0.05,表明这些数据集最好不要联合分析。
但后来相关的研究表明,即使p值小于0.01,数据集照样可以联合分析。
4.联合多基因建树
4.1数据不分区(Nopartition):
即合并后的数据集视为一体,只计算整体的核苷酸替换模型,操作方法如单基因的系统发育重建,此文不再赘述。
4.2数据分区(Partition):
即合并的数据集中,针对每个基因分别对应的核苷酸替换模型。
目前支持分区的软件有RaxML、Mrbayes和BEAST等。
以下为Mrbayes的参考脚本:
beginmrbayes;
CHARSET01P1=1-825;
CHARSET02HC=826-2220;
CHARSET03VPg=2221-2784;
CHARSET04CP=2785-3585;
partitiongene=4:
01P1,02HC,03VPg,04CP;
setpartition=gene;
lsetapplyto=
(1)nst=6rates=propinv;
lsetapplyto=
(2)nst=6rates=invgamma;
lsetapplyto=(3)nst=6rates=gamma;
lsetapplyto=(4)nst=6rates=propinv;
Prset applyto=(all) statefreqpr=dirichlet(1,1,1,1);
mcmcpsavebrlens=yesngen=2000000samplefreq=100nchains=4;
mcmc;
sumtcontype=allcompatburnin=5000;
end;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多基因 联合 建树 图解 教程 引用 老师