Phylip中文使用说明.doc
- 文档编号:1694836
- 上传时间:2022-10-23
- 格式:DOC
- 页数:13
- 大小:407KB
Phylip中文使用说明.doc
《Phylip中文使用说明.doc》由会员分享,可在线阅读,更多相关《Phylip中文使用说明.doc(13页珍藏版)》请在冰豆网上搜索。
Phylip中文使用说
Introduction
PHYLIP程序的运行
这些程序要按照一定的顺序来运行。
前一个程序的输出作为下一个程序的输入。
如何合理的组合这些程序也很关键。
在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。
我们建议使用命令行方式,因为你也许能看到一些错误提示。
它启动的方是:
开始->所有程序->附件->命令提示符。
大部分PHYLIP程序运行方法相同。
程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。
输出结果写在outfile文件中。
有些则写在outfile和outtree或plotfile中。
因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。
比如,你用Dnadist得到了距离矩阵(outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_outfile,或其它名称,这样你就能区别两次的结果了。
程序
重抽样工具
该程序生成一系列的特殊的随机样本,保存在outfile中。
这些样本在后继的分析中作为一个序列对文件,要设置选项M(usemultipledatasets)。
Seqboot 生成随机样本,用bootstrap和jack-knife方法。
距离方法:
顺序使用这些程序。
首先,用dandist或protdist程序计算序列比对结果的距离矩阵。
接着这个矩阵被fitch、kitsch或neighbor程序转换为树。
Dandist和protdist程序的输出文件是outfile。
在运行fitch、kitsch或neighbor前,outfile应该重命名为infile或另外的名字。
fitch、kitsch和neighbor的输出文件是outfile和outtree。
Dnadist DNA距离矩阵计算器
Protdist 蛋白质距离矩阵计算器
Fitch 没有分子时钟的Fitch-Margoliash树
Kitsch 有分子时钟的Fitch-Margoliash树
Neighbor Neighbor-Joining和UPGMA树
基于字符的方法
这些程序读入一个序列对,它们的输出文件是outfile和outtree。
Dnapars DNA简约法
Dnapenny DNA简约法usingbranch-and-bound
Dnaml DNA最大似然,无分子时钟
Dnamlk DNA最大似然,有分子时钟
Protpars 蛋白质简约法
Proml 蛋白质最大似然法
画树
这些程序可画newick格式的树。
如,danml程序生成的树。
Drawgram和drawtree生成文件为plotfile,而retree生成outtree。
Drawgram 画有根树
Drawtree 画无根树
Retree interactivetree-rearrangement
一致树
用多重树构建一致树。
如,dnapars可生成多重树,可用consense程序来汇总。
Bootstrap的结果也由它来汇总为一棵majorityruletree。
Consense drawsconsensustreesfrommultipletrees
树的距离
计算多个树间的基于拓朴结构的距离。
该方法可用来比较不同分析方法的结果。
Treedist 计算树拓朴结构间的距离
Example距离法
一.获取序列
一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。
用BIOEDIT等软件编辑序列名称,注意PHYLIP在DOS下运行,文件名不能超过10位,超过的会自动截留前面10位。
二、多序列比对
目前一般应用CLASTALX进行,注意输出格式选用PHY格式。
生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,但是注意不是真正的进化树。
在clusterx中,生成的phylip文件的序列名称被截断成10字符,所以命名时注意要让树中出现什么名字。
三、构建进化树
N-J法建树
依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。
具体步骤如下:
(1)打开seqboot.exe
Seqboot首先检查该程序所在文件夹中是否有infile文件。
如果没有找到infile,它就会提示你输入序列比对文件。
输入文件名:
输入你用CLASTALX生成的PHY文件(*.phy)。
J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。
在此选择BootStrap
R为bootstrap的次数,R选项让使用者输入重复的replicate数目。
所谓replicate就是用Bootstrap法生成的一个多序列组。
根据多序列中所含的序列的数目的不同可以选取不同的,常用100或者1000。
(设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000)
当我们设置好条件后,键入Y按回车。
得到一个文件outfile,这个文件包括了1000个replicate。
输入Randomnumberseedoddnumber:
(4N+1)(eg:
1、5、9…)
改好了y
得到outfile(在phylip文件夹内)
改名为seqbootoutfile
(2)打开Dnadist.EXE
输入seqbootoutfile
得到dnadist的菜单
NucleicacidsequenceDistanceMatrixprogram,version3.66
Settingsforthisrun:
DDistance(F84,Kimura,Jukes-Cantor,LogDet)?
F84
GGammadistributedratesacrosssites?
No
TTransition/transversionratio?
2.0
COnecategoryofsubstitutionrates?
Yes
WUseweightsforsites?
No
FUseempiricalbasefrequencies?
Yes
LFormofdistancematrix?
Square
MAnalyzemultipledatasets?
No
IInputsequencesinterleaved?
Yes
0Terminaltype(IBMPC,ANSI,none)?
ANSI
1PrintoutthedataatstartofrunNo
2PrintindicationsofprogressofrunYes
Ytoaccepttheseortypetheletterforonetochange
输入d按回车将循环得到不同的进化模式(一般不选)
输入m修改M值,再按D,然后输入1000(M值对应前面BootStrap中的重复数值)
y
得到outfile(在phylip文件夹内)
改名为dnadistoutfile
(3)打开Neighboor.EXE
输入dnadistoutfile
菜单
Neighbor-Joining/UPGMAmethodversion3.66
Settingsforthisrun:
NNeighbor-joiningorUPGMAtree?
Neighbor-joining
OOutgrouproot?
No,useasoutgroupspecies1
LLower-triangulardatamatrix?
No
RUpper-triangulardatamatrix?
No
SSubreplicates?
No
JRandomizeinputorderofspecies?
No.Useinputorder
MAnalyzemultipledatasets?
No
0Terminaltype(IBMPC,ANSI,none)?
ANSI
1PrintoutthedataatstartofrunNo
2PrintindicationsofprogressofrunYes
3PrintouttreeYes
4Writeouttreesontotreefile?
Yes
Ytoaccepttheseortypetheletterforonetochange
选项J,设置随即分布
选项O是让使用者设定一个序列作为outgroup,这个不选,在后期用treeview或者mega打开再选择。
输入m,修改M=1000(M值)
输入Randomnumberseedoddnumber:
(4N+1)(eg:
1、5、9…)
按Y
得到outfile和outtree(在phylip文件夹内)
改outtree为neighborouttree,outfile改为neighboroutfile
(4)打开consense.exe
输入neighborouttree
y
得到outfile和outtree(在phylip文件夹内)
Outfile可以改为*.txt文件,用记事本打开阅读。
outtree可改为njouttree
想用treeview看到树图的bootstrap值必须用consense做出的outtree
(5)打开drawgram.exe(有根)或者drawtree.exe(无根)(这一步也可以不做)
该程序首先寻找文件fontfile,如果找不到它(如果你没有把字体文件之一改为fontfile的话),它会提示输入一个字体文件。
输入font1。
P选择图像输出格式
W对应的最终画图设备改为MS-windowsbitmap。
它还要要求你输入树的维数,比如说2000*2000。
Y按回车。
Drawgram打开一个新的窗口,你可以看到一棵树,如果你满意这个结果,选择file菜单中的plot。
在当前文件夹中出现一个plotfile文件。
如果你将它重命名为plotfile.bmp,就可用图形工具将它打开了。
四、进化树编辑和阅读
outtree可改为*.tre文件,直接双击在treeview里看;也可以不改文件扩展名,直接用treeview、PHYLODRAW、NJPLOT等软件打开编辑。
TREEVIEW可以显示BOOTSTRAN值,序列较多(60条以上)的时候打开直接显示有明显的重叠,可以在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Phylip 中文 使用说明