MEGA软件的使用.docx
- 文档编号:11927964
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:19
- 大小:58.05KB
MEGA软件的使用.docx
《MEGA软件的使用.docx》由会员分享,可在线阅读,更多相关《MEGA软件的使用.docx(19页珍藏版)》请在冰豆网上搜索。
MEGA软件的使用
MEGA软件的使用
Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手。
1、数据的录入及编辑
Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUP数据格式等等。
而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。
首先,打开Mega程序,有如下图所示的操作界面:
吒:
旺Im1:
tuJ.h4xklhe^匚n.Kau.Jjialj-s
单击工具栏中的“File按钮,会出现如下图所示的菜单:
FiT*feu]Hcb-ImeEvpil・*lI'=miiEr匚■"■•fir.Jjh.lra.斗
珀IpghriQUi^VnLi
!
■..
L.■
Coru1.]IU血Fie-ifeL.
T<1-*FTiI-T
n
Iriblw£・£*m
LtM
从上图可以看出,下拉菜单有“OpenData”打开数据)、“ReopenData”打
开曾经打开的数据,一般会保留新近打开的几个数据)、“CloseDat(关闭数据)、
“ExportData(导出数据)、“ConverToMEGAFormat(将数据转化为MEGA格式)、“TextEditor(数据文本编辑)、“PrinterSetup(启动打印)、“Exit(退出MEGA程序)。
单击“OpenDat选项,会弹出如下菜单:
iJjuaaa)心十仏
|31|.…|rri_dLLL"-p[
■yn-iA^-pic-inihfehri
*yh*_Dl|rt.■_(
□环
Fliai
浏览文件,选择要分析的数据打开,单击打开”按钮,会弹出如下操作界面:
r
ZiiputD^ita
冈"
1-仙Tjj「4
1—
Rkj:
冲册*的IB亍
血sshflDrHj
R-nfftinSpcjjftfirR^P汕wiseDista'ice
^nfTigntSap-
IdcrtK-alEyirbc/■
'匚Nd匸』
Xr*irpi?
He口
此程序操作界面,提供了三种选择数据选择:
NucleotideSequences(核苷酸
序列)、ProteinSequence(蛋白质序列)、PairwiseDistanee(遗传距离矩阵)。
根据输入数据的类型,选择一种,点击则操作界面有所不同;如下图所示:
“0K即可。
如果选择
“PairwisQstanee,‘
I
DdUTjipe
WijrHflnt.ripSiwiupn帕s
PFoteinS钳Lian护
MhsinaData”
MMfHFomnal
常Ljov*cpLeftMitratfUpperRightW日liix
根据遗传距离矩阵的类型,可;如果是上三角矩阵,选择导入数据。
如果是核苷酸数据,
如果是下三角矩阵,选择
“UpperRightMatrix”即可。
则读完之后,会弹出如下对话框:
□iK如
丘IB]
riDMiii
KqrKjic;
如上图,如果是编码蛋白质的核苷酸序列,则选择
“YeS”钮;如果是不编
码蛋白质的核苷酸序列,则点击
“No”钮。
之后,会弹出如下操作窗口:
''H'H."hl■■'iF■rt1Hi.:
-1==r
I"jotih卜iF'lj"*■*■?
!
■!
■
Hth
Uifey匝3■卜Ph*|i
Ta呂■:
Jr
aTaaagl-C-a■
1TT“njt:
Ut麻;L"4
A
:
才川•Ml
鼻
T.
,T-fJ
_T=
*-nj-n
T.
*.3j.in
1.
T
T
亠诃•I'O)
1.
1
TaTr?
~
.T.
*wrMIf
1=
*Tij^nhbn
T
T
<
l.lflMfULi^a
IktH
此作界面的名称是“SequeneeDataExplore,在其最上方是工具栏“Data”
“Display、”“Highlight等,'然后是一些数据处理方式的快捷按钮,在操作界面的
左下方是每个序列的名称。
显示序列占了操作界面的绝大部分,
与第一个序列相
同的核苷酸用“.表示,发生变异的序列则直接显示。
2、遗传距离的计算
点击Mega操作主界面的“Distanee按钮,会弹出一个下拉菜单。
如下图所
示:
Icl^z-LilukTo^irtz-cnarr<-r»etijcnImilyjaj-VcrffiEn.二亠U
SlJBl
Jil-feIiLiL上」讥HE3.7说時myfkli-arbUFibd^riH*l|
£为期扁鋤
止_L・2㈡'LC*¥屮卓Ti・i■**
rr
fSL刑匕二Lfuxhlh.吗■■皿「二•工「tfipnuriikRv^feit舜r协!
."4直.
■:
r曲吐IOfm申*中・
■2.PLTirkU?
'i如P
Hlac.Dcvirn^7&rIo-IetiF■节iIiIl■:
niViJrtEnwrjXUtlLWWl
CriLLLjtJiiL^LiJjLLKulLLLini.
从上图易知,此菜单包括如下选项:
“ChooseModel”(选择模型,即选择计
算遗传距离的模型)、“ComputePairwis(计算遗传配对差异)、“ComputeOverall
Mean(计算包括所有样本在内的平均遗传距离)、“ComputeWithGroupMeans”
(计算组内平均遗传距离)、“ComputeBetweenGroupsMean(计算组间平均遗传距离)、“Compute^etBetweenGroupsMeans'(计算组间平均净遗传距离)、
“ComputeSequeneeDiversity(计算序列分歧度)。
“ComputeSequeneeDiversit选项包括四个子菜单:
“MeanDiversityWithinSubpopulations”亚群体内部平均序列多态性)、“MeanDiversityforEntirePopulation”整个人群平均序列多态性)、“MeannterpopulaionalDiversity('群体内部平均序列多态性)、“CoeffieientofDifferentiation(遗传变异系数)。
点击“ChooseMode选项,会弹出如下操作界面:
底■早i鼻PTE;fi:
rin^:
L
J二凶
H血rift比iCbArxu
M占
KirwiuZT
Pdt±-nMioyLTU鬥
Urfani-J>n■
1/卩1|1
从上述操作界面可以看出,通过此对话框可以选择计算遗传距离的模型等。
“DataType显示数据的类型:
Nucleotide(Coding)(编码蛋白质的DNA序列)、Nucleotide(不编码蛋白质的DNA序列)、AminoAcid(氨基酸序列)。
通过“Mode选项可以选择,计算遗传距离的距离模型。
点击“Model一行末端的按钮会弹出一选择栏。
Fd-o£Differeruzest-diatance
^ujcleotide•]
Syn-flonsynoiLjmicnis卜由Tin*Acid►
Jiikaa~C
Eimura2~Farajneter
1
Tanrura3-F曲初sttriMiiira-NtL
LogjletCTamuraEmuar)
如上图所示,对于非编码的核苷酸序列Mega程序提供了八种距离模型:
“NumberofDifferenee'(核苷酸差异数)、“Pistanee(P距离模型)、
“JukeCantor”Jukes和Cantor距离模型)、“Kimura^Parameter(Kimura双参数模型)、“TajimOMei”(Tajima和Nei距离模型)、“Tamura-parameter"(Tamura三参数模型)、“Tamura^ei”Tamura和Nei距离模型)、“LogDeJTamurakuma)"
(对数行列式距离模型)。
对于编码的核苷酸序列,其遗传距离模型如下图所示:
Wai-Gojobori閒pthod.卜
Modifiedllti-Gojctori*
Nuclectide卜
帥iiLOAciJ卜
Li-Tffu-LiioHethod
Fafnil&-Eian.cKL-LiMethod
Elimar*Method
如上图所示,对于编码蛋白质的DNA序列,Mega程序提供了一下几种模型:
“NeGojoboriMethod',“ModifiedNei-GojoboriMethoec”、“L-Wu-Luo
Method”、“Pamil-Bianchi-LiMethod”、“KumarMethod”。
其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型:
“NumberofDifferences、”“-distanee、”“JukeCantor。
对于氨基酸序列,Mega所提供的遗传距离模型如下图所示:
Hucleotide
H?
?
£Ififfcrezicts
FoisscnCfflrrection
EqualInput
F眇Hatriif(Ilayhoff)
JTTMatrixdones-Taylor-Thornton^
如上图所示,对于氨基酸序列,Mega程序提供了一下六种遗传距离模型:
“NumberofDifferences(氨基酸差异数)、“Pistanee[P距离模型)、“PoissonCorrection(泊松校正距离模型)、“Equallnput”(等量输入距离模型)、“PAMMatrix(Dayhoff)((PAM距离矩阵模型)、“JTTMatrix(Jones-Taylor-Thorntor)(
(JTT距离矩阵模型)。
在“AnalysisPreferenc操作界面中,“PatternAmongLineage仅提供了一个
选项:
“Sam(HomogenouS)”,“也就是说样本之间是有一定同源性的。
“Rates
amongsites提供了两个选项:
“UniformRates和”“Differe(GammaDistributed)”。
“UniformRates意味着所有序列的所有位点的进化速率是相同的。
选择“Different
(GammaDistributed)”意味着序列位点之间的进化速率是不相同的,可以利
用Gamma参数来校正,系统提供了四个数值可供选择:
2.0、1.0、0.5、0.25;软件使用者也可以自行决定Gamma参数的大小。
设置完毕后,在此界面中点击
“OK按钮,即可返回Mega操作主界面。
选择主操作界面“Distanee中”勺“ComputePairwise选项H,可以计算样本之间的遗传距离的大小,其操作界面如下图所示:
二皿dJ.”3-VFe?
土T匚CUf3
-十
(5”1FS1
r.En
1
虹I*
P*iV**7-ih-r4nc»c4-ijhi-r
3"
Qirpiae-Delehor-i
■
■
r.i'iihjcrnr>lnriii卜
4+Tj-srw*?
nrfn
■
P^Ull■山耳
岸OhAncm«o单1
■
“DataTyp显示数据的类型,图中为“Nucleotideo”
“Analysis显示计算分分析的类型,图中为“PairwiseDistaneeCalculatio(配”对差异距离计算)。
“Compute”示所要运行的对象,又两个选项:
“Distaneeonly(仅计算遗传距离)和“Distance&Std.Err(计算遗传距离和其标准误)。
“IncludeSite显示”用哪些位点来计算,如果数据类型是不编码蛋白质的核苷酸序列,则全部参与计算,如果是编码蛋白质的核苷酸序列,则可以选择哪些位点(如密码子的第2位等)来参与运算。
“SubstitutionMode是替代的模型,在下边“Model中可以进行选择。
“SubstitutenstoInclued选择哪些替代类型(如下图所示)被用于运算,选项将转换和颠换全部包括在内,s选项仅包括转换,V选项仅包括颠换,R转换和颠换的比值,L为所有有效的普通位点的个数。
.|±Transitions-i-Transvefsions
“PatternamongLineage和“Ratesamongsite上文已有介绍,不再详述。
点击“ComputeS钮,即可开始计算。
其显示运算结果的界面如下图所示:
l-hb泌対祚■'昭l-X
晝H9IiqIITI1?
I门1|L〒
JkiAT-1V
"■ZI丄I?
I】I
man
I!
!
■
ITEinMIKU^・
'-Imyuj'曲』I酬
CFIMI!
mSflWJWlWf
Qi.仙晒仙Or帕迢仙Sb皿£曲1
DIUOMiJI&KH區£3HUHt
Qiirniimwni哄qm凶町阿nw叩卿宙
mwTaotmhnos时尿阿乂^
衍埶则NPiQM砂MljU阿鈕知阚阿
QiaoMLiDTizuiOTtursmaieu逊7阻砂画立迢,1DaiaorattE
nilEHnPT3ZT?
1OTCPI^OIFItWWV5JJICtHTTHaWia(m测TWraaTlffiTlttkiticbfiej
MX3]OhUOC*DU^HlU^IdliKW£fiXWtxunt
上图是计算出的各个样本之间的遗传距离的矩阵。
在最下端的状态栏,显示的是所利用的遗传距离模型,如图中所示:
Nucleotide:
Kimura2-parameter。
“File按钮共有四个下拉菜单:
“ShownputDataTitle(显示输入数据的标
题)、“ShowAnalysisDeseription(显示分析信息的描述)、“Export/PrintDistanee”
(输出或打印距离矩阵)、“Quitviewer(退出此操作界面)。
“Display按钮共有四个下拉菜单:
“ShoWPairName(显示配对序列的名
字)、“SortSequenee(用何种方式对序列进行排序)、“ShowNames(显示序列的名字)、“ChangeFont”(改变字体)。
“SortSequeneW有两个选项:
“Original”
(按原先输入的顺序)和“ByName(通过序列的名字)。
点击“Average按钮可以计算平均的遗传距离,此按钮提供了四个下拉菜单:
“Overall(所有样本之间的平均遗传距离)、“WithinGroups”(组内平均遗传距离)、“BetweenGroups'(组间平均遗传距离)、“NetBetweenGroups('组间平均净遗传距离)。
在上述按钮下方还有六个按钮,如下图所示。
点击第一个按钮可以使数据以下三角矩阵的方式显示;点击第二个按钮可以使数据以上三角矩阵的方式显示;选中第三个按钮可以显示配对的序列的名字,点击第四个按钮,可以减少数据小数点后的位数;点击第五个按钮,可以增加数据小数点后的位数;拖动第六个按钮中的小竖条可以改变数据显示的宽度。
点击“File下拉菜单中的“Export/PrintDistanee选项;会弹出如下图所示的对
话框:
LlJjDELff
731PI
“OutputForma选项可以确定输出数据的格式:
“Publication(一般格式)和“Mega(Mega格式,把此数据保存可直接由Mega程序打开,进行构建系统发育书等遗传分析)。
DecimalPlaces(小数位的大小),“MaxEntriesperline(每一行最多能显示的数据的个数)。
通过“Matrix可以选择输出数据矩阵的方式:
“LoweTeft”(下三角矩阵)和
“Upperight”上三角矩阵)。
点击“Print/SaveMatrix按钮,可以输出数,会弹出如下图所示的操作界面:
在上图中的数据和文字可以直接进行拷贝,粘贴到文本文档或Microsoft
Word文档中。
在此操作界面中,首先显示数据文件的一些信息,如数据文件的标题、总的样本个数、核苷酸替代的距离模型等。
然后是每个序列的名字,之后是序列之间的距离矩阵。
将此距离矩阵保存,可以用Mega或其他系统发育分析
软件来做系统树。
点击Mega软件操作主界面的“Distanee下拉菜单中的“ComputeOverall
Mean选项,可以计算所有序列的所有位点的平均遗传距离,其操作方法和界面
同“ComputePairwiseW仿。
其运算结果如下图所示:
OueTal[npanrlis+ancR.匚『匚]庆
FilflDsKtlp
"L;iitdii
点击Mega软件操作主界面的“Distances下拉菜单中的“ComputeWithin
GroupMeans选项,可以计算每个组组内的平均遗传距离,其操作方法和界面同
“ComputePairwis相仿。
其运算结果如下图所示:
leandistancevithinero...|匚|叵医]
FileD1playHelp
厂1
1.rhitjn
01522^11
2Duller
.O?
10J97
3.Imtrh^G
.O4?
eeo9
4.NoflhH^r
.0561129
5.OurMG
.02^0553
B.Korean
.01S744S
d.Nuxzleotide:
Einura£-parameter
点击Mega软件操作主界面的“Distanee下拉菜单中的“Computebetween
GroupMeanS'选项,可以计算分组之间的平均遗传距离,其操作方法和界面同
“ComputPairwise相仿。
其运算结果如下图所示:
rTinUKC-tr+wrcfiL書tGz\2H]匸
JlLtflS^QTtttlD
二Djlhi.
3IriKrMG
*Noi也卜J
5DulMG
BKlira-.
02130'15
(]刁:
CPlOaa?
C3t3JgD[3524?
pD2TO33P
(51i.I-p-EhUranl/TTil.-Ih-1iJi-
点击Mega软件操作主界面的“Distanee下拉菜单中的“Computenetbetween
GroupMeanS'选项,可以计算分组之间的平均遗传距离,其操作方法和界面同
“ComputePairwis相仿。
其运算结果如下图所示:
T>i_piinJitJi.^1n】1£“・口1iirrxiPg;■J[肮.…-匚遁*康
T_gm二[宙軒
flOETS&CWK:
WS13ojiEm/DWLail:
'WJ-JiiiMiu
'In-tipLN呵TauljuijeI■:
点击Mega软件操作主界面的“Distances下拉菜单中的“ComputeSequenee
Diversity选项中的“MeanDiversityWithinSubpopulations,可以计算亚组之间的
图所示:
Irandavcc^iI"pvilhinjinp「.『L|X
Fa1AClLjilxyLj-
—jIE'
-I
1
点击Mega软件操作主界面的“Distances下拉菜单中的“ComputeSequenee
Diversity选项中的“MeanDiversityforEntirePopulation,可以计算整个群体的平
均遗传距离,其操作方法和界面同
“ComputePairwise相仿。
其运算结果如下图
所示:
£rlPDWiJTJ.T齐E「工pnpq-Ja.-r.匚|.匠’舅
E11-"Dj耳
!
I^.Vl
IBBSS
点击Mega软件操作主界面的“Distances下拉菜单中的“CmputeSequenee
Diversity选项中的“MeanInterPopulationDiversity,可以计算群体内部的平均遗
传距离,其操作方法和界面同“ComputePairwise相仿。
其运算结果如下图所示:
J-Elf.CLCJU'P'U-Lilt3_ELaJ_Cx.PL直占亠…J.&
点击Mega软件操作主界面的“Distances下拉菜单中的“ComputeSequenee
Diversity选项中的“CoffientofDifferentiation,可以计算群体的变异系数,其操
作方法和界面同“ComputePairwis相彷。
其运算结果如下图所示:
CoeffirnitftntPi/fimr(mt【十…匚离|
L-pu^nclcr
3、系统发育树的构建
Mega程序构建系统发育树的功能很强大。
它提供了四种构建系统发育树,
Neighbor-Joining(NJ,
还包括一些检验程序。
这四种构建分子系统树的方法为:
邻接法)、MinimumEvolution(ME,最小进化法)、MaximumParsimony(MP,最大简约法)、UnweightedPairGroupMethodWithArithmeticMean(UPGMA,
算术平均的不加权对群法)。
其中,NJ法和UPGMA法都属于距离法。
其操作界面如下图所示:
Ml*U4^t伽昶“1""5rl4Ct:
^"個伽¥电
』图国赴d艺d卅畑ngMJ]
"PiNMIIg也十吋Hl计町曲*a,0^.5|
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MEGA 软件 使用