书签分享收藏举报版权申诉 / 70

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 军事政治 > Mega软件的使用1.docx

Mega软件的使用1.docx

文档编号：12336783
上传时间：2023-04-18
格式：DOCX
页数：70
大小：4.16MB

Mega软件的使用1.docx

《Mega软件的使用1.docx》由会员分享，可在线阅读，更多相关《Mega软件的使用1.docx（70页珍藏版）》请在冰豆网上搜索。

Mega软件的使用1.docx

Mega软件的使用1

Fig

MEGA界面及操作

Mega是一款操作十分简便的遗传学分析软件，其界面十分友好，即使初学者也很易上手。

1、数据的录入及编辑

Mega软件能够接受多种数据格式，如FASTA格式、Phylip格式、PAUP数据格式等等。

而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。

首先，打开Mega程序，有如下图所示的操作界面：

Fig

单击工具栏中的“File”按钮，会出现如下图所示的菜单：

Fig

从上图可以看出，下拉菜单有“OpenData”（打开数据）、“ReopenData”（打开曾经打开的数据，一般会保留新近打开的几个数据）、“CloseData”（关闭数据）、“ExportData”（导出数据）、“ConverToMEGAFormat”（将数据转化为MEGA格式）、“TextEditor”（数据文本编辑）、“PrinterSetup”（启动打印）、“Exit”（退出MEGA程序）。

单击“OpenData”选项，会弹出如下菜单：

Fig

浏览文件，选择要分析的数据打开，单击“打开”按钮，会弹出如下操作界面：

Fig

此程序操作界面，提供了三种选择数据选择：

NucleotideSequences（核苷酸序列）、ProteinSequences（蛋白质序列）、PairwiseDistance（遗传距离矩阵）。

根据输入数据的类型，选择一种，点击“OK”即可。

如果选择“PairwiseDistance”，则操作界面有所不同；如下图所示：

Fig

根据遗传距离矩阵的类型，如果是下三角矩阵，选择“LowerLeftMatrix”即可；如果是上三角矩阵，选择“UpperRightMatrix”即可。

点击“OK”按钮，即可导入数据。

如果是核苷酸数据，则读完之后，会弹出如下对话框：

Fig

如上图，如果是编码蛋白质的核苷酸序列，则选择“Yes”按钮；如果是不编码蛋白质的核苷酸序列，则点击“No”按钮。

之后，会弹出如下操作窗口：

Fig

此作界面的名称是“SequenceDataExplorer”，在其最上方是工具栏“Data”、“Display”、“Highlight”等，然后是一些数据处理方式的快捷按钮，在操作界面的左下方是每个序列的名称。

显示序列占了操作界面的绝大部分，与第一个序列相同的核苷酸用“.”表示，发生变异的序列则直接显示。

如果在弹出的对话框中，点击“OK”，即选择输入的数据是编码蛋白质的DNA序列。

那么会再弹出如下对话框：

Fig

此操作界面提供了多种生物的遗传密码方式的选择，如VertebrateMitochondrial（脊椎动物线粒体）、InvertebrateMitochondrial（非脊椎动物线粒体）、YeastMitochondrial（酵母线粒体）等等。

点击此操作界面的“Add”按钮，可以添加密码子表格，其编辑界面如下图所示：

Fig

通过此操作界面可以创建、修改密码子表格。

点击“OK”按钮可以返回“SelectGeneticCode”操作界面。

点击“SelectGeneticCode”操作界面的“Delect”按钮，可以删除一个密码子表。

点击“SelectGeneticCode”操作界面的“Edit”按钮，可以对已经存在的密码子表格。

其操作界面与“GeneticCodeTable”相同。

点击“SelectGeneticCode”操作界面的“View”按钮，可以浏览选中的密码子表格。

点击“SelectGeneticCode”操作界面的“Statistics”按钮，可以统计密码子表格的一些信息，如每种密码子的频率、同义位点数、非同义位点数等。

点击点击“SelectGeneticCode”操作界面的“OK”按钮，会弹出如上图所示的“SequenceDataExplorer”操作界面。

如果点击“Cancel”按钮，也会弹出此操作界面，但是此时会把数据默认为非编码的DNA序列。

单击“SequenceDataExplorer”操作界面工具栏的“Data”按钮，有如下图所示的下拉菜单：

Fig

下拉菜单有六个选项：

“WriteDataToFile”（将数据转到文件中，利用此选项可以把Mega数据格式的数据转化成其它格式）、“Translate/Untranslate”（是否翻译，这个选项只有所分析的DNA序列是编码序列时才被激活）、“SelcetGeneticCodeTable”（选择遗传密码表，这个选项只有所分析的DNA序列是编码序列时才被激活）、“Setup/SelcetGenes&Domains”（选择或设置基因或结构域）、“Setup/SelectTaxa&Group”（对数据进行分组）、“QuitDataViewer”（退出此浏览框）。

单击“WriteDataToFile”选项，会弹出如下对话框：

Fig

Title框显示的内容是数据文件中“TITLE”之后的内容。

Description框显示的内容是数据文件中对整体数据描述的内容。

Format选项提供一个下来菜单，通过此下拉菜单可以把数据转化为MEGA格式、Nexus（PAUP4.0）格式，PHYLIP3.0格式、Nexus（PAUP3.0/MacClade）格式。

Writingsitenumbers选项也提供一个下拉菜单，通过此下来菜单可以把给每个核苷酸标序号，“None”为不显示序号，“Foreachsite”为每个位点显示序号，“Attheendofline”在每一行行末显示序号。

MissingDataandalignmentgaps选项也提供了一个下拉式菜单，这个菜单包括：

“Includesiteswithmiss/ambiguousdatagaps”（显示缺失位点及模糊位点以及空缺）、“Excludesiteswithmiss/ambiguousdatagaps”（不显示缺失位点及模糊位点以及空缺）、“Excludesiteswithmiss/ambiguousdataonly”（仅不显示缺失位点及模糊位点）、“Excludesiteswithalignmentgapsonly”（仅不显示比对是的空缺部分）。

如上述操作界面中的选项，点击“OK”按钮，会弹出如下界面：

Fig

此操作界面中的文字可以拷贝到文本文档中。

如果在“SquenceDataExplorer”操作界面的工具栏中选择“Highlight”中的“Variblesites”选项，则单击“WriteDataToFile”选项，会弹出如下对话框：

Fig

我们会发现与上述“ExportingSequenceData”操作界面相比，在最下方增加了一个“SelcetedsitestoInclude”下拉菜单框，此框包含：

Allsites（所有位点）、“Onlyhighlightedsites”（只显示相互之间有变异的位点）、“Onlyunhighlightedsites”（只显示相互之间无变异的位点）三个选项。

如上图中的操作界面中的选项，点击“OK”按钮，则会弹出如下对话框：

Fig

可以看出，在此操作界面中，仅显示了有变异的位点。

这样的数据形式在转化成“NetWork”遗传分析软件所需的数据格式时很方便。

单击“SequenceDataExplorer”操作界面的工具栏中“Data”中的“Setup/SelcetGenes&Domains”选项，会弹出如下对话框：

Fig

通过此操作界面可以检测、确定、选择结构域，为某些位点添加标签等。

这个操作界面包括两大部分：

“Define/Edit/Select”和“SiteLabels”。

通过操作界面中“Genes/Domain”的子菜单“Data”可以设置，起始位点和末位点。

通过“CodonStart”选项，可以选择编码的起始位置。

在操作界面下端有一排按钮：

“AddGene”、“AddDomain”、“Delete/Edit”、“Expand”。

通过“AddGene”按钮可以添加或插入一个新的基因，通过“AddDomain”按钮可以添加或插入一个新的结构域，通过“Delete/Edit”按钮可以对数据进行编辑和删除，通过“Expand”可以展开数据，或仅显示第一水平的数据。

点击“SiteLabels”按钮，上述操作界面变为如下图所示：

Fig

点击上述操作界面中的“Close”按钮，返回“SequenceDataExplorer”操作界面。

选择工具栏“Data”下拉菜单中的“Setup/SelectTaxa&Groups”选项，弹出如下图所示操作界面：

Fig

如上图操作界面，点击“NewGroup”按钮可以创建一个新的组，点击“DeleteGroup”按钮可以删除一个已经存在的组，在操作界面的中间竖排有五个按钮，同最上端两个按钮可以把数据移入或移出一个选定的组，点击第三个按钮可以对选定的组进行重新命名，点击“+”按钮可以创建一个新的组，点击“—”按钮可以删除一个已经存在的组。

注意，组的名字不能与任何一个样本重名。

点击“Close”按钮，“SequenceDataExplorer”操作界面。

点击此操作界面中的“Display”按钮，会弹出如下操作菜单：

Fig

从上述操作界面图看，下拉菜单共有：

“ShowOnlySelectedSequences”（仅显示选中的序列）、“UseIdenticalSymbol”（利用同一标记符号）、“ColorCells”（色彩单元）、“SortSequences”（序列分类）、“RestoreInputOrder”（恢复输入序列的顺序）、“ShowSequenceNames”（显示序列名字）、“ShowGroupNames”（显示序列所在的组的名字）和“ChangeFont”（改变字体）八个选项。

选择“ShowOnlySelectedSequences”选项，只有被选中的序列才会在界面中显示，不过软件默认的是所有输入的序列都是被选中的，不过软件使用者是可以修改哪些序列被选中。

选择“UseIdenticalSymbol”选项，那么与第一个序列相同的核苷酸将用“.”显示，与之相比，发生变异的核苷酸才以“A、T、C、G”的形式显示。

选择“ColorCells”选项，不同的核苷酸将用不同的颜色显示，如下图所示。

“SortSequences”选项有四个子选项：

“BySequenceName”（通过序列名字排列）、“ByGroupName”（通过组的名字排列）、“ByGroup&SequenceName”（通过组和序列的名字排列）、“AsperTaxa&GroupOrganizer”（）。

选择“RestoreInputOrder”选项，则序列排列顺序恢复到与输入数据文件中的顺序一样。

选择“ShowSequenceNames”选项，则每个序列的名字被显示。

选择“ShowGroupNames”，则每个序列所在的组的名字将被显示。

选择“ChangeFont”选项，可以改变序列名字、组名及其序列本身的字体大小及颜色，默认的字体大小是“小五”，默认的字体颜色是黑色，默认的字型是常规，无下划线、删除线。

Fig

点击“SequenceDataExplorer”操作界面的“Highlight”选项，会有如下图所示的下拉菜单选项：

Fig

由上图可以看出，“Highlight”的下拉菜单共有七个选项：

“ConservedSites”（C，保守位点）、“Variablesites”（V，变异位点）、“Parsim-Infosites”（P，简约信息位点）、“Singletonsites”（S，单独位点）、“0-foldDegeneratesites”（0，未简并位点）、“2-foldDegeneratesites”（2，2倍简并位点）、“4-foldDegeneratesites”（4，4倍简并位点）；其中后三个选项，只有在输入的序列是编码序码时才被激活。

选择“ConservedSites”选项，所有的保守位点，即没有发生变异的位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

选择“Variablesites”选项，所有的变异位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

选择“Parsim-Infosites”选项，所有简约变异位点（即变异至少包括两种类型的核苷酸或氨基酸）将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

选择“Singletonsites”选项，单突变（变异至少包括两种类型的核苷酸或氨基酸，而且在所有样本中仅发生一次）的位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

选择“0-foldDegeneratesites”选项，那些所有突变都是非同义突变的位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

此选项只有在输入数据中含有编码蛋白的DNA序列时才被激活。

选择“2-foldDegeneratesites”选项，那些在所有突变中同义突变占1/3的位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

此选项只有在输入数据中含有编码蛋白的DNA序列时才被激活。

选择“4-foldDegeneratesites”选项，那些所有突变全部是同义突变的位点，将被突出显示，位点的总数目将在状态栏（操作界面最下端）显示。

此选项只有在输入数据中含有编码蛋白的DNA序列时才被激活。

点击“SequenceDataExplorer”操作界面的“Statistics”选项，会有如下图所示的下拉菜单选项：

Fig

从上图可以看出，此下拉菜单总共有六个选项：

“NucleotideComposition”（核苷酸组成）、“NucleotidePairFrequence”（核苷酸配对频率）、“CodonUsage”（密码子使用）、“AminoAcidComposition”（氨基酸组成）、“UseAllSelectedSites”（利用所有选择的位点）、“UseOnlyHighlightedSites”（仅利用突出显示的位点）。

选择“NucleotideComposition”选项，可以计算得到，每条序列中A、T、C、G及U的百分含量，以及总的核苷酸个数，还可以得到整个数据中A、T、C、G及U的百分含量。

如果数据是编码蛋白质的DNA序列，那么还可以得到每种核苷酸在密码子各个位置的比例。

选择“NucleotidePairFrequence”选项，可以计算DNA序列中核苷酸配对的频率。

这个选项有两个子菜单：

“Directional（16Pairs）”和“Undirectional（10Pairs）”。

一个是有方向性的，一个是没有的。

选择“CodonUsage”选项，能够统计出每种密码子的使用频率。

选择“AminoAcidComposition”选项，能够统计出每条序列中各种氨基酸的组成百分含量，以及总的氨基酸个数。

还可以计算出整个数据中每种氨基酸的组成百分含量。

此选项只有在输入数据是氨基酸的条件下才被激活。

选择“UseAllSelectedSites”选项，在计算统计时，可以利用所有被选中的位点。

选择“UseOnlyHighlightedSites”选项，在计算分析时，仅利用那些被突出显示的位点进行计算。

在菜单栏的下方是一些常用的快捷方式，如下图示：

Fig

上图图标中，所对应的操作从左到右依次是：

“WriteDataToFile”（将数据转到文件中）、“Setup/SelectTaxa&Group”（对数据进行分组）、“Setup/SelcetGenes&Domains”（选择或设置基因或结构域）、“UseIdenticalSymbol”（利用同一标记符号）、“Color”（进行色彩设置）、“ConservedSites”（C，保守位点）、“Variablesites”（V，变异位点）、“Parsim-Infosites”（P，简约信息位点）、“Singletonsites”（S，单独位点）、“0-foldDegeneratesites”（0，未简并位点）、“2-foldDegeneratesites”（2，2倍简并位点）、“4-foldDegeneratesites”（4，4倍简并位点）、将核苷酸序列翻译为蛋白质序列。

点击“SequenceDataExplorer”界面的“Data”下拉菜单中的“QuitDataViewer”选项，即可关闭此操作界面，返回到Mega操作的主界面。

2、遗传距离的计算

2.1遗传距离模型的选择

点击Mega操作主界面的“Distances”按钮，会弹出一个下拉菜单。

如下图所示：

Fig

从上图易知，此菜单包括如下选项：

“ChooseModel”（选择模型，即选择计算遗传距离的模型）、“ComputePairwise”（计算遗传配对差异）、“ComputeOverallMean”（计算包括所有样本在内的平均遗传距离）、“ComputeWithGroupMeans”（计算组内平均遗传距离）、“ComputeBetweenGroupsMeans”（计算组间平均遗传距离）、“ComputeNetBetweenGroupsMeans”（计算组间平均净遗传距离）、“ComputeSequenceDiversity”（计算序列分歧度）。

“ComputeSequenceDiversity”选项包括四个子菜单：

“MeanDiversityWithinSubpopulations”（亚群体内部平均序列多态性）、“MeanDiversityforEntirePopulation”（整个人群平均序列多态性）、“MeanInterpopulaionalDiversity”（群体内部平均序列多态性）、“CoefficientofDifferentiation”（遗传变异系数）。

点击“ChooseModel”选项，会弹出如下操作界面：

Fig

从上述操作界面可以看出，通过此对话框可以选择计算遗传距离的模型等。

“DataType”显示数据的类型：

Nucleotide（Coding）（编码蛋白质的DNA序列）、Nucleotide（不编码蛋白质的DNA序列）、AminoAcid（氨基酸序列）。

通过“Model”选项可以选择，计算遗传距离的距离模型。

点击“Model”一行末端的按钮会弹出一选择栏。

Fig

如上图所示，对于非编码的核苷酸序列Mega程序提供了八种距离模型：

“NumberofDifference”（核苷酸差异数）、“P-distance”（P距离模型）、“Jukes-Cantor”（Jukes和Cantor距离模型）、“Kimura2-Parameter”（Kimura双参数模型）、“Tajima-Nei”（Tajima和Nei距离模型）、“Tamura3-parameter”（Tamura三参数模型）、“Tamura-Nei”（Tamura和Nei距离模型）、“LogDet（Tamurakumar）”（对数行列式距离模型）。

对于编码的核苷酸序列，其遗传距离模型如下图所示：

Fig

如上图所示，对于编码蛋白质的DNA序列，Mega程序提供了一下几种模型：

“Nei-GojoboriMethod”，“ModifiedNei-GojoboriMethoed”、“Li-Wu-LuoMethod”、“Pamilo-Bianchi-LiMethod”、“KumarMethod”。

其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型：

“NumberofDifferences”、“P-distance”、“Jukes-Cantor”。

对于氨基酸序列，Mega所提供的遗传距离模型如下图所示：

Fig

如上图所示，对于氨基酸序列，Mega程序提供了一下六种遗传距离模型：

“NumberofDifferences”（氨基酸差异数）、“P-distance”（P距离模型）、“PoissonCorrection”（泊松校正距离模型）、“EqualInput”（等量输入距离模型）、“PAMMatrix（Dayhoff）”（PAM距离矩阵模型）、“JTTMatrix（Jones-Taylor-Thornton）”（JTT距离矩阵模型）。

在“AnalysisPreference”操作界面中，“PatternAmongLineages”仅提供了一个选项：

“Same（Homogenous）”“，也就是说样本之间是有一定同源性的。

“Ratesamongsites”提供了两个选项：

“UniformRates”和“Different（GammaDistributed）”。

“UniformRates”意味着所有序列的所有位点的进化速率是相同的。

选择“Different（GammaDistributed）”，意味着序列位点之间的进化速率是不相同的，可以利用Gamma参数来校正，系统提供了四个数值可供选择：

2.0、1.0、0.5、0.25；软件使用者也可以自行决定Gamma参数的大小。

设置完毕后，在此界面中点击“OK”按钮，即可返回Mega操作主界面。

选择主操作界面“Distance”中的“ComputePairwise”选项，可以计算样本之间的遗传距离的大小，其操作界面如下图所示：

Fig

从上述操作界面易知：

“DataType”显示数据的类型，图中为“Nucleotide”。

“Analysis”显示计算分分析的类型，图中为“PairwiseDistanceCalculation”（配对差异距离计算）。

“Compute”显示所要运行的对象，又两个选项：

“Distanceonly”（仅计算遗传距离）和“Distance&Std.Err”（计算遗传距离和其标准误）。

“IncludeSites”显示利用哪些位点来计算，如果数据类型是不编码蛋白质的核苷酸序列，则全部参与计算，如果是编码蛋白质的核苷酸序列，则可以选择哪些位点（如密码子的第2位等）来参与运算。

“SubstitutionModel”是替代的模型，在下边“Model”中可以进行选择。

“SubstitutionstoInclued”选择哪些替代类型（如下图所示）被用于运算，d选项将转换和颠换全部包括在内，s选项仅包括转换，v选项仅包括颠换，R为转换和颠换的比值，L为所有有效的普通位点的个数。

Fig

“PatternamongLineages”和“Ratesamongsites”上文已有介绍，不再详述。

点击“Compute”按钮，即可开始计算。

其显示运算结果的界面如下图所示：

Fig

上图是计算出的各个样本之间的遗传距离的矩阵。

在最下端的状态栏，显示的是所利用的遗传距离模型，如图中所示：

Nucleotide：

Kimura2-parameter。

“File”按钮共

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: Mega 软件使用

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：Mega软件的使用1.docx
链接地址：https://www.bdocx.com/doc/12336783.html

Mega软件的使用1.docx

热门标签