Arlequin的使用说明.docx
- 文档编号:30417285
- 上传时间:2023-08-14
- 格式:DOCX
- 页数:28
- 大小:2.85MB
Arlequin的使用说明.docx
《Arlequin的使用说明.docx》由会员分享,可在线阅读,更多相关《Arlequin的使用说明.docx(28页珍藏版)》请在冰豆网上搜索。
Arlequin的使用说明
Arlequin3.1的使用说明
Arlequin功能的概述
Moleculardiversity—分子多态性
Mismatchdistribution—错配分布
Haplotypefrequencyestimation—单倍型频率估计
Linkagedisequilibrium—连锁不平衡:
检测不同位点上等位基因的非随机关联
Hardy-Weinbergequilibrium—哈温—伯格平衡
Tajima’sneutralitytest—Tajima中性检测
Fu’sneutralitytest—Fu中性检测
Ewens-wattersonneutralitytest—Ewens-watterson中性检测
以上三个中性检测都是基于无限位点模型,适用于DNAsequence和RFLP单倍型。
Chakraboety’samalgamationtest—Chakraboety’s融合检测,检测人群的均一性和同质性,和中性选择等。
MinimuSpanningNetwork(MSN,最小扩张树或称之为最小支撑树,给予分子差异。
AMOVA—分子差异度分析,用以评测人群的遗传结构
Parwisegeneticdistances—遗传距离的估计
Exacttestofpopulationdifferentiation—检测随机交配群体单倍型的非随机分布
Assignmenttestofgenotype—通过估计等位基因平率将单个基因型分被盗特定的人群中。
Arlequin3.1分析的数据文件的格式必须是以*arq为扩增名
方法:
用Clustalx比对后保存一个PHY格式的文件,在DNAsp中打开该文件,点击Generate中的Haplotypedatefile,设置considered,其余的参数不变,在其中的Generate中选其中的ArlequinHaplotypeList即可保存下用Arlequin3.1分析的文件的格式(在importdate中可以进行文件格式的转换,Arlequin的数据转化为Arlequin、Genepop、Biosys、phylip、Mega、WinAmova)
首先打开Arlequin3.1的界面如下:
点击openproject,出现如下的界面:
选择你要分析数据的文件,一般扩增名为*arp
下面以例子中的文件加以说明:
点击打开,
Projecttitle所分析数据的名称
Genotypicdate输入数据是单倍型还是双倍性
Gameticphase:
确定输入数据中配子片段是否已知
Recessivedate:
确定输入数据是否为阴性
Datetype:
输入数据的类型
Missingdate:
缺失数据用什么字符表示
对上面的例子进行数据设置
点击Setting出现如下的界面
点击Generalsetting情况如下:
点击Haplotypeinference(单倍型频率),出现如下界面
选中右侧的设置情况,如果输入的数据的形式属于配子片段已知的单倍型数据或基因型数据,则操作界面如下
继续设置,点击Moleculardiversityindices(在分子水平上计算遗传分歧度的几个参数)
设置后,出现如下图的结果
Standarddiversityindices:
计算几种常见的分歧度参数,如等位基因的数目、分离位点的数目、杂合的水平等.
Moleculardiversityindices:
隔离位点的数目(s)、单倍型的数目(nh)、单倍型的多样性(Hd)
Computeminmumspanningnetworkamonghaplotype:
利用每个居群的单倍型数据计算最小支撑树和最小支撑扩张网络图。
Moleculardistance:
选择遗传距离,包括配对差异距离和核苷酸差异数的百分比。
Theata(Hom):
通过估计观测到的纯质性H而得到一个参数
Theata(s):
通过估计观测到的隔离位点S的个数而得到的一个参数
Theata(k):
通过估计观测到的等位基因K的个数
Theata(π)通过平均配对差异数而得到的一个参数。
点击Arlequinconfiguration出现如下的结果
点击Browse,选择要分析的数据,如下图
点击打开如下图
点击projectwizard进行设置,这里面数据的设置,可以通过viewproject打开的文本格式来作为参考,进行设置
点击viewproject出现的文本格式中包含了所要设置的数据的情况
设置后,出现如下的数据:
点击Start,就会进行分析,将会得到一系列的结果。
出现的结果在一个与原来的文件名相同的文件夹,运行的结果是Html文件。
AMOVA,是指对分子差异性的分析。
它通过对所研究居群进行不同层次的归类和划分,可界定不同的遗传结构并进行统计学检验,从而估计出群体间、群体内以及个体间不同层次所表现出的差异占总变异的多少,这种方法可以讨论不同海拔高度、不同语系、以及地理群体间是否存在相应的遗传变异。
LocusbylocusAMOVA每个基因单独进行分子差异性的分析
Includeinindividuallevelforgenotypicdata包括个体间金银分歧度协方差组成和相关的固定指数。
它计算出的是观察到的基因间的差异。
Numberofpermutations用来检测方差组成和固定指数的置换数的值,如果数值是0则不会有任何检测结果。
Computeminimumspanningnetworkamonghaplotype利用分子差异计算并绘制单倍型之间的系统树。
Geneticstrcture中的populationcomparision选项,会出现如下的界面
Populationcomparation计算人群之间不相似指数(遗传距离)的大小,如Fst(短片段的基因的遗传距离)和Nei’s(人群之间和人群内部的平均背对差异)。
ComputationofFst:
计算所有配对人群的Fst值。
Renyolds’sdistance:
计算Renyolds’s等线性化的Fst,这适合于分歧时间较短的样本。
Slatkin’sdistance:
计算源于配对间的Fst的Slatkin’s遗传距离。
Pairwisedifference:
计算Nei’人群内部和人群之间的平均配对差异数。
Computerelativepopulations:
计算所有背对人群之间的相对人群大小,也可以计算人群之间的分析时间。
出现的几个界面的设置
Configuration
Projectwizard
Import—export
Structureeditor
Arlequinsetting
Arlequinconfiguration
ELBsetting
AMOVAsetting
LDsetting
Neutralitytest
Output
Input文件的建立:
[Profile]
Title="AnexampleofDNAsequencedate"
NbSamples=29
GenotypicData=0
MissingData="?
"
DataType=DNA
LocusSeparator=NONE
[Data]
[[Samples]]
SampleName="DC1"
SampleSize=5
SampleData={
Hap71G--TGAAC---TCGAT--AC--------G---T--TG--A-
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap203G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LH1"
SampleSize=5
SampleData={
Hap11A-GTGAACA--TCA-T--AC---------G--T---TGA--
Hap21A-GTGAAC---TCA-T--AC---------G--T---TGA--
Hap81G--TGAAC---TC-AT--AC--------G---T--TGG-A-
Hap171GT--GAAC---TC-AT--AC--G-----G---T---TG-A-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LH2"
SampleSize=5
SampleData={
Hap61G--TGAAC---TC-AT--AC--------G---T--TG--A-
Hap122GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap352A-GTGA--AC-TC-AT--ACC--------G--T---TGGA-
}
SampleName="DF1"
SampleSize=5
SampleData={
Hap62G--TGAAC---TC-AT--AC--------G---T--TG--A-
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap251G--TGA--AC-TCGAT--AC---------G--T---TG-A-
}
SampleName="DF2"
SampleSize=5
SampleData={
Hap61G--TGAAC---TC-AT--AC--------G---T--TG--A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="BY1"
SampleSize=5
SampleData={
Hap11A-GTGAACA--TCA-T--AC---------G--T---TGA--
Hap91G--TGAAC---TC-AT--AC-------AGG-ATCATGG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="BY2"
SampleSize=5
SampleData={
Hap61G--TGAAC---TC-AT--AC--------G---T--TG--A-
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap181G--TGAAC---TC-AT--AC--------G---T---TGGA-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap261G--TGA--AC-TC-AT-TAC---------G--T---TG-A-
}
SampleName="BY3"
SampleSize=5
SampleData={
Hap21A-GTGAAC---TCA-T--AC---------G--T---TGA--
Hap102G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap301G--TGAA--C-TC-AT--AC---------G--T---TG-A-
}
SampleName="GZ1"
SampleSize=5
SampleData={
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap123GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LT1"
SampleSize=5
SampleData={
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap122GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap291GA-TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LT2"
SampleSize=5
SampleData={
Hap205G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="ZD1"
SampleSize=5
SampleData={
Hap202G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap221G--TGGAGAC-TC-AT--AC---------G--T---TG-A-
Hap271G--TGA--AC-CC-AT--AC---------G--T---TG-A-
Hap321AAGTGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="ZD2"
SampleSize=5
SampleData={
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="DZ"
SampleSize=5
SampleData={
Hap141GTTGCAATCA-TC-AT--AC--------G---T---TG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="AD"
SampleSize=5
SampleData={
Hap161GT--GAAC---TC-AT--AC--------G---T---TG-AG
Hap203G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap341A-GTGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="HY1"
SampleSize=5
SampleData={
Hap31A-GTGAAC---TCA-T--AC---------GT-T---TGAA-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="GB"
SampleSize=5
SampleData={
Hap205G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="DX1"
SampleSize=5
SampleData={
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="HYS"
SampleSize=5
SampleData={
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LS1"
SampleSize=5
SampleData={
Hap111GA-TGAAC---TC-AT--AG--------G---T---TG-A-
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap202G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap291GA-TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="MZ"
SampleSize=5
SampleData={
Hap41AAGTGAAC---TCAAT--AC---------G--T---TGA--
Hap101G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap131GT--GAAC---TC-AT--AC---AGAG-G---T---TG-A-
Hap191GA-TGAAC---TC-AT--AC--------G---T---TG-A-
}
SampleName="GC"
SampleSize=5
SampleData={
Hap41AAGTGAAC---TCAAT--AC---------G--T---TGA--
Hap123GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LS2"
SampleSize=5
SampleData={
Hap41AAGTGAAC---TCAAT--AC---------G--T---TGA--
Hap103G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
}
SampleName="HY2"
SampleSize=5
SampleData={
Hap123GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap151GT--GAAC---TC-ATA-AC--------G---T---TG-A-
Hap161GT--GAAC---TC-AT--AC--------G---T---TG-AG
}
SampleName="LK1"
SampleSize=5
SampleData={
Hap201G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap211G--TGA--AC-TC-AT--AC---------G--C---TG-A-
Hap231G--TGA--AC-TC-AT--AC-A-------G--C---TGGA-
Hap241G--TGA--ACCTG-AA--TC---------G--T---TG-A-
Hap271G--TGA--AC-CC-AT--AC---------G--T---TG-A-
}
SampleName="DX2"
SampleSize=5
SampleData={
Hap151GT--GAAC---TC-ATA-AC--------G---T---TG-A-
Hap204G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="LK2"
SampleSize=5
SampleData={
Hap21A-GTGAAC---TCA-T--AC---------G--T---TGA--
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap203G--TGA--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="TJ"
SampleSize=5
SampleData={
Hap21A-GTGAAC---TCA-T--AC---------G--T---TGA--
Hap121GT--GAAC---TC-AT--AC--------G---T---TG-A-
Hap202G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap331GTGT-A--AC-TC-AT--AC---------G--T---TG-A-
}
SampleName="BM"
SampleSize=5
SampleData={
Hap102G--TGAAC---TC-AT--AC--------G---T---TG-A-
Hap202G--TGA--AC-TC-AT--AC---------G--T---TG-A-
Hap311G--AGAGAGC-TC-AT--AC---------G--T---TG-A-
}
[[structure]]
StructureName="Agroupof29PopulationsanalyzedforDNA"
NbGroups=3
Group={
"DC1"
"LH1"
"LH2"
"DF1"
"DF2"
"BY1"
"BY2"
"BY3"
"GZ1"
"LT1"
"LT2"
}
Group={
"ZD1"
"ZD2"
}
Group={
"DZ"
"AD"
"HY1"
"GB"
"DX1"
"HYS"
"LS1"
"MZ"
"GC"
"LS2"
"HY2"
"LK1"
"DX2"
"LK2"
"TJ"
"BM"
}
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Arlequin 使用说明