BLAST 核酸氨基酸序列相似性比较Word文档格式.docx
- 文档编号:15090707
- 上传时间:2022-10-27
- 格式:DOCX
- 页数:13
- 大小:226.51KB
BLAST 核酸氨基酸序列相似性比较Word文档格式.docx
《BLAST 核酸氨基酸序列相似性比较Word文档格式.docx》由会员分享,可在线阅读,更多相关《BLAST 核酸氨基酸序列相似性比较Word文档格式.docx(13页珍藏版)》请在冰豆网上搜索。
所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。
BLAST包含的程序:
1、BLASTP是蛋白序列到蛋白库中的一种查询。
库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。
2、BLASTX是核酸序列到蛋白库中的一种查询。
先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。
3、BLASTN是核酸序列到核酸库中的一种查询。
库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。
4、TBLASTN是蛋白序列到核酸库中的一种查询。
与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
5、TBLASTX是核酸序列到核酸库中的一种查询。
此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。
通常根据查询序列的类型(蛋白或核酸)来决定选用何种BLAST。
假如是作核酸-核酸查询,有两种BLAST供选择,通常默认为BLASTN。
如要用TBLASTX也可,但记住此时不考虑缺口。
BLAST适用于本地查询。
可以下载公共数据库,对于该数据库的更新和维护是必不可少的。
如果要直接到网上查询也可以(即NetBlast),但记住如果你认为自己的序列很有价值的话,还是谨慎为宜。
如何访问在线的BLAST功能服务?
您只要通过浏览器访问Blast主页(http:
//blast.ncbi.nlm.nih.gov/)。
所有的查询和分析都通过浏览器来完成,就象您在您的本地机上一样方便和快捷。
BLAST采用一种局部的算法获得两个序列中具有相似性的序列。
Blast中常用的程序介绍:
1、BLASTP是蛋白序列到蛋白库中的一种查询。
2、BLASTX是核酸序列到蛋白库中的一种查询。
3、BLASTN是核酸序列到核酸库中的一种查询。
4、TBLASTN是蛋白序列到核酸库中的一种查询。
5、TBLASTX是核酸序列到核酸库中的一种查询。
NCBI的在线blast:
http:
//blast.ncbi.nlm.nih.gov/Blast.cgi
1,进入在线blast界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。
不同的blast程序上面已经有了介绍。
这里以常用的核酸库作为例子。
2,粘贴fasta格式的序列。
选择一个要比对的数据库。
关于数据库的说明请看NCBI在线blast数据库的简要说明。
一般的话参数默认。
3,blast参数的设置。
注意显示的最大的结果数跟E值,E值是比较重要的。
筛选的标准。
最后会说明一下。
4,注意一下你输入的序列长度。
注意一下比对的数据库的说明。
5,blast结果的图形显示。
没啥好说的。
6,blast结果的描述区域。
注意分值与E值。
分值越大越靠前了,E值越小也是这样。
7,blast结果的详细比对结果。
注意比对到的序列长度。
评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。
加上长度的话,就有四个标准了。
如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一点。
由Qurey(起始1)和Sbjct(起始35)的起始位置可知,5'
端是是多了一段的。
有时也要注意3'
端的。
附:
E值(Expect):
表示随机匹配的可能性,E值越大,随机匹配的可能性也越大。
E值接近零或为零时,具本上就是完全匹配了。
一致性(Identities):
或相似性。
匹配上的碱基数占总序列长的百分数。
缺失或插入(Gaps):
插入或缺失。
用"
—"
来表示。
BlastN/MegaBlast/DiscontiguousMegaBlast的区别:
三者之间的共同之处就是BlastN/Megablast/Discontiguousmegablast都是BlastN,就是核酸序列比对核酸序列的算法。
简单而言
BlastN:
应该是出现较早的算法。
比对的速度慢,但允许更短序列的比对(如短到7个碱基的序列)。
MEGABLAST:
主要用来鉴定一段新的核酸序列,它并不注重比对各个碱基的不同和序列片断的同源性,而只注重被比对序列是否是数据库未收录的,是否为新的提交序列或基因。
速度快。
同一物种间的。
DiscontiguousMEGABLAST:
灵敏度(sensitivity)更高,用于更精确的比对。
主要用于跨物种之间的同源比对。
详细解释
1,MEGABLAST常被用于鉴定核酸序列
MEGABLASTisthetoolofchoicetoidentifyanucleotidesequence.
MegaBLAST也是一种BLASTN程序,不过它主要是用来在非常相似的序列之间(来自同一物种)比对同源性的。
鉴定某一段核酸序列是否存在于数据库,最好的方法是选择MEGABLAST。
如果比对到的序列在数据库中注释完整的话,那该序列丰富的注释可以当作新序列的参考。
当然,BlastN/MEGABLAST/DiscontiguousMEGABLAST,都可以完成这种事情。
但MEGABLAST就是特别设计用于非常相似序列之间的比对,可用于寻找查询序列的最佳匹配的序列。
2,DiscontiguousMEGABLAST更好地用于查找不同物种的相似的核酸序列,而不是与查询序列相同(identical)物种的。
DiscontiguousMEGABLASTisbetteratfindingnucleotidesequencessimilar,butnotidentical,toyournucleotidequery.
DiscontiguousMEGABLAST,用于跨物种核酸序列快速比对。
它使用非重叠群字段匹配算法(noncontiguouswordmatch)来进行核酸比对。
DiscontiguousMegaBLAST比blastx等翻译后比对要快得多,同时它在比较编码区时也具有相当高的敏感度。
但是需要指出的是,核酸与核酸之间的比对并不是发现同源蛋白编码区域的最佳方法,直接在蛋白水平用Blastp比对更好。
这是因为密码子的简并性。
(Lc.注:
翻译得有些拗口,多多见谅!
)
DiscontiguousMEGABLAST详细介绍:
www.ncbi.nlm.nih.gov/blast/discontiguous.html
原文:
//www.ncbi.nlm.nih.gov/blast/producttable.shtml#tab31
本文详细出处参考:
//liucheng.name/1009/#more-1009
1,Blastp:
标准的蛋白序列与蛋白序列之间的比对
StandardproteinBLASTisdesignedforproteinsearches.
Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。
跟其它的Blast程序一样,目的是要找到相似的区域。
2,PSI-BLAST:
敏感度更高的蛋白序列与蛋白序列之间的比对
PSI-BLASTisdesignedformoresensitiveprotein-proteinsimilaritysearches.
Position-SpecificIterated(PSI)-BLAST,是一种更加高灵敏的Blastp程序,对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效。
当你使用标准的Blastp比对失败时,或比对的结果仅仅是一些假基因或推测的基因序列时("
hypotheticalprotein"
or"
similarto..."
),你可以选择PSI-BLAST重新试试。
3,PHI-BLAST:
模式发现迭代BLAST
PHI-BLASTcandoarestrictedproteinpatternsearch.
PHI-BLAST,模式发现迭代BLAST,用蛋白查询来搜索蛋白数据库的一个程序。
仅仅找出那些查询序列中含有的特殊模式的对齐。
PHI的语法详细介绍看这里:
//www.ncbi.nlm.nih.gov/blast/html/PHIsyntax.html
PeptideSequenceDatabases蛋白序列的数据库
nr
Allnon-redundantGenBankCDStranslations+
RefSeq
Proteins+PDB+SwissProt+PIR+PRF
所有非冗余的的GenBankCDS区的翻译序列+参考序列的蛋白+PDB数据库
+SwissProt蛋白数据库+PRF蛋白数据库
refseq
RefSeqproteinsequencesfrom
NCBI'
sReferenceSequenceProject.
所有NCBI的参考序列
swissprot
LastmajorreleaseoftheSWISS-PROTproteinsequencedatabase(noupdates).
swissprot的蛋白数据库
pat
ProteinsfromthePatentdivisionofGenPept.
专利的蛋白数据库
pdb
Sequencesderivedfromthe3-dimensionalstructurefromBrookhavenProtei
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BLAST 核酸氨基酸序列相似性比较 核酸 氨基酸 序列 相似性 比较