生物信息学教程文档格式.docx
- 文档编号:20812300
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:11
- 大小:607.77KB
生物信息学教程文档格式.docx
《生物信息学教程文档格式.docx》由会员分享,可在线阅读,更多相关《生物信息学教程文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
X
-2
-4
-6
-8
-10
-12
-14
X为核酸残基
然后设定两条序列(注意题目要求),接着按照下面的关系去填充空格
1)若是A-A,则让所要填充空格的左斜上角的数加+2,所得数填到空格里。
C-C(这种情况是匹配)
G-G
T-T
2若是A-C,则让所要填充空格上面一格数加-2,所要填充空格下面一格数加-2,两数作比A-G较,取最大值数填充到空格里。
(这种情况是空位)
T-C
T-G
3)若是A-T,则属于可以采用错配和空位打分,即是所要填充空格的左斜上角数-1,
所要填充空格上面一格数加-2,所要填充空格下面一格数加-2,所得三个数字作比较,取最大值填充到空格里。
C-G(这种情况是错配和空位)
最后回溯,用箭头标志出所填空格数字的途径,选出最优路径,列出最优全局比对。
2、用PubMed搜索出与食用菌(mushroom,orediblefungi)多糖(polysaccharide)抗氧化相关的文章至少10篇,列出题目、作者、文献出处等相关信息(20分)。
打开这个网站:
http:
//www.ncbi.nlm.nih.gov/sites/entrez?
db=pubmed
在Search一栏输入
((XXXX)ANDXXXX)ANDXXXX
其中XXXX为你所要搜索的关键词
等待结果(最好选取含有关键词的论文题目)
最后直接COPY(不用打开每一篇文章)
例如以下这个:
其中第一行就是论文题目,第二行就是相关作者,第三行就是文献出处。
1、到蛋白质序列数据库中查询一条杆状病毒(Baculovirus)DNA聚合酶(DNApolymerase)的完整序列,写出序列名称、登录号及来源物种的分类情况,然后用Blast(注意:
写出所用程序及所搜索的数据库名称)搜索到数据库中和它相似程度较高的10条序列(写出这些序列的名称和登陆号及来源物种的分类情况。
要求至少包括3-4个属,每个属中选择1-2个种),对这10条序列进行多序列比对后(写出比对所用程序及比对结果),使用phylip软件,用距离法对它们进行分子进化分析(包括对进化树进行统计评估),说明这种蛋白质的进化历程(60分)。
打开网站http:
//www.ncbi.nlm.nih.gov/protein/
在Search一栏输入:
BaculovirusDNApolymerase
等待结果出来
现就第一条序列说明,点击打开
序列名称就是:
DNApolymerase[Orgyiapseudotsugatasinglecapsidnuclopolyhedrovirus]
登陆号就是LOCUS后面的字母与数字:
AAB04046
来源物种的分类情况就是ORGANISM后面的英文:
Orgyiapseudotsugatasinglecapsidnuclopolyhedrovirus
Viruses;
dsDNAviruses,noRNAstage;
Baculoviridae;
Alphabaculovirus.
(其中最后一个英文单词是物种分类中的属,而序列名称就是物种分类中的种)
然后使用BLAST,即点击页面右边的RUNBLAST,等待。
进入页面
其中在Database中可以选择所要搜索的数据库有nr、refseq等等,而所用程序则在页面最上面的blastp、blastx等等中选择。
选择好之后,点击页面最下面的BLAST。
等待结果。
然后从上面选取10条序列,注意要选择至少包括3-4个属,每个属中选择1-2个种,因此需要打开序列来查看每条序列的生物地位。
每条序列打开后,需要获取它们的FASTA格式的序列来分析。
序列的获取可按下面步骤来
点击在序列名称下面的FASTA,然后就会出现如下图
点击右上角的Sendto,再点击File,最后点击CreateFile,就会下载FASTA格式的序列下来的了,用记事本格式可以打开来。
将10条所选取序列都下载下来,将10条序列的全部内容都复制在同一个记事本里。
如下:
(下图仅有两条序列)
然后保存。
接着使用clustalx软件来作多序列比对
1)输入序列,就是那记事本里的10条序列(注意打开时要输入文档的名字)
2)开始序列比对
3)比对完成后,选择保存结果文件的格式,这里选择PHYLIP格式。
(注意文件放置的位置)
4)最后可以用treev32(注意要先安装程序),打开dnd文件,可以看到如下图的对比结果。
最后就是使用phylip软件,注意使用之前要将刚所得的PHY格式的文件放入到系X:
\XXXX\XXXX\phylip-3.69\phylip-3.69\exe文件夹里面,并改名为1(方便以后的操作)
以下方法为参照《坑人的生物信息学修正版》一文,特此感谢原文作者,哈哈。
———————————————————————————————————————
运行phylip-3.69\phylip-3.69\exe里的
,
输入你刚才生成的phy文件的全名,回车。
按y就可以了
随便输一个奇数,小一点的,再回车
再按回车,就会在exe文件夹生成一个outfile的文件
帮它改个名吧,我这里改为2,不改名的自重
运行
输入刚生成的文件的名字
按m回车
按D回车
输入100,回车
按y,回车,静心等待
,按回车,生成一个outfile的文件,帮它改个名吧,我这里改为3
,输入刚刚生成的文件的名字,如下图,回车
按y,回车
再按回车,生成一个outfile的文件和一个outtree文件,改名不解释,我这里树为4,outfile为5,4就是画出来的树
打开
,输入树的名字,回车
按y,回车,
再按回车,生成一个outfile的文件和一个outtree文件。
Outtree就是优化分析后得出的树
最后用treev32打开Outtree文件查看,可以得到最优树。
在treev32软件上端的
点击Tree中的Showinternaledgelabels可以显示每棵进化树分支上的数字。
分析:
节点的数值代表可信度,枝长代表遗传距离
进化树给出分支层次或拓扑图形,它是产生新的基因复制或享有共同祖先的生物体的歧异点的一种反映,树枝的长度反映当这些事件发生时就存在的蛋白质与现在的蛋白质之间的进化距离。
从这些角度着手,更多的需要自行摸索了。
以上教程有不对地方,请指正,哈哈。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 教程