生物信息学实验报告.docx
- 文档编号:7109035
- 上传时间:2023-01-18
- 格式:DOCX
- 页数:17
- 大小:1.69MB
生物信息学实验报告.docx
《生物信息学实验报告.docx》由会员分享,可在线阅读,更多相关《生物信息学实验报告.docx(17页珍藏版)》请在冰豆网上搜索。
生物信息学实验报告生物信息学实验报告生物信息学实验报告生物信息学实验报告姓名:
_王思___学号:
_03__指导老师:
_宋晓峰_南京航空航天大学013年月实验一生物信息数据库的检索一实验目的:
.了解生物信息学的各大门户网站以及其中的主要资源。
2。
了解主要数据库的内容及结构,理解各数据库注释的含义。
3.以Pd为例,学会文献数据库的基本查询检索方法。
二实验内容:
()国际与国内的生物信息中心国际NCBI、EBI、EPAS,MBL、SIB、TIG以及国内CBI、BiSin网站的熟悉及内容的了解.核酸序列数据库:
ebnk/EMBLan/DDBJNCBI网址:
c:
iknowdocsharedatacur_workEBI网址:
c:
iknowdocsharedatacur_workEMB网址:
i。
a.k/eml蛋白质序列数据库:
Swssrot、ExPASy网址:
c:
iknowdocsharedatacur_workUniot网址:
蛋白质结构数据库:
D网址:
csb。
org/p/
(2)数据库内容、结构与注释的浏览分别读取ThepikepeiofSASCooaVirus在NCBI中的核酸序列、SWISSPROT蛋白质序列以及DB蛋白质结构序列,熟悉数据库记录的结构,学会看懂其中的注释。
核酸序列:
SWISS-ROT蛋白质序列:
P蛋白质结构序列:
其PDB文件见附件ARSCronairs。
DB文件分别读取emagglutinnGenesoN2SbtypInuezaVuses(禽流感H92亚型HA基因)在NI中的核酸序列、SWSS-PROT蛋白质序列以及PDB蛋白质结构序列,熟悉数据库记录的结构,学会看懂其中的注释。
核酸序列:
SWSS-PROT蛋白质序列PD蛋白质结构序列其PD文件见附件92DB文件(3)文献信息的查找与管理有效地使用BIPbed提供的各种主要功能,查询并下载相关课题或研究方向的论文文摘与文献全文。
查询lunaAVirues分子进化研究方向的文章。
三实验要求:
(1)以其中的一个信息中心网站为例,列举其中的主要资源(数据库、网上分析、生物计算、数据下载等).以NI为例,其主要数据库:
Project(frmelyGenomePoject)、Conervedomainabase(CDD)、DaabaseofGentysanPhentes(daP)、GenBnk、InfluenzaVrus、JournaliNCBIatabass、MSHDatabase、NleotieDatabase、OneMendianInhritanceinAnals(OMA)、Proteinluters、ProeDabas、PuMe、eenceSequece(RfSeq)、Structe(MolecularMoelingDaabase)、irdtAnntation(TP)Databa、UnGen、ViraGnomes等网上分析:
BLAST、VcSreen、OFFinder、nitor等生物计算:
数据下载功能如下:
(2)能够解释给定序列或基因组数据的含义。
()检索文献的技巧和效率.实验二序列多重比对及进化分析一实验目的:
1.学习序列比对工具BLA以及ClustalW等的使用,能够对序列数据进行初步的分析。
2.掌握基于DN序列和蛋白质序列构建系统进化树的常用方法和常用工具。
二实验内容:
1.在Geeank数据库中,检索10条轮状病毒(ompins,Rotavirus)P7基因的DNA序列,并使用CUSL软件对序列进行多重序列比对;检索结果详见电子稿附件P文件夹:
sequceftasnqunce.fast多重序列比对结果:
多重序列比对结果详见电子稿附件:
senquencealn文件2.在Genean数据库中检索条SARS病毒Spik蛋白的氨基酸序列,使用CLSTAX软件对这十条序列进行多重序列比对;检索结果详见电子稿附件sara文件夹:
s。
fastas.ata多重序列比对结果多重序列比对结果详见电子稿附件sr文件夹:
s。
an3.使用lustalW软件或其他软件包构建上述DNA分子系统发生树。
系统发生树如下:
三实验要求:
1.提交使用CLUTAL及PHLP软件进行多重序列比对及构建系统发生树的结果;2.总结多重序列比对及构建系统发生树的关键事项。
选择合适的比对算法,构建系统发生树时适当选择独立关系的分支序列.实验三蛋白质结构分析及结构预测一实验目的:
1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于moti、结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测.5。
学会运用结构浏览软件对生物大分子的结构进行观察.二实验内容:
1.给出实例了解生物大分子结构数据库PB及MMDB中的记录方式,看懂记录中的内容并会运用Rasl或CN软件观察蛋白质的三维结构。
PDB文件J4Nb的记录方式分析见附录。
下图为在asmal软件中观察的结果:
丝带模型线框模型球棒模型2.使用Entez或RS信息查询系统检索水通道(Aqapon-1,QP1)蛋白质序列.AQ1蛋白质序列:
SGWNVLDFLDGVNSGQGLGEIIGTQLVLCATDRRLGSAPLILSALHLLIGCINPASFSAINFNHIFWVGGAVLIYDFILRSDVKVWTSGVEYDLDDDSRVMKK详见附件QP1。
fsa3.使用BoE软件对上述蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析。
分子量、氨基酸组成Potein:
g29307120|r|NP_0171991。
1aqapoin-isform4Homsaiensngh=154amiocidsMeculWeight=167.1DaltonAinoAcidNumberMolAaA1279Cys1.0Ap177GlE42。
60Phe630Gy1811.69iH3.95eI127.9Ls5LeuL18119Met31。
95sN3。
0PP3。
25GlnQ4。
0g85。
9SerS1114TrT55alV12.79.25Tr3195疏水性分析:
4.对水通道蛋白质序列进行基于BI/Blast软件的蛋白质同源性分析;5.对水通道蛋白质序列进行motf结构分析;6.对水通道蛋白质序列进行二级结构和三维结构预测。
二级结构预测:
三级结构预测:
数据库显示结构:
三实验要求:
1、提交使用上述软件对人水通道蛋白质序列进行基本性质分析、同源性分析、moif结构分析以及二级结构和三维结构预测的结果;2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。
实验四核酸序列分析一实验目的1、掌握已知或未知序列接受号的核酸序列检索的基本步骤;2、掌握使用ioEdit软件进行核酸序列的基本分析;3、熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析);二实验原理针对核酸序列的分析就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。
在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持.一般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;如果某段DN片段的假想产物与某个已知的蛋白质或其它基因的产物具有较高序列相似性的话,那么这个DA片段就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DA是蛋白质编码区的有力证据;其它的证据包括与“模板”序列的模式相匹配、简单序列模式如TAABx等相匹配等。
一般而言,确定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则:
对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除去;选用预测程序时要注意程序的物种特异性;要弄清程序适用的是基因组序列还是cDNA序列;很多程序对序列长度也有要求,有的程序只适用于长序列,而对EST这类残缺的序列则不适用。
三实验内容1、使用Er或S信息查询系统检索人瘦素(lei)的RN、基因组DA、外显子等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义;2、使用BEit软件对上述核酸序列进行分子质量、碱基组成、碱基分布、序列变换等基本分析,并从Biit软件的“hep栏了解该软件的其它功能;DAmolecule:
i1679092ef|NM_0030.2|Homspinsleti(LEP),mRNALengt=3444asepairsMeclarWeigt=1045471。
00Dalo,singlesrnddMoeureit=2927。
00Dalo,oberandG+Ccoent49.97+Tcot=503%NletideNuberMolA036.2C012。
G90267T8223814、使用BioEdit软件对人瘦素(epin)的mNA序列进行可读框架分析;起始密码位置和编码区范围:
、使用NCBI查询系统进行人瘦素(leptn)的基因组序列分析。
ATCTTGGGGCGTGCGGATTCTGTGCTTTGGCCCTATCTTTTCTATGTCGTGTGCATCCAAATCAAGATGACACCAAACCCACCAATTTCACCAGATCATGCTTCACACACCAGTCGTCTCAAACAGATCCTTTGGCTCTTCTGGCTCCCCCATCGACCTATCAGTGACCAACATGGACTACACGATCCTACCAGTTGCCTTCCAGAACGTATCATTCGACAGATCCGGGATCTTCTCAGTGTCCTTTCTGAGCTGCCACTGCCTGGCCAGTGGCCTGGACTGACCTGGGGTGTCCTGGAGTAGGCACCACAGAGTGGTGGCCCGGCAGGCTGCAGGGCTTGCAGGATGCTTGAGCTGCCCAGCCCTGGGGCTGA四.实验方法、调用nternet浏览器,并在其地址栏输入Enrez网址:
;2、在输入栏输入omosapienslptin;、点击g后显示搜索结果;4、在搜索结果中选择nucletide前的数字,显示序列接受号及序列名称等;、查找人leptn(obesithomolog,mose)mRNA序列(提示:
M000),点击序列接受号后显示序列详细信息;6、将序列转为FSTA格式保存7、根据从N000230了解的基因定位信息查找人瘦素的基因组DNA(otig)的序列接受号及序列识别号,点击序列接受号显示序列详细信息;、根据从NM_000230了解的HGC:
655,进入TL查找人瘦素5mRA、基因组DN、外显子等核酸序列;9、将上述核酸序列输入iodi和DAClub软件进行序列基本分析;10、打开BiEd软件,点击“hlp”栏,阅读“coents;1、将人瘦素(leptin)的mRNA序列输入BioEi软件进行可读框架分析:
打开BioEdit软件将人瘦素(leptin)mRA的FASTA格式序列输入分析框点击左侧序列说明框中的序列说明点击sequnc栏选择nucleicaci点击finnextF查看起始密码位置和编码区范围(57)。
五。
实验要求1、归纳对人瘦素(lein)的核酸序列分析的结果,列出主要的分析结果;2、总结核酸序列分析的基本步骤,相互对比结果,指出应注意的事项。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 实验 报告