西 安 交 通 大 学 实 验 报 告 生物信息学.docx
- 文档编号:26600655
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:15
- 大小:727.10KB
西 安 交 通 大 学 实 验 报 告 生物信息学.docx
《西 安 交 通 大 学 实 验 报 告 生物信息学.docx》由会员分享,可在线阅读,更多相关《西 安 交 通 大 学 实 验 报 告 生物信息学.docx(15页珍藏版)》请在冰豆网上搜索。
西安交通大学实验报告生物信息学
西安交通大学实验报告
课程生物信息学实验名称核酸和蛋白质序列数据的使用
系别实验日期:
专业班级组别交报告日期:
姓名学号报告退发:
(订正、重做)
同组人无教师审批签字:
实验目的:
了解常用的序列数据库,掌握基本的序列数据信息的查询方法。
实验步骤:
在序列数据库中查找某条基因序列(insulin人的),通过相关一系列数据库的搜索、比对与结果解释
实验结果:
1.该基因的功能是?
DNA结合、RNA结合、雄激素受体结合、酶结合、蛋白结合、转录激活活性、转录调控区的DNA结合、微管蛋白结合、泛素蛋白与连接酶结合、泛素蛋白连接酶的活性、提高泛素蛋白连接酶的活性、锌离子结合
2.编码的蛋白质序列是怎样的?
102030405060
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAED
708090100110
LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
3.该蛋白质有没有保守的功能结构域
该蛋白质有保守的功能结构域。
分别为cd00027(Location:
1763–1842BlastScore:
107)cd00162(Location:
23–68BlastScore:
134)pfam04873(Location:
655–978BlastScore:
1301)pfam12820(Location:
344–507BlastScore:
809)pfam13923(Location:
20–65BlastScore:
135)
4.该蛋白质的功能是怎样的?
①E3泛素蛋白连接酶,专门介导LYS-6'-联泛素链的形成,并通过促胞对DNA损伤的反应,在DNA修复中起着核心的作用;目前还不清楚是否也介导其他类型的泛素链形成。
E3泛素蛋白连接酶的活性是其抑癌能必需的。
②BARD1-BRCA1异源二聚体协调各种不同的细胞通路,如DNA损伤修复,泛素化和转录调控,以维持基因组稳定性。
③调节中心体微核。
④从G2到有丝分裂的正常细胞周期进程所必需的。
⑤参与转录调控在DNA损伤反应中的P21。
⑥为FANCD2靶向DNA损伤位点所需。
⑦可以用作转录调控因子。
⑧绑定到ACACA和防止其去磷酸化,抑制脂质合成。
5.该蛋白质的三级结构是什么?
如果没有的话,和它最相似的同源物的结构是什么样子的?
给出示意图。
该蛋白有三级结构,如图所示
西安交通大学实验报告
课程生物信息学实验名称双序列比对
系别实验日期:
专业班级组别交报告日期:
姓名学号报告退发:
(订正、重做)
同组人无教师审批签字:
实验目的:
1、练习使用动态规划算法进行双序列比对;
2、理解打分矩阵和参数对;
3、双序列比对结果的影响;
4、理解动态规划算法的原理。
实验步骤及结果:
1.RNP1和RNP2是否得到比对?
选择至少三个(差别大的)空位罚分和延伸值来进行比对
(1)空位开启1.0空位延伸:
0.5结果:
比对成功
#-gapopen1.0
#-gapextend0.5
#Length:
75
#Identity:
38/75(50.7%)
#Similarity:
51/75(68.0%)
#Gaps:
14/75(18.7%)
#Score:
203.5
EMBOSS_0011--ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY45
|.||||||||||:
||||:
:
||.:
||.|.:
|:
:
:
|||||.|.
EMBOSS_0011MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL46
EMBOSS_00146GYAFVDFTSEM--DSQRAIKVLNG-67
||.||:
:
|:
|:
.:
||..|||
EMBOSS_00147GYGFVNY-SD-PNDADKAINTLNGL69
(2)空位开启:
5.0空位延伸:
0.5结果:
比对成功
#-gapopen5.0
#-gapextend0.5
#Length:
69
#Identity:
35/69(50.7%)
#Similarity:
47/69(68.1%)
#Gaps:
2/69(2.9%)
#Score:
181.0
EMBOSS_0011-ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAF49
.|.||||||||||:
||..|..:
||.:
||.|.:
|:
:
:
||..||.|.||.|
EMBOSS_0011MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGF50
EMBOSS_00150VDFTSEMDSQRAIKVLNG-67
|:
:
:
...|:
.:
||..|||
EMBOSS_00151VNYSDPNDADKAINTLNGL69
(3)空位开启:
1.0空位延伸:
10.0结果:
比对成功
#-gapopen1.0
#-gapextend10.0
#Length:
74
#Identity:
38/74(51.4%)
#Similarity:
51/74(68.9%)
#Gaps:
12/74(16.2%)
#Score:
203.0
EMBOSS_0011--ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY45
|.||||||||||:
||||:
:
||.:
||.|.:
|:
:
:
|||||.|.
EMBOSS_0011MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL46
EMBOSS_00146GYAFVDFTSE-MDSQRAIKVLNG-67
||.||:
:
|:
.|:
.:
||..|||
EMBOSS_00147GYGFVNY-SDPNDADKAINTLNGL69
2a.算法是否找到RNP1和RNP2的正确比对?
如上图
b.当空位开启罚分高时,结果发生什么变化?
对比上图
(1)和
(2)得知空位开启罚分高时,结果得分变低
c.当空位延伸罚分高时,结果发生什么变化?
对比
(1)和(3)得知空位延伸罚分高时,结果变低,但不明显
d.为什么k个连续的空位罚分要小于k个间隔的空位罚分?
因为空位开启的罚分影响要高于空位延伸罚分,综合2a和b可知,所以k个连续空位罚分要比k个间隔空位罚分低。
使用PAM250矩阵重复上述过程。
3.比对结果是否发生变化?
(1)
#-gapopen1.0
#-gapextend0.5
#Length:
76
#Identity:
38/76(50.0%)
#Similarity:
56/76(73.7%)
#Gaps:
16/76(21.1%)
#Score:
213.5
EMBOSS_0011-ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S44
.|:
||||||||||:
||||:
:
||:
||.|:
:
|:
:
:
||||||
EMBOSS_0011MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS45
EMBOSS_00145YGYAFVDFTSEM--DSQRAIKVLNG-67
.||:
||:
:
|:
|:
:
:
||:
.|||
EMBOSS_00146LGYGFVNY-SD-PNDADKAINTLNGL69
(2)
#-gapopen5.0
#-gapextend0.5
#Length:
70
#Identity:
36/70(51.4%)
#Similarity:
55/70(78.6%)
#Gaps:
4/70(5.7%)
#Score:
191.0
EMBOSS_0011-ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYK-TGYSYGYA48
.|:
||||||||||:
||:
.|:
.:
||.:
||.|:
:
|:
:
:
|||||.|.||:
EMBOSS_0011MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRD-KITGQSLGYG49
EMBOSS_00149FVDFTSEMDSQRAIKVLNG-67
||:
:
:
...|:
:
:
||:
.|||
EMBOSS_00150FVNYSDPNDADKAINTLNGL69
(3)
#-gapopen1.0
#-gapextend1.0
#Length:
75
#Identity:
38/75(50.7%)
#Similarity:
56/75(74.7%)
#Gaps:
14/75(18.7%)
#Score:
213.0
EMBOSS_0011-ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S44
.|:
||||||||||:
||||:
:
||:
||.|:
:
|:
:
:
||||||
EMBOSS_0011MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS45
EMBOSS_00145YGYAFVDFTSE-MDSQRAIKVLNG-67
.||:
||:
:
|:
.|:
:
:
||:
.|||
EMBOSS_00146LGYGFVNY-SDPNDADKAINTLNGL69
4a.RNP1和RNP2是否在局部比对中得到比对?
RNP1和RNP2在局部比对中比对成功。
b.局部比对的生物学意义是什么?
局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。
此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义
c.为什么在这种比对中我们选择局部比对而不是全局比对?
答:
局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。
5.比对结果发生了什么变化?
答:
从3的图中可以看出,在同一个打分矩阵下,比对结果基本没有差别;在不同的打分矩阵下,比对结果也基本无区别,但得分有所变化。
西安交通大学实验报告
课程生物信息学实验名称序列的点阵分析
系别实验日期:
专业班级组别交报告日期:
姓名学号报告退发:
(订正、重做)
同组人无教师审批签字:
实验目的:
点阵分析是双序列分析最直观的工具,通过本实验了解点阵分析的原理和方法。
教学基本要求:
了解和熟悉点阵分析的原理和参数对分析结果的影响,可以对结果进行解读和解释。
回答问题:
点阵分析的基本原理是什么?
点阵法是双序列比对的基本方法,比对法的基本思想是:
将两条待比较的序列分别放在矩阵的两条轴上,从上往下,当对应的行和列的序列字符匹配时,则在矩阵对应的位置作出点标记,逐个比较所有的字符对,最终形成点阵图。
两条完全相同的序列在点阵图中表现为一条连续的对角线,相似性很高却又不完全相同的序列,表现为不连续的对角线,中间断掉的部分表示在那些区域字符不匹配。
1.重复序列
通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:
P24014)中具有几个重复片段,请通过dotlet分析,找到这些序列重复的片段。
如图所示,除了对角线有8条浅色的线,因为对称可知共四条重复片段。
从uniprot注释信息确定有四条重复片段。
2.低复杂度区域
恶性疟原虫抗原蛋白前体(索引号码:
P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点
丝氨酸重复域是一个黑色的方形,这是一个低复杂度的地区,其中一个或几个残基表现出或多或少完美的周期性的特点。
西安交通大学实验报告
课程生物信息学实验名称多序列比对
系别实验日期:
专业班级组别交报告日期:
姓名学号报告退发:
(订正、重做)
同组人无教师审批签字:
实验目的:
在序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构建位置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。
1.使用CLUSTALW算法,比对一组蛋白质序列,序列的索引号码为:
P25454,P25453,P0A7G6,P48295。
a.练习使用EBICLUSTALW
b.将序列数据拷贝复制到窗口中;
c.采用默认参数进行比对;
结果如下图
clustalw算法的基本原理:
ClustalW的基本原理是首先做序列的两两比对,根据该两两比对计算两两距离矩阵,然后用NJ或者UPGMA方法构建Binary进化树作为guidetree,最后用progressive的方法根据guidetree逐步添加序列进行比对,一直到所有序列都比对好.
2.在BAliBASE网站查找一组蛋白质:
1csy。
这些蛋白质的一致性为20-40%,属于BAliBASE参考序列1。
Clustalw2
muscle
T-coffe
分别与下图比较,一致得1分,不一致得0分。
(1)CLUSTALW2比对得分10分;
(2)MUSCLE比对得分13分;
(3)T-Coffee比对得分14分;
所以T-coffe结果更好
西安交通大学实验报告
课程生物信息学实验名称HIV病毒的进化分析
系别实验日期:
专业班级组别交报告日期:
姓名学号报告退发:
(订正、重做)
同组人无教师审批签字:
实验目的:
了解和学习系统发生分析的步骤和基本方法
实验步骤:
在MEGA5.05中,Align→Edit/BuildAlignment→Retrievesequencesfromafile,导入上述的.fasta的文件,选择Alignment→AlignByClustalw或AlignByMuscle。
选择默认参数进行比对。
将结果保存。
(为了节约时间,多序列比对的结果我们可以不处理)
结果如下图
在MEGA主程序中,选择Phylogeny,选择一种构建树的方法,导入上述保存的结果,在参数选择中,“PhylogenyTest”选择“Bootstrapmethod”,选择500或者1000,其他参数默认。
选择500时建树:
对树的解释:
NJ法根据修正净差异值先确定节点,再根据各部分到节点的距离构建树。
各节点所标的数值为该节点到前一节点的距离。
由图可看出,这16条序列是同源序列,具有共同的祖先序列,即'SIVmonCercopithecusMonkeys'序列。
1.系统发生分析的步骤?
主要为三步
(1)分子序列或特征数据的分析;
(2)系统发生树的构造;
(3)结果的检验。
2.为什么不直接使用序列的全长,而只是部分序列?
一是由于序列的长度过长,造成比对时的误差较大,同时,由于各序列的长度不同,可能造成比对的失真,同时,比对过长的序列,造成的损耗大,而对比关键的部分序列,效率更大,更能找出差异与联系。
3.为什么在构建进化树之前需要进行多序列比对?
对多序列比对结果应该如何进行处理?
同时比对一组序列对于研究分子结构、功能及进化关系更为有用。
例如,某些在生物学上有重要意义的相似性只能通过将多个序列对比排列起来才能识别。
同样,只有在多序列比对之后,才能发现与结构域或功能相关的保守序列片段。
多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。
应进行简单的分析与评判,并进行初步的处理与优化,达到进一步的结果,从而对构建进化树起更加准确的结果。
4.常用的构建树的方法有几大类?
系统发生树的构建方法分为两大类:
一是基于距离的构建方法。
有非加权组平均法、邻近归并法、Fitch-Margoliash法和最小进化方法。
二是基于离散特征的构建方法。
有最大简约法、最大似然法、进化简约法和相容性方法。
或者根据建树算法在执行过程中采用的搜索方式,系统发生树的构建方法也可以分为以下3类。
(1)穷尽搜索方法
即产生所有可能的树,然后根据评价标准选择一棵最优的树。
(2)分支约束方法
即根据一定的约束条件将搜索空间限制在一定范围内,产生可能的树,然后择优。
(3)启发式或经验性方法
根据先验知识或一定的指导性规则压缩搜索空间,提高计算速度。
5.树是如何进行统计学评估的?
对于所构建的系统发生树,统计分析的误差可能会影响所建树的可靠性。
运用大量的模拟实验可以比较这些树的建树方法的统计可靠性。
即运用多种方法建树,得到的结果应比较类似,这才说明树构建的合理性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物信息学 生物 信息学
![提示](https://static.bdocx.com/images/bang_tan.gif)