人类原癌基因NRas抗体的生物信息学分析.docx
- 文档编号:30646185
- 上传时间:2023-08-18
- 格式:DOCX
- 页数:13
- 大小:384.79KB
人类原癌基因NRas抗体的生物信息学分析.docx
《人类原癌基因NRas抗体的生物信息学分析.docx》由会员分享,可在线阅读,更多相关《人类原癌基因NRas抗体的生物信息学分析.docx(13页珍藏版)》请在冰豆网上搜索。
人类原癌基因NRas抗体的生物信息学分析
人类原癌基因N-Ras抗体的生物信息学分析
原癌基因[1](proto-oncogene)是细胞内与细胞增殖相关的基因,是维持机体正常生命活动所必须的,在进化上高等保守。
当原癌基因的结构或调控区发生变异,基因产物增多或活性增强时,使细胞过度增殖,从而形成肿瘤。
癌症,也叫恶性肿瘤,相对的有良性肿瘤。
肿瘤是指机体在各种致瘤因素作用下,局部组织的细胞异常增生而形成的局部肿块。
良性肿瘤容易清除干净,一般不转移、不复发,对器官、组织只有挤压和阻塞作用。
但恶性肿瘤还可以破坏组织、器官的结构和功能,引起坏死出血合并感染,患者最终可能由于器官功能衰竭而死亡。
正常细胞中原癌基因的表达水平一般较低,而且是受生长调节的,其表达主要有三个特点:
具有分化阶段特异性;细胞类型特异性;细胞周期特异性。
Ras癌基因可以导致正常细胞发生恶性转化,人类40%%的肿瘤和ras基因激活相关。
人类ras基因家族包括H-ras、K-ras和N-ras三个基因。
以往大量研究都是关注ras基因突变与胃癌、肺癌等的关系,缺乏对ras抗体的研究。
本文利用生物信息学方法,对人类原癌基因N-Ras抗体(Anti-NRAS)基因的序列结构与功能进行分析和预测,为以后研究更好的N-Ras抗体[2]奠定基础。
一、材料与方法
1.材料
Anti-NRAS基因的核苷酸序列和氨基酸序列来自于NCBI,登录号分别为NM_002524.4和NP_002515.1。
2.方法
表1生物信息学软件
名称软件说明网址
ProtParam蛋白质一级结构分析http:
//expasy.org/tools/protparam.html
Psipred蛋白质二级结构预测http:
//bioinf.cs.ucl.ac.uk/psipred/
SignalP蛋白质信号肽预测http:
//www.cbs.dtu.dk/services/SignalP/
COILS蛋白质卷曲螺旋预测http:
//www.ch.embnet.org/software/
TMHMM蛋白质跨膜结构预测http:
//www.cbs.dtu.dk/services/TMHMM/
TargetP蛋白质亚细胞定位预测http:
//www.cbs.dtu.dk/services/TargetP/
NetNGlyc蛋白质糖基化位点预测http:
//www.cbs.dtu.dk/services/NetNGlyc/
其中蛋白质亲疏水性分析和蛋白质三级结构预测采用matlab分析
二、结果与分析
1.Anti-NRAS基因的核苷酸序列分析
用matlab对核苷酸序列单体密度和联合体密度以及二聚体等性质进行分析,如下图所示:
图1单体和联合体密度
图2核苷酸分布图3二聚体分布
2.Anti-NRAS基因的氨基酸序列分析
通过ProtParam软件(http:
//expasy.org/tools/protparam.html),分析Anti-NRAS蛋白的理化性质,如表1所示。
氨基酸残基数和分子量较小,属于小分子蛋白。
带正电的氨基酸数22小于带负电的氨基酸数28,它的不稳定系数28.98小于40%,所以它属于稳定的蛋白质。
总的平均亲水性为-0.317,是负值,说明它是可溶性蛋白。
通过matlab分析Anti-NRAS蛋白氨基酸序列的组成和氨基酸原子之间的距离,如图4和图5所示。
除了组氨酸(H)以外,其它的氨基酸的组成成分比例很相似,说明此蛋白的氨基酸丰富。
Anti-NRAS蛋白序列的氨基酸的原子距离形成了一幅美丽的金鱼图,说明原子间的排列很有规律。
表2氨基酸的理化性质
氨基酸个数:
189
分子量:
21229.1
理论等电点:
5.01
Asp+Glu个数:
28
Arg+Lys个数:
22
原子个数:
2963
原子组成:
C927H1479N251O294S12
不稳定系数:
28.98
脂肪系数:
82.96
总平均亲水性:
-0.317
消光系数:
0.661121
图4Anti-NRAS蛋白的氨基酸组成图5Anti-NRAS蛋白原子之间的距离分布图3.Anti-NRAS蛋白的表面亲疏水性分析[3]
疏水作用是蛋白质折叠的主要驱动力。
一般通过亲疏水性分布图(Hydropathyprofile)来反映蛋白质的折叠情况,其次,氨基酸亲疏水性分析为蛋白质二级结构预测提提供佐证,是分析蛋白跨膜区的第一步。
蛋白质折叠时会形成疏水内核与亲水表面,同时,在潜在跨膜区出现高疏水值区域。
可以测定跨膜螺旋等二级结构和蛋白质表面的氨基酸分布。
通过matlab中的KyteandDoolittle算法对Anti-NRAS蛋白进行亲疏水性预测(图5),其中正值表示疏水,负值表示亲水。
结果表明,Anti-NRAS蛋白的疏水区(score>0)分布在23-44,64-79,99-110,130-140,159-162,180-182这五个区域内,而极强亲水区在16,60,89,124,150,170等附近。
从图中可以看出,亲水的面积是要大于疏水的面积的,总体为亲水性,与上面的理化分析是一致的。
图6亲疏水性分析
4.Anti-NRAS蛋白的信号肽分析[4]
信号肽是位于蛋白质N端的一段氨基酸序列,用于引导蛋白质细胞的正确定位以及跨膜的运输,利用SignalP对Anti-NRAS蛋白进行信号肽的预测,分析结果如图7和表3所示,标记为C的行是剪切位点打分,标记为S的行是信号肽打分,标记为Y的行是综合接切点打分。
判断是否为分泌蛋白,通过S平均值(meanS-score)来判断,若S平均值>0.5,则预测为分泌蛋白,存在信号肽。
由上述结果可知,S=0.118<0.5,说明该蛋白不是分泌蛋白,不存在信号肽。
图7Anti-NRAS蛋白的信号肽分析
表3Anti-NRAS蛋白的信号肽打分结果
MeasurePositionValueCutoffsignalpeptide?
max.C190.120
max.Y190.120
max.S40.137
meanS1-180.118
D1-180.1190.450NO
5.Anti-NRAS蛋白卷曲螺旋预测
卷曲螺旋是一种蛋白质超二级结构,是由2股或2股以上α-螺旋相互缠绕形成麻花状结构,也是控制蛋白质寡聚化的元件,它存在于多种蛋白质中,许多具有重要生物学功能,如基因表达调控中的转录因子,蛋白质中含有卷曲螺旋。
利用,COILS(网址:
http:
//www.ch.embnet.org/software/COILS_form.html)网络工具进行预测。
由预测图形(图7)可知,该蛋白序列有四个卷曲螺旋,第一个位于41-77,第二个位于85-109,第三个位于122-137,第四个位于141-180。
图8Coils预测蛋白图形显示结果
6.Anti-NRAS蛋白跨膜结构预测
跨膜结构域,常常是由跨膜蛋白的效应区域所展现。
跨膜蛋白,即跨越膜的两端的蛋白质,其跨膜部分为β折叠或α螺旋结构,对正确认识和理解蛋白质的功能、结构、分类、定位有重要的指导意义。
利用网络跨膜分析程序TMHMM对Anti-NRAS蛋白进行跨膜结构预测,结果(图9和表4)表明,Anti-NRAS蛋白存在细胞膜外,没有跨膜区。
图9Anti-NRAS蛋白跨膜结构
表4Anti-NRAS蛋白跨膜结构文本显示结果
SequenceLength:
189
SequenceNumberofpredictedTMHs:
0
SequenceExpnumberofAAsinTMHs:
0.62141
SequenceExpnumber,first60AAs:
0.58946
SequenceTotalprobofN-in:
0.11823
SequenceTMHMM2.0outside1189
7.Anti-NRAS蛋白亚细胞定位预测[5]
利用http:
//www.cbs.dtu.dk/services/TargetP/对Anti-NRAS蛋白亚细胞定位进行预测,结果如表8,其中,“cTP”、“mTP”、“SP”、“other”分别表示最终预测为叶绿体转运肽,线粒体导肽、信号肽、其它类型的分值,这些值不表示真正意义上的可能性,但它们最高值可能就是TargetP所预测的定位。
“Loc”表示基于上面分值所预测的可能定位,_表示除前面三除外的其他位置。
从表5中可以看出,Anti-NRAS蛋白不位于线粒体,核糖体等细胞器,而位于除上面所说的之外的细胞器中。
表5Anti-NRAS蛋白亚细胞定位预测
Name
Len
mTP
SP
other
Loc
RC
Anti-NRAS蛋白
189
0.083
0.189
0.804
—
2
8.Anti-NRAS蛋白质结构域分析
通过PFSCAN(网址:
http:
//hits.isb-sib.ch/cgi-bin/PFSCAN)对Anti-NRAS蛋白质结构域分析,由图11和表9可知,Anti-NRAS蛋白可能存在一个结构域,位于5-165。
图10Anti-NRAS蛋白质结构域分布图
表5Anti-NRAS蛋白质结构域打分结果
pos
Raw-score
N-score
E-value
5-165
323.2
104.122
1.6e-97
9.Anti-NRAS蛋白糖基化位点预测
利用糖基化位点网站http:
//www.cbs.dtu.dk/services/NetNGlyc/预测Anti-NRAS蛋白质在人类蛋白质中的糖基化位点,由图11和表6可知,Anti-NRAS蛋白质含有两个糖基化位点,分别为85位的NNSK,172位的NSSD,其他位点的可能性相对较小。
图11Anti-NRAS蛋白糖基化位点预测
表6Anti-NRAS蛋白糖基化位点及分数
PositionPotentialJuryagreementN-Glycresult
85NNSKA0.5394(4/9)+
172NSSD0.6062(6/9)+
10.Anti-NRAS蛋白的二级结构预测[6]
蛋白质二级结构中C表示coil(无规则卷曲),H表示helix(
螺旋),E表示extended(
折叠),利用Psipredproteinstructurepredictionserver(网址http:
//bioinf.cs.ucl.ac.uk/psipred/)对Anti-NRAS蛋白的二级结构预测,从图12可知,
螺旋占31.2%(59AA),无规则卷曲占9.52%(18AA),没有
折叠。
图12Anti-NRAS蛋白二级结构
11.Anti-NRAS蛋白质三级结构分析[7]
蛋白质三级结构的预测和分析,对理解蛋白质结构和功能之间的关系有着极其重要的意义。
利用PDB数据库,网址:
http:
//www.rcsb.org/pdb/home/home.do得出E-Value:
1.89644E-92,Score:
858,再利用matlab中的molviewer函数显示三级结构(图11),然后利用matlab中的ramachandran函数进行Anti-NRAS蛋白质三维立体分子结构的预测(图12),Ram-achandranplots是反映立体化学质量的参数,它通过分析
角和
角的分布方式大致评估模拟的结构是否与自然结构趋势相同。
预测蛋白质残基的二面角有90%以上位于红色区域,表明Anti-NRAS蛋白具有有稳定的空间结构。
图13Anti-NRAS蛋白三维高级结构预测
图14Anti-NRAS蛋白三维建模的ramachandran
三、讨论
随着人类基因组计划的完成,生物科学从基因组时代进入了后基因组时代生物信息学作为分子生物学和计算机技术高度结合的交叉学科,已经广泛应用在预测蛋白质结构和功能以及确定蛋白质生物学特性等研究领域,在后基因组时代必将扮演着重要的角色。
本文利用生物信息学的各种软件及在线工具,对Anti-NRAS蛋白的结构和功能进行预测和分析。
预测蛋白序列中卷曲螺旋的位置是当前生物信息学中重要的研究课题[8],因为通过对蛋白质卷曲螺旋的预测能为该蛋白的功能研究提供重要线索。
分析发现,Anti-NRAS基因蛋白存在4个卷曲螺旋,卷曲螺旋的特异性作用常常形成二聚体,卷曲螺旋这种结构模式简单而有规律。
预测蛋白质序列中跨膜螺旋的位置是当前生物信息学中重要的研究课题,因为通过膜蛋白跨膜结构预测能为蛋白的功能研究提供重要的线索。
目前对Anti-NRAS蛋白的结构研究还很少,我们对Anti-NRAS蛋白进行了理化性质、信号肽、跨膜分析、亚细胞定位等分析。
同时我们对Anti-NRAS蛋白的二级结构的预测以及对三级结构的同源建模预测,对Anti-NRAS蛋白有了一个全面的了解,为进一步阐明Anti-NRAS基因在细胞内的生物学调控机制提供了线索。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人类 基因 NRas 抗体 生物 信息学 分析