蛋白质结构与功能的生物信息学研究Word文件下载.docx
- 文档编号:13614083
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:19
- 大小:931.75KB
蛋白质结构与功能的生物信息学研究Word文件下载.docx
《蛋白质结构与功能的生物信息学研究Word文件下载.docx》由会员分享,可在线阅读,更多相关《蛋白质结构与功能的生物信息学研究Word文件下载.docx(19页珍藏版)》请在冰豆网上搜索。
BLAST工具能对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对,并从相应数据库中找到相同或相似序列。
对指定的蛋白质的氨基酸序列进行同源性搜索步骤如下:
↓
登录网址http:
//web.expasy.org/blast/
输入序列后,运行blast工具
序列比对的图形结果显示
序列比对的图形结果:
用相似性区段(Hit)覆盖输入序列的范围判断两个序列的相似性。
如果图形中包含低得分的颜色(主要是红色)区段,表明两序列的并非完全匹配。
匹配序列列表及得分
备注:
Clustal是一款用来对()的软件。
可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。
Clustal包括Clustalx和Clustalw(前者是图形化界面版本后者是命令界面),是生物信息学常用的多序列比对工具。
该序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.
详细的比对序列的排列情况
第一个匹配序列
Score表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度
越大。
Expect是输入序列被随机搜索出来的概率,该值越小越好。
Identities是相似程度,即匹配率,100%表示序列全部匹配。
Method:
代表不同的打分矩阵方法,选择不同的打分矩阵会得到不同的打分结果。
显示结果按越后面匹配率越低。
二、分析蛋白质的氨基酸序列的基本性质
ProParam是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinctioncoefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。
登录网址:
http:
//web.expasy.org/protparam并输入序列号
蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。
结果1:
该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子组成,共有19180个原子。
消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)
结果2:
消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白浓度。
由上图知,该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;
假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。
半衰期为30小时(哺乳动物的网织红细胞,体外);
>
20小时(酵母、体内),>
10小时(大肠杆菌、体内)。
该蛋白不稳定系数为56.13,提示该蛋白质不稳定。
脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定性,为82.35.蛋白质的疏水性预测可以根据GRAVY值来预测。
GRAVY值的范围在2与-2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。
该蛋白的GRAVY值为-0.247,因此预测该蛋白为亲水蛋白。
利用ProtScale工具对蛋白质进行亲疏水性分析
登录网址http:
//web.expasy.org/protscale并输入序列号
GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。
Hphob.kyte&
Doolittle标度(default)定义疏水性氨基酸较高的打分值(>
0值表示疏水性,<
0值表示亲水性。
从图可看出,标度值<
0的区域比>
0的较为密集,因此,结合上面的GRAVY值为-0.247,预测该蛋白为亲水蛋白。
利用TMPred工具对该蛋白进行跨膜区结构预测
//www.ch.embnet.org/software/TMPRED_form.html
用TMHMM预测是否存在跨膜区
//www.cbs.dtu.dk/services/TMHMM-2.0/
结果
三、蛋白质三维结构分析
//swissmodel.expasy.org/,输入相应的序列号
建模部分结果
有A、B、C、D四条晶体结构的单链阵线。
四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性分析
登录
在database里面找到string工具。
输入序列号
结果:
由结果可知,该蛋白质序列相互作用的蛋白有10个。
所输入序列的代码为ERBB2。
根据基本信息可知,
ERBB2是表皮生长因子受体(EGFR)家族成员之一
是白血病病毒致癌基因同族体2。
蛋白酪氨酸激酶(ERBB2基因表达产物)是几个细胞表面受体复合物的一部分,但这需要一个coreceptor配体结合。
Neuregulin受体复杂的重要组成部分,尽管neuregulin不单独与之交互。
GP30是一个潜在的配体受体。
调节产物和周边稳定微管(MTs)。
总结:
该蛋白质序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子组成,共有19180个原子。
该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;
该蛋白不稳定系数为56.13,结果提示该蛋白质不稳定。
脂肪系数为82.35.该蛋白的GRAVY值为-0.247,通过亲疏水性分析得出该蛋白为亲水蛋白。
三级结构分析显示该利用TMPred工具对该蛋白进行跨膜区结构预测得到4个跨膜区,而用TMHMM预测则存在2个跨膜区。
该蛋白质序列由4条链构成,通过相互作用分析得,该蛋白质序列相互作用的蛋白有10个,是表皮生长因子受体(EGFR)家族成员之一,参与细胞膜的表面受体的组成,与白血病的发生有关。
(注:
文档可能无法思考全面,请浏览后下载,供参考。
)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 结构 功能 生物 信息学 研究