蛋白质抗原的表位分析.docx
- 文档编号:1370019
- 上传时间:2022-10-21
- 格式:DOCX
- 页数:20
- 大小:33.86KB
蛋白质抗原的表位分析.docx
《蛋白质抗原的表位分析.docx》由会员分享,可在线阅读,更多相关《蛋白质抗原的表位分析.docx(20页珍藏版)》请在冰豆网上搜索。
蛋白质抗原的表位分析
有鉴定表位的相关技术和文献。
也有一些表位预测软件。
一般来说,目前研究主要集中在线性表位上,而构象表位的预测和鉴定方法目前不是很成熟。
找到一个帖子,楼主可以参考:
1、B细胞表位预测对于多种免疫学研究是必不可少的。
针对不同的蛋白,应选择不同的方法。
一般来说,蛋白质的C端具有较好的亲水性、表面可及性和柔性,所以
是很好的抗原决定簇区域。
本课题选用的蛋白质C-末端序列标签都是唯一的、或是其家族中的几个成员所共有的。
在人蛋白质中,约81%的蛋白质其C末端的5个氨基酸残基的小肽是该蛋白质所特有的,制备针对蛋白质C末端小肽的抗体,常常能得到特异性识别该全蛋白的抗体。
另外,蛋白的二级结构是B细胞表位计算机预测
的重要参数之一,β转角为凸出结构,多出现在蛋白质抗原表面,有利于与抗体结合,较可能成为抗原表位。
而α螺旋和β折叠结构规则不易变形,较难结合抗体,一般不作为抗原表位。
含有5个以上的氨基酸残基的转角又常称为环(loop)。
以往的
研究表明,蛋白表面的loop区可能为功能性抗体的识别位点,特异性好,可及性强。
本课题选用的HPO、G-CSF、HSA空间结构已明确,所以直接选择loop区或无规
卷曲作为B细胞表位。
举例:
人Pif1基因编码至少两种蛋白亚型,分子量分别为74kDa和80kDa,与酵母具有高
度的同源性,α型和β型Pif1只有C末端不同[20>,其余部分完全相同,并且二者的C末端在蛋白数据库中都是唯一的,选择α型和β型的C末端作为B细胞表位,
既满足特异性的需要,也能区分亚型。
GPAA1是一种跨膜蛋白,原核表达非常困难,形成包涵体,且包涵体难以溶解和复
性。
对这一类型的蛋白,非常适合选择其特有的B细胞表位免疫动物,来最终制备识别全蛋白质的抗体。
ABCpred是基于人工神经网络模型的线性B细胞表位预测工
具,该系统检验了源于Bcipep数据库的700个非冗余B细胞表位和源于Swiss-Prot
数据库的700个长度为10~20个氨基酸的随机选择多肽,准确率近66%。
Bepipred
结合隐马尔科夫模型和亲水性参数评分预测线性B细胞表位,AROC评分达到
0.671。
将两种预测方法得到的预测结果进行比较,其共有的预测表位是真正B细胞
表位的几率更大,如果能进一步结合蛋白质二级结构预测结果,就可以选出可信度
更高的B细胞表位。
如何选择有效的B细胞表位是能否实现无完整蛋白质抗原条件
下抗体制备的关键。
2、对于B细胞表位的选择,对于已有空间结构信息的蛋白质抗原,直接选择蛋白
分子表面的loop区或无规卷曲区域的小肽序列作为候选
B细胞表位;对于缺乏空间
结构信息的蛋白质抗原,需要根据蛋白质抗原的特点具体分析。
若蛋白质抗原
C末
端的序列亲水性好,可以选择C末端的6~10个氨基酸的序列作为候选B细胞表位,
并且最好该序列为该蛋白质所特有;也可采用
B细胞表位预测程序进行分析,选择
不同程序预测的共有B细胞表位;对于同源性很高的家族蛋白,根据序列比对结果
选择差异较大的区域,并且所选序列应该符合
B细胞表位的特征。
基于以上原则,
本实验选择了10个蛋白的14个表位,并对其中的12个表位进行了验证。
3、对于B细胞表位的选择,
(1)对于空间结构已知的蛋白质,直接选择蛋白分子表面的
loop区或无规卷曲区
域的小肽序列。
(2)对于空间结构未知的蛋白质,可采用以下策略进行选择:
A:
若蛋白质C末端序列的亲水性好,可以选择C末端的6~10氨基酸的序列作为候选B细胞表位,最好该序列为该蛋白质所特有。
可采用SIBBLASTNetworkService
(http:
//www.expasy.ch/tools/blast/)的BLAST软件进行比对,数据库选择homosapiens;
B:
采用B细胞表位预测程序ABCpred和BepiPred等进行表位预测,选择不同程序预测的共有B细胞表位;
C:
对于同源性很高的蛋白质,首先根据序列比对结果选择差异较大的区段,并且所选序列应该符合B细胞表位的特征。
4、二级结构预测分别应用EX-PASY服务器(http:
//www.expasy.org/tools)上的
GOR4[4>、HNN(HierarchicalNeuralNetworkmeth-od)、SOPMA、nnPredict[University
ofCaliforniaatSanFrancisco(UCSF)>等方法。
亲水性、柔韧性、表面可能性和抗原表位预测应用DNAstar软件的子程序Protean,采用Hopp-Woods和Kyte-Doolittle方案预测氨基酸的亲水性[5,6>,采用
Karplus-Schultz和Emini方案预测柔韧性及表面可能性[7,8>,采用Jameson-Wolf方案[9>和吴氏抗原指数法[10>预测潜在的B细胞抗原表位。
5、对获取序列的生物信息学处理分析
使用DNASTAR软件分析获取的序列,结合NCBI上的BLAST寻找最匹配的短序列。
用全部和部分肽序列查询各国专利数据库:
http:
//appft1.uspto.gov/netahtml/PTO/search-adv.ht/
http:
//www.freepatentsonline.com/5194592.htm/
http:
//www.stcsm.gov.cn/resource/data/zhuanl.iasp#1
使用蛋白质在线分析工具分析多肽的疏水性、PI值、稳定性:
http:
//www.expasy.org/
http:
//www.rcsb.org/pdb/cgi/explore.cg?
ipdbId=1fi6
http:
//www.rcsb.org/pdb/search/searchSequence.do
http:
//www.expasy.org/sitemap.html
http:
//www.expasy.org/tools/#translate
http:
//www.expasy.org/tools/blast/
常用数据库和预测工具:
名称网址说明
ABCpredhttp:
//www.imtech.res.in/raghava/abcpred人工神经网络线性B细胞表位预
测工具
AgAbDbhttp:
//202.41.70.51:
8080/agabdb2/抗原-抗体共结晶结构的分子相互作用数
据库
AntiJenhttp:
//www.jenner.ac.uk/AntiJenB细胞表位定量结合数据库Bcipephttp:
//www.imtech.res.in/raghava/bcipep/B细胞表位数据库
Bepipredhttp:
//www.cbs.dtu.dk/services/BepiPred基于序列的线性表位预测工具
CEPhttp:
//bioinfo.ernet.in/cep.htm基于结构的连续性和非连续性表位预测工具
DiscoTopehttp:
//www.cbs.dtu.dk/services/DiscoTope基于序列/结构的非连续性表位
预测工具
Epitomehttp:
//www.rostlab.org/services/epitome抗原-抗体相互作用残基数据库HIVdatabasehttp:
//www.hiv.lanl.gov/content/immunologyHIV免疫表位数据库
IEDBhttp:
//www.immuneepitope.orgT细胞和B细胞表位数据库含阴性数据
IEDBB-cellhttp:
//www.immuneepitope.org/tools/bcell/iedb_input基于序列的线性表位预测工具
epitopetools
6、B细胞表位预测的方法及应用
线性表位的预测方法
B细胞表位的预测方法主要集中于线性表位,在二十世纪七、八十年代发展起来的大量的预测B细胞表位的算法都是基于蛋白质序列。
这些算法包括:
⑴蛋白质的亲水性算法(Hydrophilicity):
认为蛋白质各氨基酸残基可分为亲水残基和疏水残基两
类。
在机体内,疏水性残基一般被埋在蛋白内部,而亲水性残基位于蛋白质表面,
因此,蛋白的亲水部位与蛋白抗原表位有着密切的联系。
Hopp-Woods(HoopTPet
al.,1981)算法为最常用的。
⑵可及性算法(Accessibility):
常用的有Janin可及性参数,
即指蛋白质抗原中氨基酸残基被溶剂分子接触的可能性(RudolphRetal.,1990)。
它反
映了蛋白质抗原各个氨基酸残基的分布情况。
⑶蛋白质可塑性算法(Flexibility):
此
算法认为蛋白质抗原构象的多肽链骨架具有一定程度的活动性,活动性强的氨基酸
残基即可塑性大,易形成抗原表位(KarplusPAetal.,1985)。
⑷蛋白质二级结构预测算法(Secondarystructure):
该算法认为蛋白质二级结构与蛋白质表位的分布关系密切。
α螺旋、β折叠化学键键能比较高,形态固定,常处于蛋白质内部,难以与抗体嵌合,而β转角和无规则卷曲多处于蛋白质的表面,结构松散,易展示在蛋白质表
面,有利于与抗体嵌合,成为抗原表位的可能性大(来鲁华,1993)。
⑸蛋白质抗原性算法(Antigenicity):
Welling(WellingGW.,1985)通过对20个已研究得很透的蛋白质的
69个连续位点的606个氨基酸统计分析,用各氨基酸残基在已知B细胞表位中出现的百分率与其通常在蛋白质中出现的百分率比值的对数建立了抗原性刻度,并以此
计算蛋白中各亚序列的抗原性。
这些方法的代表软件有PEOPLE(AlixAJetal.,1999)、PREDITOP(PellequerJLetal.,1993)、BEPITOPE(OdoricoMetal.,2003)、Bcepred(Saha
Setal.,2004)等。
但是最近Blythe及Flower(BlytheMJetal.,2005)对氨基酸的性质与
线性表位的关系做了一个评估,结果表明基于氨基酸序列信息来预测线性表位,即使很好的结合了氨基酸的各种性质,其预测结果仅略强于随机预测。
近年来,一些
应用隐形马尔可夫模型(HMM)、人工神经网络(ANN)、支持向量机算法(SVM)及其他技术的机器研究方法(PonomarenkoJVetal.,2007)已经被引入来预测B细胞表位,取得了较好的结果。
代表软件有ABCpred(SahaSetal.,2006)、BepiPred(LarsenJEetal.,2006)、APP(ChenJetal.,2007)等。
ABCpred采用人工神经网络来预测线性表位,
从Bcipep和SwissProt数据库中提取非冗余的表位肽和非表位肽作为训练集,采用5-折交叉验证,预测敏感性约为67%,特异性约为64%。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 抗原 分析