电子克隆技术及其在植物基因工程中的应用.doc
- 文档编号:1718208
- 上传时间:2022-10-23
- 格式:DOC
- 页数:14
- 大小:119KB
电子克隆技术及其在植物基因工程中的应用.doc
《电子克隆技术及其在植物基因工程中的应用.doc》由会员分享,可在线阅读,更多相关《电子克隆技术及其在植物基因工程中的应用.doc(14页珍藏版)》请在冰豆网上搜索。
电子克隆技术及其在植物基因工程中的应用
王冬冬朱延明李勇李杰柏锡
(东北农业大学生命科学学院,黑龙江哈尔滨150030)
摘要:
电子克隆是随着基因组计划和EST计划的实施而发展起来的,是利用生物信息学手段进行基因克隆的新方法。
它具有投入低、速度快、技术要求低和针对性强等优点。
因此,电子克隆技术必将成为植物基因工程中获得新基因的重要手段。
阐述了电子克隆应用所依据的数据库与生物信息资源,介绍了利用电子克隆获得功能基因的方法,及其在植物基因工程中的应用现状与前景。
关键词:
电子克隆;植物基因工程;表达序列标签EST;生物信息学
电子克隆(insilicocloning)是近年来伴随着基因组计划和EST计划发展起来的基因克隆新方法。
电子克隆的技术原理是利用日益发展的生物信息学技术,借助电子计算机的巨大运算能力,通过EST或基因组的序列组装和拼接,利用RT-PCR的方法快速地获得新基因。
国际上Boguski等学者在1994年开始利用电子克隆方法发现新基因,中国科学院生物物理研究所陈润生研究组在1996也开始了对电子克隆的研究[1]。
电子克隆技术应用的前提条件要具备拟研物种的丰富核酸序列信息,其他物种的相关基因的信息,以及强大的计算机硬件和相关生物信息学分析软件。
基因组和EST资料的丰富程度决定了电子克隆得以在人类、小鼠等生物中广泛应用。
由于受到序列资料的限制,植物基因的电子克隆还鲜有报道。
但随着植物基因组计划和功能基因组学的发展,电子克隆在植物基因工程研究中必将发挥出巨大的功用。
1电子克隆技术及其依托的生物信息学资源
1.1电子克隆的基本原理
利用电子克隆方法获得新基因是生物信息学的研究内容之一。
生物信息学资源是由数据库、计算机网络和应用软件三大部分组成。
而电子克隆的应用即是基于这三部分生物信息学资源而展开的。
它是利用计算机技术,依托现有的网络资源(EST数据库、核苷酸数据库、蛋白质数据库、基因组数据库等),采用生物信息学方法(包括同源性检索、聚类、序列拼装等),通过EST或基因组的序列组装和拼接,利用RT-PCR快速地获得部分乃至全长cDNA序列的方法。
1.2电子克隆的实施方案
首先,在数据库或PubMed中获得感兴趣的cDNA或氨基酸序列,基于EST和基因组信息两种数据资源,利用上述得到的已知基因序列实施电子克隆有以下两种方案。
利用EST数据库信息资料:
①利用序列同源性比较软件(如Blast软件)将种子序列对库检索;②从数据库中挑选出全部相关序列;③对所有序列进行片段整合分析(即Contig分析),形成延伸后的序列,称新生序列。
随后,将此新生序列作为种子序列重复进行上述三步过程,直至新生序列不能被进一步延伸为止,通过完整性分析即获得了全长的新基因序列[2-3]。
见图1。
利用基因组信息资料:
把作为信息探针的氨基酸或核苷酸序列在NCBI网站中对特定物种各基因组数据库进行BLAST分析,从结果中筛选出感兴趣的外显子序列,并通过链接得到其所在的基因组序列,同时根据比对的结果对基因组序列可能造成的移码测序错误进行修正;把这些感兴趣的外显子序列按照其所在基因组上的位置依次进行直接连接,或者把基因组序列提交到GenScan和GeneFinder等网站进行预测,得到可能的新基因序列。
有时各外显子分别处于较短的尚未组装的基因组序列中,也可按探针基因外显子顺序进行直接拼接;把可能的新基因序列基于核酸数据库做BLAST分析,检验其新颖性;把筛选后的新基因序列提交到dbEST数据库做BLAST分析并延伸,同时也是进一步确认其真实存在的可信度,并进行组织表达定位,为克隆该基因提供组织来源信息。
最后根据最终的序列设计引物,进行RT-PCR实验得到新基因[4]。
见图2。
1.3电子克隆依据的网络分析程序和应用软件
1.3.1序列的相似性检索分析程序
一条序列对整个数据库进行相似性分析以发现其同源序列是电子克隆中的一个极其重要的方面。
目前使用最广泛的程序是FASTA和BLAST。
FASTA集中反映具有显著意义的序列对齐结果。
在互联网上已有许多的在线FASTA查找服务,同时也可下载后离线使用,下载站点:
ftp:
//ftp.vir.ginia.edu/pub/fasta/dos/。
BLAST(BasicLocalAlignmentSearchTool,基本局部比对搜索工具)则采用了一种短片段匹配算法和一种有效的统计模型来找出目的序列和数据库之间的最佳局部对齐效果。
目前在互联网上有许多在线的BLAST查找程序,专门用于查找各大数据库中与用户提交的序列同源的序列,如:
NCBI(http:
//www.ncbi.nlm.nih.gov/BLAST/blast.html)和EMBL(http:
//www.ebi.ac.uk/blast2)和EBI的FASTA(http:
//www.ebi.ac.k/fasta33/)fasta33/)。
同时运行这两个程序进行数据分析,能避免漏检一些有用的信息[5-6]。
1.3.2序列拼接、聚类的软件序列拼接、聚类常用的软件或软件包见表1[7]。
1.3.3核酸序列分析预测程序及软件
1.3.3.1可读框架(openreadingframe,ORF)分析
mRNA需要翻译为蛋白质方能发挥其生物学作用。
因此,核酸序列的可读框架分析是核酸分析的一个重要部分。
基于遗传密码表,可通过计算机方便的分析核酸序列的读码框。
最常用的互联网ORF分析资源是NCBI提供的ORFFinder,网址是http:
//www.ncbi.nlm.nih.gov/gorf/gorf.html。
1.3.3.2基因序列中的编码区/内含子结构分析预测通过与数据库中已知的蛋白质序列、cDNA序列以及EST序列进行对比,可识别编码区和内含子、外显子剪接位点。
一些内含子和外显子数据库可供参考,例如IDB(http:
//Netmeg.bio.indiana.edu/intron/index.html);ExInt(http:
//intron.bic.nus.edu.sg)。
也可通过GENESCAN(http:
//211.161.196.214:
8888)程序预测基因组序列中可能的外显子;利用GeneFinder软件(http:
//www.bioscience.org/urllists/genefind.html)进行基因组序列的内含子和外显子分析。
1.3.3.3基因启动子及其他DNA调控位点分析预测
基因启动子分析预测常用的数据库有真核生物启动子数据库EPD(EukaryoticPromoterDatabase):
http:
//www.epd.isb-sib.ch/。
植物启动子数据库PlantPromDB:
http:
//www.softberry.com/berry.phtml?
topic=plantprom&group=Data&subgroup=plantprom;转录起始位点预测工具NNPP(NeuralNetworkPromoterPrediction):
http:
//www.fruitfly.org/seq_tools/promoter.html,PROSCAN:
http:
//bimas.dcrt.nih.gov/molbio/proscan,PlantPromDB:
http:
//www.phtmltopic=plantprom&group=data&subgroup=plantprom;植物顺式作用元件分析工具PLACE:
http:
//www.dna.affrc.go.jp/htdocs/PLACE/[5]。
1.3.4蛋白质序列分析预测程序及软件
1.3.4.1蛋白质基本性质分析
位于ExPASy的ProtScale程序(http:
//www.expasy.org/cgi.bin/protscale.pl)可被用来计算蛋白质的疏水性图谱。
进行蛋白质的亲/疏水性分析时,也可使用一些Windows下的软件资源,如BioEdit、DNAMAN等。
跨膜区的分析利用网上的相关软件(http:
//www.ch.embnet.org/software/TMPRED.form.html),该程序通过计算氨基酸序列中可能形成的跨膜螺旋位置,并按照疏水性大小赋予每个跨膜螺旋一定的分值,自动绘制出蛋白质的疏水曲线。
当分值在正负之间摆动时,可预测该蛋白质有跨膜结构域。
含有信号肽的蛋白质一般能够被分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
联网到http:
//genome.cbs.dtu.dk/services/SignalP/可进行蛋白质序列信号肽分析。
和信号肽与跨膜区结构一样,蛋白质的亚细胞定位往往也和该蛋白质的功能密切相关。
蛋白质的亚细胞定位分析的网络程序可联网到http:
//www.等,Reinhardt等基于神经网络算法构建的蛋白质亚细胞定位数据库(http:
//predict.sanger.ac.uk/nnpsl/nnpsl_mult.cgi)也可用于对蛋白质序列进行亚细胞定位分析。
1.3.4.2蛋白质功能分析预测
基于序列同源性分析的蛋白质功能预测利用BLASTP和FASTA等软件。
通常,一条新生的蛋白质序列很难仅仅通过序列对齐获得足够的功能信息。
基于蛋白质基序(motif)、结构位点、结构功能域的蛋白质功能预测能够更多的获得蛋白质的功能信息。
目前最好的motif数据库是由AmosBairoch所创建的PROSITE(http:
//www.expasy.org.prosite)。
motif预测软件:
MotifScan(http:
//hits.isb-sib.ch/cgi-bin/PFSCAN)简单模块构架搜索工具(SimpleModularArchitectureResearchTool,SMART)是较为理想的蛋白质结构功能域分析工具。
网址为:
http:
//smart.embl-heidelberg.de/。
1.3.4.3蛋白质结构分析预测
蛋白质结构资源很多,基本立体结构数据库为PDB(http:
//www.rcsb.org/pdb/)。
NRL-3D是所有已知结构蛋白质的数据库,可用于对查询蛋白质序列进行相似性分析以确定其结构。
其网址为:
http:
//www.gdb.org/Dan/proteins/nrl3d.html。
蛋白质序列数据库ISSD(http:
//www.protein.bio.msu.su./issd/);二级结构数据库HSSP(http:
//www.sander.embl-heidelberg.de/hssp/);蛋白质结构分类数据库SCOP(http:
//scop.mrc.lmb.cam.ac.uk.scop);蛋白质分子模型数据库MMDB(http:
//www.ncbi.nlm.nih.gov/Structure/);三维结构数据库NDB、BisMagRes-Bank、CCSD等[8-10]。
2电子克隆技术在植物基因工程中的应用
1994年Boguski等开始用电子克隆寻找人类新基因。
目前发表的有关人类基因克隆的绝大部分都利用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子 克隆技术 及其 植物 基因工程 中的 应用
![提示](https://static.bdocx.com/images/bang_tan.gif)