总结引物设计总结.docx
- 文档编号:27840715
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:23
- 大小:38.43KB
总结引物设计总结.docx
《总结引物设计总结.docx》由会员分享,可在线阅读,更多相关《总结引物设计总结.docx(23页珍藏版)》请在冰豆网上搜索。
总结引物设计总结
寡核苷酸的优化设计
郑仲承
(中国科学院上海生命科学院生物化学和细胞生物学研究所,上海200031)
在核酸分子杂交、DNA序列测定和通过PCR放大DNA片段等实验中,都需要使用寡核苷酸作为探针或引物,而对这些反应的质量起最重要影响作用的,就是这些寡核苷酸探针或引物。
用优化的寡核苷酸进行实验能够很快得到好的结果,而用不够合适的寡核苷酸时,常常得出似是而非的结果,不仅大大增加了后续实验的工作量,还可能一无所获。
怎样优化设计寡核苷酸呢?
至少有下列几个方面的问题需要考虑。
1.估测可能形成的DNA或RNA双链的稳定性
寡核苷酸,无论是DNA的或者RNA的,都有形成双链结构的潜在可能性,正如下面反复提到的,这种结构对寡核苷酸的作用有很大影响。
所以,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。
在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。
在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。
现在,大多采用Breslauer等人提出的,以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。
为简化起见,所有的计算都在25℃条件下进行。
此时,最接近的相邻核苷酸的自由能是:
此主题相关图片如下:
ΔG(kcal/mol)
例如,双链d(ACGG/CCGT)的ΔG是:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0kcal/mol
此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。
也可以用来计算发夹环结构的ΔG。
不过,这时需要根据环区内核苷酸的数量添加一定的数值。
如3个核苷酸时为5.2kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1kcal/mo1。
2.选择引物的一般规则
设计和选择引物时有5个要素必需注意。
2.1引物的3′末端不互补引物的3′末端一定不能有很大的互补性,因为它们的互补会形成引物二聚体,这就会带来很大的问题,例如合成出非专一的产物,极大地减少所期望产物的得量。
有实验表明,3′末端双链的ΔG是0~-2kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%,到-8时少于20%,而-10时,接近于0。
虽然产量还取决于其他参数,如退火温度、引物的专一性等等,但是用Taq聚合酶操作时,由于它的工作能力很强,能够在很短的时间内就识别3′末端互补的双链区并发动聚合反应,即使3′末端双链的稳定性很差也不能阻碍它的作用,所以这时产量对二聚体的形成就有很大的依赖性。
2.2引物分子内不互补应当尽量不用会通过释放能量而形成分子内双链结构的寡核苷酸。
虽然有些带有发夹环,其ΔG为-3kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。
当然,如果发夹环在5′末端对反应就没有多大的影响了。
2.3引物的组分、解链温度和长度普遍认为PCR引物应当有50%的GC/AT比率。
其实,这是不对的。
以人基因组DNA为模板,用81%AT的引物可以产生单一的,专一的,长250bp,含有70%AT的产物。
完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。
要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。
差异越小,PCR的效率越高。
因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。
可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。
如果期待的产物长度等于或小于500bp,选用短的(16~18mer)的引物:
若产物长5kb,则用24mer的引物。
有人用20~23mer引物得到40kb的产物。
但是,引物较长时,如果不借助引物选择的计算机软件帮助,就很难确定一对引物是否会形成二聚体,是否有自身互补性以及专一性如何。
于是,用眼睛选出来的寡核苷酸放大长片段DNA时就会使引物彼此引发而不是延伸模板,得出非专一产物。
通过下述的观察内部稳定性原理可以极大地减少这种问题。
2.4引物的内部稳定性在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。
这就是基于引物内部稳定性的经验之谈。
其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。
因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。
与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。
如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。
这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。
还要注意的是PCR反应产物的质量还取决于模板(底物的复杂性、Tm、产物长度)和退火的温度与时间。
所以,有时3′末端稳定的引物也可以满意地进行反应。
但是,无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9kcal/mol的,通常就是专一性的探针或引物。
寡核苷酸3′末端越不稳定,假引发的可能性越低。
2.5引物的唯一性为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。
虽然不会整个引物序列都偏好于和模板中的一个以上位点匹配,但是,通常见到的引物的3′末端往往都有6~7个没有什么个性的核苷酸。
如果假引发的位点正好在放大区的内部,那麻烦就大了。
由于短的DNA片段有更高的PCR或杂交效率,就容易产生非专一产物。
如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。
由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
3.按照氨基酸序列设计寡核苷酸
按照多肽的氨基酸序列来设计PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。
此时要注意的问题有:
(1)宁可用简并引物,也不用猜测的引物。
氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。
有人用1024个简并引物得到很好的结果。
但是,应当避免在一个区域内有很高的简并性。
但也有简并性低使引物不工作的报道。
(2)引物与模板的错配。
一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。
但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。
在最后4个碱基中有2个错配的引物,其PCR产量急剧下降。
但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。
在0.8mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。
即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。
(3)在用唯一性引物时,建议用0.2mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。
(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3μmol/L而不是0.2μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。
***************************************************************************
推荐使用PrimerPremier5.0
作者:
LiFeng
下载的安装文件有4M,安装后运行该软件,屏幕上方是最基础的工具条,如File,Edit,View,Search等等,FILE下拉菜单中包括NewSequence(ProteinorDNA),OpenSequence(ProteinorDNA),save,saveas,DegenerateBases,Print,Exit。
EDIT下拉菜单中除包括常用的Copy,Cut,Paste之外,还有一项Preference可以设定默认引物长度等参数。
其余View,Search,Function,Translate等其他的功能,基本上可以在中央的操作框中实现。
下面简要介绍一下操作框。
下半部分显示的是一段DNA序列,可以改变其中的碱基,但DEMO版中不可以,序列上方有一排工具钮,如下
5'SequenceNo:
5'到3'显示DNA序列。
实际上该功能确定序列中第一个碱基的号码,可将所处理的碱基在整体中的位置加以确定。
Header:
好像是表示这段基因的来源说明。
当基因序列来自于各大数据库格式的文件时,显示序列前的其他说明文字。
3,10;碱基对以3或10为一单元显示序列。
Find,Findnext:
寻找一段特定碱基序列.(Search下拉菜单中还有一项Gotoposition可查找指定位置。
)
S,A,dsDNA:
显示源序列互补序列或双链DNA序列。
还有两个与声音有关按钮,无太大用。
在刚输入序列、测序后等对比文件序列与文字序列是否一致时非常重要,可以让一个人轻松对序列。
在操作框上方正中有两个按钮;DNA,PROTEIN,由于我用的是试用版这项功能不能使用,但很明显这项功能可将已知DNA序列翻译为蛋白质氨基酸序列,或者是反过来。
当序列是核酸时,PROTEIN可以操作,将序列翻译成蛋白;而序列是蛋白时,可以进行DNA操作,将蛋白生成对应的DNA序列。
这两个键在将表达系统从一种转移到另一种的设计时很有用。
在上方的Translate下拉菜单中可以对读码框和密码子进行设定和编辑,可以设定标准密码子,也可以设定酵母,植物,脊椎,无脊椎密码子,还可以添加新的密码表。
左上角纵向排列有三个Function按钮:
Ⅰ,Primer;Ⅱ,Enzyme;Ⅲ,Motif。
Ⅰ,Primer;在PCR和核酸杂交中设计引物。
点击后出现一新框。
中间偏上是DNA序列与引物,可以用鼠标直接选择引物的位置。
序列下方显示了各项参数,还包括发夹结构,二聚体异二聚体在链中出现次数,如没有的话出现NONE钮,如果存在该结构则为FOUND钮,点击该钮可以察看该结构出现的具体位置,包括这样引物的特性一目了然。
最上方是三个功能按钮①Search②results③Editprimers
①Search:
搜寻引物,可选择PCR引物,序列引物,杂交探针,可以自己定义在正负链中搜索,搜寻范围,引物长度,PCR产物长度,可选择自动搜索手动搜索,还可设定搜索参数,如Tm,GC,Degeneracy,3'端稳定性,Dimer,Hairpin,等引物参数。
设定完毕点击OK即可得到结果列表,包括所有可能的引物数目,以及各项参数达不到要求筛去的引物,最下方显示的是最佳方案的个数,可以在Result项中详细察看搜索得到的结果。
②Result:
显示引物搜寻结果列表,可以选定正负链或PAIRS,表中显示了每个引物的位置长度,还可以点击每个引物方案察看其在链中位置及其各项参数,你还可以选择所需要的并标记。
③Editprimers:
可以点击链两侧的左右箭头来选定引物位置,可以任意编辑引物,添加或删除任一个碱基,修改任一个碱基,当你编辑完毕,点Analyze钮就可以察看你编辑的引物的各项参数。
Ⅱ,Enzyme:
做序列的酶切位点,可以应用于基因操作中酶切部位和所用酶的选择。
最上方有两个选择:
序列分析的范围;酶切位点个数选择(可低于1-6个)。
点击后左右两边有一栏酶,左边为所有酶,右边为选定的酶。
中间四个钮分别为:
ADD:
从所有酶列表中选定所用酶加入右侧列表,
DELETE:
从选中酶列表中删除某个酶,
EDIT:
编辑酶列表,可以加入新的酶或删除已有酶,
FILTER:
如果你不知道该选用那几种酶,可用此功能筛选所需酶,可用酶切位点BP数(4BP-13BP)和切割后的接头Overhang(3',5',BLUNT,还可以具体规定切出的接头为那几个碱基)来筛选。
所用酶选好后点OK即可得到酶切结果,有四种格式:
Table:
酶切位点,位置。
SEQ;整段序列及酶切位置。
MAP:
与上一项近似。
用示意图的方式显示结果。
NONCutter:
切不动的酶
Ⅲ,Motif:
查找特定序列,如-10区,-35区,AGGABOX,CAATBOX,与基因表达调控有关。
最上方有两个选择:
序列分析的范围;Motif位点个数选择(可低于1-6个)。
左边一栏是所有特定序列,右边是选定的,中间按钮与Ⅱ近似,只是没有FILTER功能。
选定你要查找的东西,点一下OK就可以看结果了,与Ⅱ的结果输出一样有四种格式:
Table:
Motif的位置,数量。
SEQ:
整段序列及Motif的位置。
MAP:
与上一项近似。
用示意图的方式显示结果。
Motifabsent:
序列中不存在的Motif。
*******************************************************************************
我个人感觉,先用RNAstructure模拟一下mRNA结构,选择非发夹结构区,再用PrimerPremier5.0设计引物,设计出来后再用oligo验证一下,这样最保险!
不过万一不行的,RNAstructure只能是个参考,不要全信,否则很难设计引物而且PrimerPremier5.0有时对antisense的能否有配对等识别不清,oligo可靠!
引物由DNA合成仪合成,其长度通常为15-26个碱基,其使用浓度一般为1umol/L。
这一浓度足以完成30个循环反应。
引物浓度太高会出现非特异扩增现象,反之,若引物浓度太低,则PCR效率极低。
PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。
因此,引物的优劣直接关系到PCR的特异性与成功与否。
对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但首先应从DNA找出需要的基因序列,确定保守区;然后遵循某些原则进行引物设计,能最大限度地保证PCR的成功。
1.引物的特异性
引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。
2.避开产物的二级结构区
某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。
用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。
实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。
若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。
3.长度
寡核苷酸引物长度为15~30bp,一般为20~27mer。
引物的有效长度:
Ln=2(G+C)+(A+T),Ln值不能大于38,因为>38时,最适延伸温度会超过TaqDNA聚合酶的最适温度(74℃),不能保证产物的特异性。
如果退火温度设置在近于引物的Tm值几度的范围内,18~24个寡核苷酸在标准PCR中能较好的保证特异性。
在退火温度54℃或稍高能保证特异性和有效性的情况下,尽量使引物短;扩增片段异源性较强,如有同工型(ioform)或利用某物种已知基因序列扩增另一物种中基因时,引物可用28~35个碱基(至少25个,Tm值大于70℃)。
4.G+C含量G+C含量一般为40%~60%。
其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。
有效启动温度一般高于Tm值5~10℃。
若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳,在标准PCR中Tm值不能低于54℃。
实际Tm值受各缓冲液成分,甚至引物和模板的浓度的影响,所以只能作为一近似值。
Rychlik提供的基于最近邻的热力学参数,预测Tm值更准确些。
最重要的是一对引物的Tm值(受长度和GC含量影响)应该协调一致。
5.碱基随机分布
引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。
尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。
6.引物自身
引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。
这种二级结构会因空间位阻而影响引物与模板的复性结合。
若用人工判断,引物自身连续互补碱基不能大于3bp。
7.引物之间
两引物之间不应有互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。
一对引物间不应多于4个连续碱基的同源性或互补性。
8.引物的3′端
引物的延伸是从3′端开始的,不能进行任何修饰。
3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。
即使在未知序列的PCR中,引物3'末端最后5-6个核苷酸的错配也应尽可能的少。
如扩增编码区域(根据蛋白序列设计的引物),引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。
因此,如果能确定一个保守氨基酸,或将其密码子的前2个碱基作为3'末端,若是M和W,则为3个碱基。
(还要考虑密码子在该类生物中的保守性)
在标准PCR反应体系中,用2UTaqDNA聚合酶和800μmol/LdNTP(四种dNTP各200μmol/L)以质粒(103拷贝)为模板,按95℃,25s;55℃,25s;72℃,1min的循环参数扩增HIV-1gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。
A∶A错配使产量下降至1/20,A∶G和C∶C错七下降至1/100。
引物A:
模板G与引物G:
模板A错配对PCR影响是等同的。
在不得已的情况下,以T结尾的引物即使与T、G或C错配仍可有效延伸。
如果3'末端为CC、GG、CG、GC,能提高引发效率。
9.引物的5′端
引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。
因此,可以被修饰而不影响扩增的特异性。
引物5′端修饰包括:
加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。
10.在靶序列中的位置
若在cDNA序列内找寻PCR引物,需特别注意两点:
⑴尽力将引物和产物保持在mRNA的编码区域内,因为这是生成蛋白质的独特序列,不像3'末端非编码区域与许多其它mRNA有同源性;⑵尽力把引物放到不同的外显子上,以便使RNA特异的PCR产物与从污染DNA中产生的产物在大小上相区别。
如果PCR引物必须在特异序列的限定区域内选择,应挑选缺乏单一核苷酸的区域,这样可以减少广范围引物-引物同源的机会。
同样也要注意引物对在长度和GC含量上取得平衡以便使两个引物的Tm值相差在2-3℃范围内。
12.待扩增片段序列未知时,其序列内可能包含有引物内所设计利用的酶切位点,可采用识别8个碱基序列的内切酶(AscI,NotI,PacI,PmeI,SfiI,SgrAI,SrfI,Sse8387I,SwaI)予以解决。
13.设计引物内的酶切位点靠近DNA末端时,要在引物的5'端额外加入几个碱基,便如HpaII和MboI,要求在限制性序列位于5'末端前至少有一个碱基(可参考1998/99NewEngeandBiolabsCatalog第258页所附的CleavageclosetotheendofDNAfragments(oligonucleotides)增加额外的碱基),否则将影响酶切效率。
当然,还有许多特殊目的的引物设计就需要按照所要达到的目的进行不同的设计。
总之,要掌握两个目的的平衡:
扩增的特异性和扩增的有效性。
实际扩增时,引物质量、引物的浓度、两条引物的浓度是否对称,是PCR失败或扩增条带不理想、容易弥散的常见原因。
有些批号的引物合成质量有问题,两条引物一条浓度高,一条浓度低,造成低效率的不对称扩增,对策为:
①选定一个好的引物合成单位。
②引物的浓度不仅要看OD值,更要注重引物原液做琼脂糖凝胶电泳,一定要有引物条带出现,而且两引物带的亮度应大体一致,如一条引物有条带,一条引物无条带,此时做PCR有可能失败,应和引物合成单位协商解决。
如一条引物亮度高,一条亮度低,在稀释引物时要平衡其浓度。
③引物应高浓度小量分装保存,防止多次冻融或长期放冰箱冷藏部分,导致引物变质降解失效。
*****************************************************************************
1如何测定引物的OD值?
用紫外分光光度计在260nm波长测定溶液的光密度来定量。
请注意紫外分光光度计的使用,测定时溶液的光密度最好稀释到0.2-0.8之间。
DNA干粉用一定体积的水充分振荡溶解以后,取部分溶液稀释到1ml并在1ml标准比色杯中测定其光密度,即为所测体积的OD值,进而可以计算出母液的OD值。
2.如何检测引物的纯度?
实验室方便的作法是用PAGE方法。
使用加有7M尿素的16%的聚丙烯酰胺凝胶进行电泳。
取0.2-0.5OD的引物,用尿素饱和液溶解或引物溶液中加入尿素干粉直到饱和,上样前加热变性(95℃,2mins)。
加入尿素的目的一是变性,二是增加样品比重,容易加样。
600V电压进行电泳,一定时间后(约2-3小时),剥胶,用荧光TLC板在紫外灯下检测带型,在主带之下没有杂带,说明纯度是好的。
3.怎样按照使用浓度溶解引物?
记住几个参数:
在1ml体积1cm光程标准比色皿中,260nm波长下吸光度为1A260的溶液定义为1OD260单位,据此定义,1OD260引物干粉约为33微克;
碱基的平均分子量为324.5;
引物的分子量=碱基数x碱基的平均分子量;
引物的摩尔数=质量数/引物分子量
举例:
如果您拿到一管标明为2OD的20碱基的引物,
分子量=20x324.5=6490质量数=2x33=66μg
摩尔数=66/6490=0.010μmol=10nmol
若您需要溶解为10μM(=10pmol/μl)的溶液,只需加1mlddH2O充分溶解即可。
同时请您注意:
真空干燥的DNA呈干膜状或粉末状在离心管底部,开启瓶盖时小心不要丢失;请加入足量的水充分振荡溶解。
4.如何保存引物?
可以室温或-20℃密闭长期保存;溶解以后的DNA最好保存在-20℃,溶解引物的水的PH值要求大于7,并且无菌。
带有荧光标记的引物请注意避光保存。
5.已经溶解的引物,为什么原先使用正常,而过一段时间再使用就不好了?
如果您溶解引物的水PH过低或污染了菌或核酸酶,会使引物降解。
使用时没有充分解冻振荡混合,液体不均匀也可能会造成引物加入量不准确。
6.为什么说用EB染色合成DNA片段来定量是不正确的?
通常可以用EB染色的方法来判断双链DNA的量(如质粒DNA),是因为EB可以嵌合到双链DNA中。
而合成的单链DNA,由于碱基组成不同,形成二级结构的可能性不同,EB的染色程度也会不同,比如Oligo(dT)等不形成二级结构,EB根本无法染色。
所以不要用EB染色的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总结 引物 设计
![提示](https://static.bdocx.com/images/bang_tan.gif)