PCR引物设计原则总结.docx
- 文档编号:29025626
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:12
- 大小:22.48KB
PCR引物设计原则总结.docx
《PCR引物设计原则总结.docx》由会员分享,可在线阅读,更多相关《PCR引物设计原则总结.docx(12页珍藏版)》请在冰豆网上搜索。
PCR引物设计原则总结
PCR引物设计原则总结
PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。
因此,引物的优劣直接关系到PCR的特异性与成功与否。
要设计引物首先要找到DNA序列的保守区。
同时应预测将要扩增的片段单链是否形成二级结构。
如这个区域单链能形成二级结构,就要避开它。
如这一段不能形成二级结构,那就可以在这一区域设计引物。
现在可以在这一保守区域里设计一对引物。
一般引物长度为15~30碱基,扩增片段长度为100~600碱基对。
让我们先看看P1引物。
一般引物序列中G+C含量一般为40%~60%。
而且四种碱基的分布最好随机。
不要有聚嘌呤或聚嘧啶存在。
否则P1引物设计的就不合理。
应重新寻找区域设计引物。
同时引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的互补。
引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5′端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。
但3′端绝对不能进行任何修饰,因为引物的延伸是从3′端开始的。
这里还需提醒的是3′端不要终止于密码子的第3位,因为密码子第3位易发生简并,会影响扩增的特异性与效率。
综上所述我们可以归纳十条PCR引物的设计原则:
①引物应用核酸系列保守区内设计并具有特异性。
②产物不能形成二级结构。
③引物长度一般在15~30碱基之间。
④G+C含量在40%~60%之间。
⑤碱基要随机分布。
⑥引物自身不能有连续4个碱基的互补。
⑦引物之间不能有连续4个碱基的互补。
⑧引物5′端可以修饰。
⑨引物3′端不可修饰。
⑩引物3′端要避开密码子的第3位。
PCR引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。
如前述,引物的优劣直接关系到PCR的特异性与成功与否。
对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。
1.引物的特异性
引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。
2.避开产物的二级结构区
某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。
用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。
实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。
若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。
3.长度
寡核苷酸引物长度为15~30bp,一般为20~27mer。
引物的有效长度:
Ln=2(G+C)+(A+T+,Ln值不能大于38,因为>38时,最适延伸温度会超过TaqDNA聚合酶的最适温度(74℃),不能保证产物的特异性。
4.G+C含量
G+C含量一般为40%~60%。
其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值5~10℃。
若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。
5.碱基础随机分布
引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。
尤其3′端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。
6.引物自身
引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。
这种二级结构会因空间位阻而影响引物与模板的复性结合。
若用人工判断,引物自身连续互补碱基不能大于3bp。
7.引物之间
两引物之间不应不互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。
一对引物间不应多于4个连续碱基的同源性或互补性。
8.引物的3′端
引物的延伸是从3′端开始的,不能进行任何修饰。
3′端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。
在标准PCR反应体系中,用2UTaqDNA聚合酶和800μmol/LdNTP(四种dNTP各200μmol/L)以质粒(103拷贝)为模板,按95℃,25s;55℃,25s;72℃,1min的循环参数扩增HIV-1gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。
A∶A错配使产量下降至1/20,A∶G和C∶C错七下降至1/100。
引物A:
模板G与引物G:
模板A错配对PCR影响是等同的。
9.引物的5′端
引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。
因此,可以被修饰而不影响扩增的特异性。
引物5′端修饰包括:
加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。
10.密码子的简并
如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。
特殊目的的引物设计将在有关章节讨论。
随着人们对引物的认识,一些引物的计算机设计程序也应运而生,下面将讨论有关引物计算机设计方法。
PCR引物设计的11条黄金法则
1.引物最好在模板cDNA的保守区内设计。
DNA序列的保守区是通过物种间相似序列的比较确定的。
在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。
2.引物长度一般在15~30碱基之间。
引物长度(primerlength)常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应。
3.引物GC含量在40%~60%之间,Tm值最好接近72℃。
GC含量(composition)过高或过低都不利于引发反应。
上下游引物的GC含量不能相差太大。
另外,上下游引物的Tm值(meltingtemperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。
有效启动温度,一般高于Tm值5~10℃。
若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。
4.引物3′端要避开密码子的第3位。
如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。
5.引物3′端不能选择A,最好选择T。
引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3′端最好选择T。
6.碱基要随机分布。
引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(Falsepriming)。
降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。
尤其3′端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。
7.引物自身及引物之间不应存在互补序列。
引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。
这种二级结构会因空间位阻而影响引物与模板的复性结合。
引物自身不能有连续4个碱基的互补。
两引物之间也不应具有互补性,尤其应避免3′端的互补重叠以防止引物二聚体(Dimer与Crossdimer)的形成。
引物之间不能有连续4个碱基的互补。
引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。
否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
8.引物5′端和中间△G值应该相对较高,而3′端△G值较低。
△G值是指DNA双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。
应当选用5′端和中间△G值相对较高,而3′端△G值较低(绝对值不超过9)的引物。
引物3′端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。
(不同位置的△G值可以用Oligo6软件进行分析)
9.引物的5′端可以修饰,而3′端不可修饰。
引物的5′端决定着PCR产物的长度,它对扩增特异性影响不大。
因此,可以被修饰而不影响扩增的特异性。
引物5′端修饰包括:
加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。
引物的延伸是从3′端开始的,不能进行任何修饰。
3′端也不能有形成任何二级结构可能。
10.扩增产物的单链不能形成二级结构。
某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。
用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有助于选择模板。
实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。
若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。
11.引物应具有特异性。
引物设计完成以后,应对其进行BLAST检测。
如果与其它基因不具有互补性,就可以进行下一步的实验了。
值得一提的是,各种模板的引物设计难度不一。
有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产物序列相对固定,引物设计的选择自由度较低。
在这种情况只能退而求其次,尽量去满足条件。
做RealTime时,用于SYBRGreenI法时的一对引物与一般PCR的引物,在引物设计上所要求的参数是不同的。
引物设计的要求:
1)避免重复碱基,尤其是G.
2)Tm=58-60度。
3)GC=30-80%.
4)3’端最后5个碱基内不能有多于2个的G或C.
5)正向引物与探针离得越近越好,但不能重叠。
6)PCR扩增产物长度:
引物的产物大小不要太大,一般在80-250bp之间都可;80~150bp最为合适(可以延长至300bp)。
7)引物的退火温度要高,一般要在60度以上;
要特别注意避免引物二聚体和非特异性扩增的存在。
而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。
至于设计软件,PRIMER3,PRIMER5,PRIMEREXPRESS都应该可以的。
做染料法最关键的就是寻找到合适的引物和做污染的预防工作。
对于引物,你要有从一大堆引物中挑出一两个能用的引物的思想准备–寻找合适的引物非常不容易。
关于BLAST的作用应该是通过比对,发现你所设计的这个引物,在已经发现并在GENEBANK中公开的不物种基因序列当中,除了和你的目标基因之外,还有没有和其他物种或其他序列当中存在相同的序列,如和你的目标序列之外的序列相同的序列,则可能扩出其他序列的产物,那么这个引物的特异性就很差,从而不能用
另一版本的总结:
1.简介
寡聚核苷酸引物的选择,通常是整个扩增反应成功的关键。
所选的引物序列将决定PCR产物的大小、位置、以及扩增区域的Tm值这个和扩增物产量有关的重要物理参数。
好的引物设计可以避免背景和非特异产物的产生,甚至在RNA-PCR中也能识别cDNA或基因组模板。
引物设计也极大的影响扩增产量:
若使用设计粗糙的引物,产物将很少甚至没有;而使用正确设计的引物得到的产物量可接近于反应指数期的产量理论值。
当然,即使有了好的引物,依然需要进行反应条件的优化,比如调整Mg2+浓度,使用特殊的共溶剂如二甲基亚砜、甲酰胺和甘油。
计算机辅助引物设计比人工设计或随机选取更有效。
一些影响PCR反应中引物作用的因素诸如溶解温度、引物间可能的同源性等,易于在计算机软件中被编码和限定。
计算机的高速度可完成对引物位置、长度以及适应用户特殊条件的其他有关引物的变换可能性的大量计算。
通过对成千种组合的检测,调整各项参数,可提出适合用户特殊实验的引物。
因此通过计算机软件选择的引物的总体“质量”(由用户在程序参数中设定)保证优于通过人工导出的引物。
需要指出的是,引物不必与模板完全同源,因此可包含启动子序列、限制酶识别位点或5’端的各种修饰,这种对引物的修饰不会妨碍PCR反应,而会在以后使用扩增子时发挥作用。
2.基本PCR引物设计参数
引物设计的目的是在两个目标间取得平衡:
扩增特异性和扩增效率。
特异性是指发生错误引发的频率。
特异性不好或劣等的引物会产生额外无关和不想要的PCR扩增子,在EB染色的琼脂糖凝胶上可见到;引物效率是指在每一PCR循环中一对引物扩增的产物与理论上成倍增长量的接近程度。
①引物长度;
特异性一般通过引物长度和退火温度控制。
如果PCR的退火温度设置在近于引物Tm值(引物/模板双链体的解链温度)几度的范围内,18到24个碱基的寡核苷酸链是有很好的序列特异性的。
引物越长,扩增退火时被引发的模板越少。
为优化PCR反应,使用确保溶解温度不低于54℃的最短的引物,可获得最好的效率和特异性。
总的来说,最好在特异性允许的范围内寻求安全性。
每增加一个核苷酸,引物特异性提高4倍;这样,大多数应用的最短引物长度为18个核苷酸。
引物设计时使合成的寡核苷酸链(18~24聚物)适用于多种实验条件仍不失为明智之举。
②引物的二级结构
包括引物自身二聚体、发卡结构、引物间二聚体等。
这些因素会影响引物和模板的结合从而影响引物效率。
对于引物的3’末端形成的二聚体,应控制其ΔG大于-5.0kcal/mol或少于三个连续的碱基互补,因为此种情形的引物二聚体有进一步形成更稳定结构的可能性,引物中间或5’端的要求可适当放宽。
引物自身形成的发卡结构,也以3’端或近3’端对引物-模板结合影响更大;影响发卡结构的稳定性的因素除了碱基互补配对的键能之外,与茎环结构形式亦有很大的关系。
应尽量避免3’末端有发卡结构的引物。
③引物GC含量和Tm值
PCR引物应该保持合理的GC含量。
含有50%的G+C的20个碱基的寡核苷酸链的Tm值大概在56~62℃范围内,这可为有效退火提供足够热度。
一对引物的GC含量和Tm值应该协调。
协调性差的引物对的效率和特异性都较差,因为降低了Tm值导致特异性的丧失。
这种情况下引物Tm值越高,其错误引发的机率也越大。
若采用太高的退火温度,Tm值低的引物对可能完全不发挥作用。
在从一批在特定序列范围内已合成好的寡核苷酸中选择一对新的引物时,这种GC含量和Tm值的协调非常关键。
一般来说,一对引物的Tm值相差尽量不超过2~3摄氏度,同时引物和产物的Tm值也不要相差太大,20摄氏度范围内较好。
④引物的额外序列与退火温度
若有额外的序列信息要加到引物中,例如T7RNA聚合酶结合位点、限制酶切位点或者GC发夹结构可以使用加长的引物。
一般说来,引物5’端添加无关序列不会影响引物特异序列的退火。
有时候,引物中添加了大量与模板不配对的碱基,可以在较低退火温度的条件下进行4到5个扩增循环;然后在假定引物5’端序列已经加入到模板中,计算得出的退火温度下进行其余的循环。
在引物上添加限制酶位点时一个重要的考虑是大多数限制酶的有效切割要求在它们的识别序列的5’端有2至3个非特异的额外碱基,这样就会增加引物的非模板特异序列的长度。
长引物序列的另一个缺点是影响溶解温度的精确计算,而这对于确定PCR反应时的退火温度又是必须的。
对于低于20个碱基的引物,Tm值可以根据Tm=4(G+C)+2(A+T)计算。
而对于较长的引物,Tm值需要考虑动力学参数、从“最近邻位”的计算方式得到,现有的PCR引物设计软件大多数都采用这种方式。
⑤引物的3’末端核苷酸组成
引物3’末端和模板的碱基完全配对对于获得好的结果是非常重要的,而引物3’末端最后5到6个核苷酸的错配应尽可能的少。
如果3’末端的错配过多,通过降低反应的退火温度来补偿这种错配不会有什么效果,反应几乎注定要失败。
引物3’末端的另一个问题是防止一对引物内的同源性。
应特别注意引物不能互补,尤其是在3’末端。
引物间的互补将导致不想要的引物双链体的出现,这样获得的PCR产物其实是引物自身的扩增。
这将会在引物双链体产物和天然模板之间产生竞争PCR状态,从而影响扩增成功。
引物3’末端的稳定性由引物3’末端的碱基组成决定,一般考虑末端5个碱基的ΔG。
此值的大小对扩增有较大的影响,负值大,则3’末端稳定性高,扩增效率更高,同时也更易于异位引发。
需要注意的是,引物3’末端应尽量避免T。
实验证明,以T结尾的引物即使与T,G或C错配仍可有效延伸。
⑥PCR产物的长度及在耙序列内的位置
所有的计算机程序都提供对PCR产物长度范围的选择。
一般说来,PCR产物长度对扩增效率有影响。
特定的应用情况下,PCR产物长度部分取决于模板材料。
预期产物的特定长度经常取决于应用的需要。
若目的是建立测定特异DNA片段的临床检验方法,120~300bp的小DNA扩增产物可能是最好的。
产物应具有好的特异性和高的产生效率,并含有能用于探针捕捉杂交实验的足够信息。
这一长度范围的产物可以通过采用两步扩增循环方法得到,从而减少扩增时间。
其他PCR方法有不同的最佳产物长度。
例如,通过定量的RNA-PCR检测基因表达时,产物应该足够大以便构成竞争性模板,这样,产物和竞争物都能够在凝胶上很容易的分辨出来。
这些产物一般在250~750bp范围内。
⑦补充说明
若在cDNA序列内找寻PCR引物,需特别注意两点:
首先,尽力将引物和产物保持在mRNA的编码区域内,因为这是生成蛋白质的独特序列,不像3’末端非编码区域与许多其他mRNA有同源性;第二,尽力把引物放在不同的外显子上,以便使RNA特异的PCR产物与从污染DNA中产生的产物在大小上相区别。
若PCR的目的是克隆一个基因或cDNA的特异序列,产物的大小是根据具体应用预选的。
在这里,计算机程序可以提供关于期望区域侧翼选择引物对的信息。
在选择用来扩增来自不同物种DNA的引物时,应避开mRNA的5’和3’末端非翻译区序列,因为它们可能没有任何的同源性。
3.简并引物设计
①设计简并引物时,一定要检查靶扩增区域选定氨基酸遗传密码的简并度。
很显然,我们期望选择简并度最低的氨基酸,达到提高特异性的目的。
②充分注意物种对于密码子的偏好性,选择该物种使用频率高的密码子,以降低引物的简并性。
③应努力避免3’末端的简并,对于大多数氨基酸残基来说,意味着引物3’末端不要位于密码子的第三位。
④在一些多义位置使用脱氧次黄嘌呤(dI)代替简并碱基。
4.测序引物设计
当然,测序引物的设计一般都由测序公司来完成,如果需要自己设计的话;那么除了按照上面所提到的引物设计通用标准外,还需要注意两点:
①测序引物的特异性的标准掌握应该更严格一些,也就是说设计时更优先考虑特异性。
因为在测序反应中,如果引物与模板在非预期位置退火并引发链延伸,会对结果对来很大的干扰甚至造成结果无法识读。
②测序引物的Tm值适当高一些。
现在大部分测序反应均选用耐热的测序级DNA聚合酶来催化,并采用PCR的热循环程序。
选用的测序引物的Tm值稍高一些,有助于使反应顺利跨过待测模板的二级结构区,也有助于降低非特异反应。
5.探针的设计
探针的设计,根据不同的用途各有其设计特点,这里只是就通用的原则进行讨论:
①探针的长短一般在20-50核苷酸之间,过长合成成本高,且易出现聚合酶合成错误,杂交时间长。
太短则特异性下降。
②注意G和C的含量努力控制在40-60%,同时一种碱基连续重复不超过4个,以免非特异性杂交产生。
③探针自身序列不能形成二聚体,也不能有“发夹”结构存在,这一点上的要求就要比普通引物设计严格得多。
④如果探针地靶目标是多个基因的混合物,就必须控制该探针与无关基因之间的相似性在70%以下。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PCR 引物 设计 原则 总结