引物设计原则Word格式.docx
- 文档编号:18745131
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:12
- 大小:251.87KB
引物设计原则Word格式.docx
《引物设计原则Word格式.docx》由会员分享,可在线阅读,更多相关《引物设计原则Word格式.docx(12页珍藏版)》请在冰豆网上搜索。
//210.72.11.60网站已引进并调试好这两种软件。
独特之处在于:
对全基因组PCR的引物设计,可以将设计好的引物对后台核酸数据库进行比对,发现并排除引发错配的引物。
因此建议经常做全基因组PCR的用户试用。
二、推荐操作:
●引物搜索:
PrimerPremier5.0
●引物评价:
Oligo6.22
三、引物设计的原则:
首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。
围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primerlength)、产物长度(productlength)、序列Tm值(meltingtemperature)、ΔG值(internalstability)、引物二聚体及发夹结构(duplexformationandhairpin)、错误引发位点(falseprimingsite)、引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。
以使用Oligo软件分析设计引物为例,笔者总结出以下的要点:
1.引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74℃,即Taq酶的最适温度。
2.引物3’端的序列要比5’端重要。
引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。
另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。
5’端序列对PCR影响不大,因此常用来引进修饰位点或标记物。
3.引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。
有一些模板本身的GC含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC含量以及Tm值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。
如果G-C比例超出,则在引物的5’端增加As或Ts;
而如果A-T比例过高,则同样在5’端增加Gs或Cs。
但也有认为:
原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250bp,含有70%AT的产物。
完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。
4.引物所对应模板序列的Tm值最好在72℃左右。
(Tm值曲线以选取72度附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间
5.ΔG值(自由能)反映了引物与模板结合的强弱程度。
一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。
3′末端双链的ΔG是0~-2kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。
6.可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。
但对于特定的模板序列,还应结合比较其在正确位点的引发效率。
如果两者相差很大,比如在正确位点的引发效率为450以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。
7.Frq曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。
选取引物时,宜选用Frq值相对较低的片断。
8.引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG或CCC会导致错误引发。
二聚体形成的能值越高越稳定,越不符合要求。
与二聚体相同,发夹结构的能值越低越好。
虽然有些带有发夹环,其ΔG为-3kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。
当然,如果发夹环在5′末端对反应就没有多大的影响了。
9.以公式(4×
G/C+2×
A/T–5)计算Tm值,即退火温度。
选择较低Tm值的引物的退火温度为反应的退火温度。
4-6℃的差别似乎对PCR产量影响不大。
最好,保证每个引物的Tm值相匹配,且在70-75℃范围内
10.要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。
差异越小,PCR的效率越高。
因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。
可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。
如果期待的产物长度等于或小于500bp,选用短的(16~18mer)的引物:
若产物长5kb,则用24mer的引物。
有人用20~23mer引物得到40kb的产物。
11.在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。
这就是基于引物内部稳定性的经验之谈。
其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。
因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。
与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。
无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9kcal/mol的,通常就是专一性的探针或引物。
寡核苷酸3′末端越不稳定,假引发的可能性越低。
12.如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。
这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。
13.引物的唯一性:
为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。
如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。
由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。
14.引物和产物的Tm值不要相差太大,20摄氏度范围内较好。
定下引物的Tm值范围之后即可定下引物的长度范围。
15.对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。
16.值得一提的是,各种模板的引物设计难度不一。
有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;
有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。
遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。
17.在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。
18.如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低下)
四、Oligo6.22使用技巧
1.Oligo的主要功能集中在Analyze菜单里,只要把它弄懂了,其他的就很简单了
2.Frq为6.22的新功能,为邻近6-7个碱基组成的亚单位在一个指定数据库文件中的出现频率。
该频率高则可增加错误引发的可能性
3.因为分析要涉及多个指标,起动窗口的cascade排列方式不太方便,可从windows菜单改为tili方式
4.当结束检测,按Alt+P键就出来PCR窗口,其中总结性地给出该引物的位置、产物大小、Tm值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。
五、ΔG概念:
用于估测可能形成DNA或RNA双链的稳定性:
在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。
在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。
现在大多采用Breslauer等人提出的以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。
为简化起见,所有的计算都在25℃条件下进行。
此时,最接近的相邻核苷酸的自由能是:
第一个(5′)核苷酸
第二个核苷酸
dA
dC
dG
dT
-1.9
-1.3
-1.6
-1.5
-3.1
-3.6
-1.0
ΔG(kcal/mol)
如:
双链d(ACGG/CCGT)的ΔG是:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0kcal/mol
此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。
也可以用来计算发夹环结构的ΔG。
不过,这时需要根据环区内核苷酸的数量添加一定的数值。
如3个核苷酸时为5.2kcal/mol;
4个时为4.5;
5个为4.4;
6个是4.3;
7和8个为4.1kcal/mo1。
六、按照氨基酸序列设计寡核苷酸:
按照多肽的氨基酸序列来设计PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。
此时要注意的问题有:
(1)宁可用简并引物,也不用猜测的引物。
氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。
有人用1024个简并引物得到很好的结果。
但是,应当避免在一个区域内有很高的简并性。
但也有简并性低使引物不工作的报道。
(2)引物与模板的错配。
一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。
但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。
在最后4个碱基中有2个错配的引物,其PCR产量急剧下降。
但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。
在0.8mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。
即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。
(3)在用唯一性引物时,建议用0.2mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。
(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3μmol/L而不是0.2μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。
七、复杂模板的扩增体系:
所谓复杂模板,是指体系中的DNA种类和数量较多,不能以此引物对所有的模板一一比较来计算其异位引发的可能性的情形。
此情形下与简单模板扩增相比较,还需要遵循下面一些原则以尽可能的避免异位扩增。
1.引物3’末端的稳定性。
引物3’末端的稳定性由引物3’末端的碱基组成决定,一般考虑末端5个碱基的ΔG。
此值的大小对扩增有较大的影响,负值大,则3’末端稳定性高,扩增效率更高,同时也更易于异位引发。
因此在复杂模板的扩增体系中,3’末端5聚体的ΔG应大于-9.0kcal/mol。
2.碱基组成应尽量随机分布,避免单一碱基的聚集。
这样可避免引物在模板的单一碱基富集区引发扩增反应。
3.引物3’末端应尽量避免T,相较而言,3’末端的T对于此处的错配更为宽容。
八、测序引物设计时的注意点:
1.对特异性的标准掌握更严格一些,也比普通PCR引物设计时更优先考虑特异性。
因为如果在测序反应中,如果引物与模板在非预期位置退火并引发链延伸,会对结果对来很大的干扰甚至造成结果无法识读。
2.Tm值适当高一些。
现在大部分测序反应均选用耐热的测序级DNA聚合酶来催化,并采用PCR的热循环程序。
选用Tm值稍高一些,甚至退火温度接近酶的最佳延伸温度的引物,有助于使反应顺利跨过待测模板的二级结构区,也有助于降低非特异反应。
九、关于引物5’端引入限制性内切酶位点:
自从发现Taq酶具有非模板依赖的在新生成DNA链的3’末端加上一个A的特性以来,在引物5’端引入酶切位点从而方便后续克隆步骤的方法的应用大大减少,取而代之的是利用带T载体的粘端连接来包装PCR产物。
若实验需要在引物5’端引入相关酶切位点时,除了需要清楚所选用的酶的识别序列之外,还需要了解此酶是否有位点优势效应,即酶的活性是否因为识别位点在序列的不同位置而不同,并根据此点来选择5’末端的保护碱基。
此外保护碱基的另外一个作用就是保护酶切位点不被Taq酶具有的微弱的5’→3’外切酶活性破坏。
十、简并引物的设计:
●概念:
简并引物的出现是出于遗传密码的简并性。
有时需要根据一段氨基酸的保守序列反推到DNA水平设计引物。
众所周知,大多数氨基酸(二十种常见结构氨基酸中的十八种)的遗传密码不只一种,因此,由氨基酸序列反推DNA序列时,就遇到部分碱基的不确定性。
这种不确定性因物种或细胞亚结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的,甚至植物线粒体与无脊椎动物线粒体以及无脊椎动物线粒体的遗传密码都不尽相同。
Premier可以针对各种不同的遗传密码规律设定不同的DNA和氨基酸的相互转换,这取决于被分析序列的出处。
这样设计出来的引物实际上是多种序列的混和物,在某些位点有所变化,但大部分还是相同的,称之为简并引物。
Primier软件给出八种生物亚结构的不同遗传密码规则供用户选择,有纤毛虫大核(CiliateMacronuclear),无脊椎动物线粒体(InvertebrateMitochondrion),支原体(Mycoplasma),植物线粒体(PlantMitochondrion),原生动物线粒体(ProtozoanMitochondrion),一般标准(Standard),脊椎动物线粒体(VertebrateMitochondrion),和酵母线粒体(YeastMitochondrion)。
简并引物是根据某些特定的目的而选用的一组混合物,指在寡核甘酸的某一位置(一个简并位)上有多个碱基存在于不同的寡核甘酸分子中,如一组简并引物中有N1,N2,N3三个简并位,在N1上有三个碱基简并,N2二个,N3四个,则此简并引物中共有3*2*4=24种寡核甘酸分子。
●简并引物常用的几个方面:
(1)从已知蛋白到相关核酸分子的研究;
(2)用一组引物扩增一类分子。
●在上述两个主要应用中,需要注意的几个主要问题:
◆从蛋白到核酸,应注意:
1)尽量选择简并度低的氨基酸区域为引物设计区。
如蛋氨酸和色氨酸均只有一个密码子。
2)充分注意物种对于密码子的偏好性,选择该物种使用频率高的密码子,以降低引物的简并性。
3)引物不要终止于简并碱基,对于大多数氨基酸残基来说,意味着引物3’末端不要位于密码子的第三位。
4)在简并度高的位置,可用次黄嘌呤(dI)代替简并碱基。
5)以上几点,遵循的总的原则为:
尽量降低引物的简并度,尤其在3’末端或近3’末端。
◆用一对简并引物扩增一类DNA分子时,同样遵循上述总的原则,即尽量降低引物的简并度,尤其在3’末端或近3’末端。
在此种应用中,应先利用工具软件(多序列对准比较软件)或其它工具找到这些分子的保守区,然后根据共有序列,应用上面所述的一些原则来设计所需要的引物。
DegeneratePrimers
Foramplificationofcognatesequencesfromdifferentorganisms,orfor"
evolutionaryPCR"
onemayincreasethechancesofgettingproductbydesigning"
degenerate"
primers:
thesewouldinfactbeasetofprimerswhichhaveanumberofoptionsatseveralpositionsinthesequencesoastoallowannealingtoandamplificationofavarietyofrelatedsequences.Forexample,Compton(1990)describesusing14-merprimersetswith4and5degeneraciesasforwardandreverseprimers,respectively,fortheamplificationofglycoproteinB(gB)fromrelatedherpesviruses.Thereverseprimersequencewasasfollows:
TCGAATTCNCCYAAYTGNCCNT
whereY=T+C,andN=A+G+C+T,andthe8-base5'
-terminalextensioncomprisesaEcoRIsite(underlined)andflankingspacertoensuretherestrictionenzymecancuttheproduct(theNewEnglandBiolabscataloguegivesagoodlistofwhichenzymesrequirehowlongaflankingsequenceinordertocutstubends).Degeneraciesobviouslyreducethespecificityoftheprimer(s),meaningmismatchopportunitiesaregreater,andbackgroundnoiseincreases;
also,increaseddegeneracymeansconcentrationoftheindividualprimersdecreases;
thus,greaterthan512-folddegeneracyshouldbeavoided.However,Ihaveusedprimerswithashighas256-and1024-folddegeneracyforthesuccessfulamplificationandsubsequentdirectsequencingofawiderangeofMastrevirusesagainstabackgroundofmaizegenomicDNA(RybickiandHughes,1990).
Primersequenceswerederivedfrommultiplesequencealignments;
themismatchpositionswereusedas4-basedegeneraciesfortheprimers(shownasstars;
5inFand4inR),asshownabove.
Despitetheirdegeneracy,theprimerscouldbeusedtoamplifya250bpsequencefromvirusesdifferinginsequencebyasmuchas50%overthetargetsequence,and60%overall.
TheycouldalsobeusedtoverysensitivelydetectthepresenceofMaizestreakvirusDNAagainstabackgroundofmaizegenomicDNA,atdilutionsaslowas1/109infectedsap/healthysap(seebelow).
Somegroupsusedeoxyinosine(dI)atdegeneratepositionsratherthanusemixedoligos:
thisbase-pairswithanyotherbase,effectivelygivingafour-folddegeneracyatanypostionintheoligowhereitispresent.Thislessensproblemstodowithdepletionofspecificsingleoligosinahighlydegeneratemixture,butmayresultintoohighadegeneracywherethereare4ormoredIsinanoligo.
十一、克隆PCR引物的设计
GeneralguidelinesontheprimerdesignforPCRcloning
1.Complementarysequenceof18-20basesissufficientinmostcasesifyoudon'
tbothertocalculateTm(seelinksbelowifyouwanttocalculateTm).
2.Ifyourproteinisnotfusedtoanything,youshouldaddastartcodon(ATG)immediatelyinfrontofyourgeneintheforwardprim
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 引物 设计 原则