引物设计原则汇总

发布时间:2011-08-02 19:08:10   来源:文档文库   
字号:

我收集的引物设计原则和方法~~~呵呵

寡核苷酸的优化设计

郑仲承( 中国科学院上海生命科学院生物化学和细胞生物学研究所,上海 200031 )

在核酸分子杂交、DNA序列测定和通过PCR放大DNA片段等实验中,都需要使用寡核苷酸作为探针或引物,而对这些反应的质量起最重要影响作用的,就是这些寡核苷酸探针或引物。用优化的寡核苷酸进行实验能够很快得到好的结果,而用不够合适的寡核苷酸时,常常得出似是而非的结果,不仅大大增加了后续实验的工作量,还可能一无所获。怎样优化设计寡核苷酸呢?至少有下列几个方面的问题需要考虑。

1. 估测可能形成的DNARNA双链的稳定性

寡核苷酸,无论是DNA的或者RNA的,都有形成双链结构的潜在可能性,正如下面反复提到的,这种结构对寡核苷酸的作用有很大影响。所以,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在,大多采用 Breslauer等人提出的,以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25 条件下进行。此时,最接近的相邻核苷酸的自由能是:

此主题相关图片如下:

ΔG(kcal/mol)

例如,双链d(ACGGCCGT)的ΔG是:

ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.33.63.1)=-8.0 kcal/mol

此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2 kcal/mol4个时为4.55个为4.46个是4.378个为4.1 kcalmo1

2. 选择引物的一般规则

设计和选择引物时有5个要素必需注意。

2.1 引物的3′末端不互补 引物的3′末端一定不能有很大的互补性,因为它们的互补会形成引物二聚体,这就会带来很大的问题,例如合成出非专一的产物,极大地减少所期望产物的得量。有实验表明,3′末端双链的ΔG0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%,到-8时少于20%,而-10时,接近于0。虽然产量还取决于其他参数,如退火温度、引物的专一性等等,但是用Taq聚合酶操作时,由于它的工作能力很强,能够在很短的时间内就识别3′末端互补的双链区并发动聚合反应,即使3′末端双链的稳定性很差也不能阻碍它的作用,所以这时产量对二聚体的形成就有很大的依赖性。

2.2 引物分子内不互补 应当尽量不用会通过释放能量而形成分子内双链结构的寡核苷酸。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。

2.3 引物的组分、解链温度和长度 普遍认为PCR引物应当有50%GC/AT比率。其实,这是不对的。以人基因组DNA为模板,用81% AT的引物可以产生单一的,专一的,长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(1618 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用2023 mer引物得到40 kb的产物。但是,引物较长时,如果不借助引物选择的计算机软件帮助,就很难确定一对引物是否会形成二聚体,是否有自身互补性以及专一性如何。于是,用眼睛选出来的寡核苷酸放大长片段DNA时就会使引物彼此引发而不是延伸模板,得出非专一产物。通过下述的观察内部稳定性原理可以极大地减少这种问题。

2.4 引物的内部稳定性 DNA测序和PCR最好用5′末端稳定(GC含量较多),而3′末端不太稳定(AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。还要注意的是PCR反应产物的质量还取决于模板(底物的复杂性、Tm、产物长度)和退火的温度与时间。所以,有时3′末端稳定的引物也可以满意地进行反应。但是,无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。

2.5 引物的唯一性 为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。虽然不会整个引物序列都偏好于和模板中的一个以上位点匹配,但是,通常见到的引物的3′末端往往都有67个没有什么个性的核苷酸。如果假引发的位点正好在放大区的内部,那麻烦就大了。由于短的DNA片段有更高的PCR或杂交效率,就容易产生非专一产物。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(—AAAAAA—)和二核苷酸重复(—ATATAT—)

3. 按照氨基酸序列设计寡核苷酸

按照多肽的氨基酸序列来设计 PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。此时要注意的问题有:

(1)宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1 024个简并引物得到很好的结果。

但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。

(2)引物与模板的错配。一般认为,所用引物与模板有15%20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。

在最后4个碱基中有2个错配的引物,其 PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8 mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到35分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。

(3)在用唯一性引物时,建议用0.2 mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。

(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即13 μmol/L而不是0.2 μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。

(全文完)

除了前引物和后引物的Tm不能相差太大,我们还要重点考虑以下因素:

一、GC% GC含量

对于PCR反应来说GC含量在40%—60%,一般50%左右比较合适;而对于测序引物和杂交探针来说GC含量至少应为50%。产物中GC含量最好大于引物中的GC含量。

二、Degeneracy 多义性

当设计多义引物时应尽量减少引物多义性,这样会带来更好的特异性,应尽量避免3末端的多义性,因为这里即使一个碱基的错配都能阻止引物延伸。

三、3 End Stability 3 末端稳定性

引物稳定性影响它的错配效率,一条理想的引物应该有一个稳定性较强的5 末端和相对稳定性较弱的3 末端。如果引物3 稳定性强,有可能在即使5 末端不配对的情况下造成错配,形成非特异性扩增条带(secondary bands 。而3 末端稳定性低的引物较好的原因是在引物发生错配时,由于3 末端不太稳定引物结合不稳定而难以延伸。

四、GC Clamp GC

引物与目的位点的有效结合需要有稳定的5 末端。这一段有较强稳定性的5 末端称为GC钳。它保证引物与模板的稳定结合。选择有合适稳定性的引物能在确保不产生非特异性条带的前提下尽量降低退火温度。

五、Secondary Structures 二级结构

二级结构是引物设计中必须考虑的一个重要因素。二级结构能显著影响反应中能与模板正确结合的引物数量,发卡结构的存在能限制引物与目的位点的结合能力,从而降低扩增效率,形成发卡环的引物则不能在PCR扩增中发挥作用。

六、Hairpin 发卡结构

发卡结构的形成是由于引物自身的互补碱基分子内配对造成引物折叠形成的二级结构,并由于发卡结构的形成是分子内的反应,仅仅需要三个连续碱基配对就可以形成。发卡结构的稳定性可以用自由能衡量。自由能大小取决于碱基配对释放的能量以及折叠DNA形成发卡环所需要的能量,如果自由能值大于0 则该结构不稳定从而不会干扰反应,如果自由能值小于0 则该结构可以干扰反应。

七、Dimer 二聚体

引物之间的配对区域能形成引物二聚体,它是相同或不同的两条引物之间形成的二级结构。它造成引物二聚体扩增并减少目的扩增产物,二聚体可以在序列相同的两条引物或正反向引物之间形成,如果配对区域在3 末端问题会更为严重,3 末端配对很容易引起引物二聚体扩增。

八、False Priming 错配

如果引物可以结合除目的位点外的其他区域,扩增效率将明显降低目的产物带将减少或出现涂布(smear)。3 末端连续几个碱基配对形成错配的倾向要高于引物上游区域同样数量的碱基配对,在使用引物设计软件时,您可以分别设定确认为错配的3 末端或引物全长形成连续碱基配对的数量。

顺便说一下,如果是新手,刚开始接触引物设计,推荐使用Primer Premier 5.0,因为它界面简单,易学易用;如果你想把引物设计得尽善尽美,公认的首选软件是Oligo,其次我认为是DNAstarOligo功能强大,所以使用起来就没有Primer Premier 5.0那么简便。先用Primer Premier 5.0设计,然后把设计好的引物拿到Oligo里去检测这对引物的优劣,我想这对大多数引物设计者是一个不错的选择!

补充一:具体说一下引物中GC含量问题

引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5端增加AsTs;而如果A-T比例过高,则同样在5端增加GsCs。但也有认为:原来普遍认为PCR引物应当有50%GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT

补充二:关于自由能问题(如何根据自由能判断引物质量)

1、ΔG(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5端和中间ΔG值较高,而3端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0

2、引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3端的连续GGG CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。

补充三:关于产物需要测序的PCR引物的设计问题

DNA测序的PCR中最好用5′末端稳定(GC含量较多),而3′末端不太稳定(AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。

首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primer length)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplex formation and hairpin)、错误引发位点(false priming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,1. 引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74,即Taq 酶的最适温度。

2. 引物3端的序列要比5端重要。引物3端的碱基一般不用A3端碱基序列最好是GCCGGC),因为A在错误引发位点的引发效率相对比较高。另外引物间3端的互补、二聚体或发夹结构也可能导致PCR反应失败。5端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。

3. 引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5端增加AsTs;而如果A-T比例过高,则同样在5端增加GsCs。但也有认为:原来普遍认为PCR引物应当有50%GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250 bp,含有70% AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。

4. 引物所对应模板序列的Tm 值最好在72左右。(Tm 值曲线以选取72 度附近为佳,53的下降形状也有利于引物引发聚合反应),至少要在55-80之间

5. ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5端和中间ΔG值较高,而3端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0

6. 可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出现非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450 以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。

7. Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq 值相对较低的片断。

8. 引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3端的连续GGG CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。

9. 以公式(4×G/C + 2×A/T-5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75范围内

10. 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。

11. DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。

12. 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。

13. 引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如-AAAAAA-)和二核苷酸重复(如-ATATAT-)。

14. 引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。

15. 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。

16. 值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。

17. 在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。

18. 如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低下)

设计引物都是在已知模板序列的情况下进行。

设计的目的是在两个目标间取得平衡:扩增特异性和扩增效率。引物分析软件将试图通过使用每一引物设计变化的预定值在这两个目标间取得平衡。设计引用有一些需要注意的基本原理:

引物长度

一般引物长度为18~30碱基。总的说来,决定引物退火温度(Tm值)最重要的因素就是引物的长度。有以下公式可以用于粗略计算引物的退火温度。

在引物长度小于20bp时:[4(G+C)+2(A+T)]-5

在引物长度大于20bp时:62.3+0.41(%G-C)-500/length-5

另外有许多软件也可以对退火温度进行计算,其计算原理会各有不同,因此有时计算出的数值可能会有少量差距。为了优化PCR反应,使用确保退火温度不低于54的最短的引物可获得最好的效率和特异性。

PCR引物设计之个人心得篇

总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。引物长度的上限并不很重要,主要与反应效率有关。由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。

GC含量

一般引物序列中G+C含量一般为40%~60%,一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5端加适量的ATGC尾巴。

退火温度

退火温度需要比解链温度低5,如果引物碱基数较少,可以适当提高退火温度,这样可以使PCR的特异性增加;如果碱基数较多,那么可以适当减低退火温度,是DNA双链结合。一对引物的退火温度相差4℃~6不会影响PCR的产率,但是理想情况下一对引物的退火温度是一样的,可以在55℃~75间变化。

避免扩增模板的二级结构区域

选择扩增片段时最好避开模板的二级结构区域。用有关计算机软件可以预测估计目的片段的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(△G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2-脱氧GTP取代dGTP对扩增的成功是有帮助的。

与靶DNA的错配

当被扩增的靶DNA序列较大的时候,一个引物就有可能与靶DNA的多个地方结合,造成结果中有多个条带出现。这个时候有必要先使用BLAST软件进行检测

引物末端

引物3’端是延伸开始的地方,因此要防止错配就从这里开始。3’端不应超过3个连续的GC,因这样会使引物在G+C富集序列区错误引发。3′端也不能有形成任何二级结构可能,除在特殊的PCRAS-PCR)反应中,引物3′端不能发生错配。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。

引物的二级结构

引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构,这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。

为了下一步操作而产生的不完全匹配

5’端对扩增特异性影响不大,因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。额外的碱基或多或少会影响扩增的效率,还加大引物二聚体形成的几率,但是为了下一步的操作就要作出适当的牺牲

引物由DNA合成仪合成,其长度通常为15-26 个碱基,其使用浓度一般为1umol/L。这一浓度足以完成30个循环反应。引物浓度太高会出现非特异扩增现象,反之,若引物浓度太低,则PCR效率极低。PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但首先应从DNA找出需要的基因序列,确定保守区;然后遵循某些原则进行引物设计,能最大限度地保证PCR的成功。

1.引物的特异性

引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。

2.避开产物的二级结构区

某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能()小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

3.长度

寡核苷酸引物长度为15~30bp,一般为20~27mer。引物的有效长度:Ln=2G+C+A+T),Ln值不能大于38,因为>38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74),不能保证产物的特异性。如果退火温度设置在近于引物的Tm值几度的范围内,1824个寡核苷酸在标准PCR中能较好的保证特异性。在退火温度54或稍高能保证特异性和有效性的情况下,尽量使引物短;扩增片段异源性较强,如有同工型(ioform)或利用某物种已知基因序列扩增另一物种中基因时,引物可用2835个碱基(至少25个,Tm值大于70)。

4.G+C含量G+C含量一般为40%~60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度一般高于Tm5~10。若按公式Tm=4G+C+2A+T)估计引物的Tm值,则有效引物的Tm55~80,其Tm值最好接近72以使复性条件最佳,在标准PCRTm值不能低于54。实际Tm值受各缓冲液成分,甚至引物和模板的浓度的影响,所以只能作为一近似值。Rychlik提供的基于最近邻的热力学参数,预测Tm值更准确些。最重要的是一对引物的Tm值(受长度和GC含量影响)应该协调一致。

5.碱基随机分布

引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的GC,因这样会使引物在G+C富集序列区错误引发。

6.引物自身

引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp

7.引物之间

两引物之间不应有互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。

8.引物的3′

引物的延伸是从3′端开始的,不能进行任何修饰。3′端也不能有形成任何二级结构可能,除在特殊的PCRAS-PCR)反应中,引物3′端不能发生错配。即使在未知序列的PCR中,引物3'末端最后5-6个核苷酸的错配也应尽可能的少。如扩增编码区域(根据蛋白序列设计的引物),引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。因此,如果能确定一个保守氨基酸,或将其密码子的前2个碱基作为3'末端,若是MW,则为3个碱基。(还要考虑密码子在该类生物中的保守性)

在标准PCR反应体系中,用2U Taq DNA聚合酶和800μmol/L dNTP(四种dNTP200μmol/L)以质粒(103拷贝)为模板,按9525s5525s721min的循环参数扩增HIV-1 gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。AA错配使产量下降至1/20AGCC错七下降至1/100。引物A:模板G与引物G:模板A错配对PCR影响是等同的。在不得已的情况下,以T结尾的引物即使与TGC错配仍可有效延伸。如果3'末端为CCGGCGGC,能提高引发效率。

9.引物的5′

引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。

10.在靶序列中的位置

若在cDNA序列内找寻PCR引物,需特别注意两点:尽力将引物和产物保持在mRNA的编码区域内,因为这是生成蛋白质的独特序列,不像3'末端非编码区域与许多其它mRNA有同源性;尽力把引物放到不同的外显子上,以便使RNA特异的PCR产物与从污染DNA中产生的产物在大小上相区别。如果PCR引物必须在特异序列的限定区域内选择,应挑选缺乏单一核苷酸的区域,这样可以减少广范围引物-引物同源的机会。同样也要注意引物对在长度和GC含量上取得平衡以便使两个引物的Tm值相差在2-3范围内。

12.待扩增片段序列未知时,其序列内可能包含有引物内所设计利用的酶切位点,可采用识别8个碱基序列的内切酶(Asc I, Not I, Pac I, Pme I, Sfi I, SgrA I,Srf I,Sse8387 I, Swa I)予以解决。

13.设计引物内的酶切位点靠近DNA末端时,要在引物的5'端额外加入几个碱基,便如 HpaII MboI,要求在限制性序列位于5'末端前至少有一个碱基(可参考1998/99New Engeand Biolabs Catalog 258页所附的 Cleavage close to the end of DNA fragments(oligonucleotides)增加额外的碱基),否则将影响酶切效率。当然,还有许多特殊目的的引物设计就需要按照所要达到的目的进行不同的设计。总之,要掌握两个目的的平衡:扩增的特异性和扩增的有效性。

实际扩增时,引物质量、引物的浓度、两条引物的浓度是否对称,是PCR失败或扩增条带不理想、容易弥散的常见原因。有些批号的引物合成质量有问题,两条引物一条浓度高,一条浓度低,造成低效率的不对称扩增,对策为:选定一个好的引物合成单位。引物的浓度不仅要看OD值,更要注重引物原液做琼脂糖凝胶电泳,一定要有引物条带出现,而且两引物带的亮度应大体一致,如一条引物有条带,一条引物无条带,此时做PCR有可能失败,应和引物合成单位协商解决。如一条引物亮度高,一条亮度低,在稀释引物时要平衡其浓度。引物应高浓度小量分装保存,防止多次冻融或长期放冰箱冷藏部分,导致引物变质降解失效。

*****************************************************************************

1 如何测定引物的OD值?

用紫外分光光度计在260nm波长测定溶液的光密度来定量。请注意紫外分光光度计的使用,测定时溶液的光密度最好稀释到0.2-0.8之间。DNA干粉用一定体积的水充分振荡溶解以后,取部分溶液稀释到1ml并在1ml标准比色杯中测定其光密度,即为所测体积的OD值,进而可以计算出母液的OD值。

2 如何检测引物的纯度?

实验室方便的作法是用PAGE方法。使用加有7M尿素的16%的聚丙烯酰胺凝胶进行电泳。取0.2-0.5OD的引物,用尿素饱和液溶解或引物溶液中加入尿素干粉直到饱和,上样前加热变性(95,2mins)。加入尿素的目的一是变性,二是增加样品比重,容易加样。600V电压进行电泳,一定时间后(2-3小时),剥胶,用荧光TLC板在紫外灯下检测带型,在主带之下没有杂带,说明纯度是好的。

3 怎样按照使用浓度溶解引物?

记住几个参数:

1ml体积1cm光程标准比色皿中,260nm波长下吸光度为1A260的溶液定义为1 OD260单位,据此定义,1 OD260引物干粉约为33微克;

碱基的平均分子量为324.5

引物的分子量=碱基数 x 碱基的平均分子量;

引物的摩尔数=质量数 / 引物分子量

举例:如果您拿到一管标明为2 OD20碱基的引物,

分子量=20 x 324.5=6490 质量数=2 x 33 =66μg

摩尔数=66 / 6490 =0.010 μmol= 10 nmol

若您需要溶解为10μM(=10pmol/μl)的溶液,只需加1mlddH2O充分溶解即可。

同时请您注意:真空干燥的DNA呈干膜状或粉末状在离心管底部,开启瓶盖时小心不要丢失;请加入足量的水充分振荡溶解。

4 如何保存引物?

可以室温或-20密闭长期保存;溶解以后的DNA最好保存在-20,溶解引物的水的PH值要求大于7,并且无菌。带有荧光标记的引物请注意避光保存。

5 已经溶解的引物,为什么原先使用正常,而过一段时间再使用就不好了?

如果您溶解引物的水PH过低或污染了菌或核酸酶,会使引物降解。使用时没有充分解冻振荡混合,液体不均匀也可能会造成引物加入量不准确。

6 为什么说用EB染色合成DNA片段来定量是不正确的?

通常可以用EB染色的方法来判断双链DNA的量(如质粒DNA),是因为EB可以嵌合到双链DNA中。而合成的单链DNA,由于碱基组成不同,形成二级结构的可能性不同,EB的染色程度也会不同,比如Oligo(dT)等不形成二级结构,EB根本无法染色。所以不要用EB染色的方法来定量,而用紫外分光光度计检测。同样道理,用EB染色来照片不适合所有引物。

7.引物不纯会造成什么后果?

引物不纯可能会导致:1)非特异性扩增;2)无法用预先设计在引物5'端酶切位点的酶切开,特别是没有保护碱基的引物;3)用于测序出现双峰或乱峰。

8 普通合成的DNA片段5'末端是磷酸基团吗?

普通合成的DNA片段5'末端与3'末端都是羟基,可直接用于PCR。如果需要您可以用多核苷酸激酶进行5'端磷酸化,或者要求我们合成时直接在5'3'端进行磷酸化,需要另外收费(参见价目表)

9. 常用标记的荧光染料的波长、可见光中的颜色

简称 全称 吸收波长 发射波长 颜色

6-FAM 6-carboxy-fluorescein 494nm 518nm Green

TET 5-tetrachloro-fluorescein 521nm 538nm Orange

HEX 5-hexachloro-fluorescein 535nm 553nm Pink

TAMRA tetramethyl-6-carboxyrhodamine 560nm 582nm Rose

ROX 6-carboxy-x-rhodamine 587nm 607nm Red

Cy3 Indodicarbocyanine 552nm 570nm Red

Cy5 Indodicarbocyanine 643nm 667nm Violet

from:http://www.lookgene.cc/useful.htm

以下是引物设计的一些原则(仅供参考):

1.引物最好在模板cDNA的保守区内设计。

DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基因的保守区。

2.引物长度一般在15~30碱基之间。

引物长度(primer length)常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74,不适于Taq DNA 聚合酶进行反应。

3.引物GC含量在40%~60%之间,Tm值最好接近72

GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值(melting temperature)是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm5~10。若按公式Tm= 4G+C+2A+T)估计引物的Tm值,则有效引物的Tm55~80,其Tm值最好接近72以使复性条件最佳。

4.引物3′端要避开密码子的第3位。

如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。

5.引物3′端不能选择A,最好选择T

引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,GC错配的引发效率介于AT之间,所以3′端最好选择T

6. 碱基要随机分布。

引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的GC,因这样会使引物在GC富集序列区错误引发。

7. 引物自身及引物之间不应存在互补序列。

引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。

两引物之间也不应具有互补性,尤其应避免3′ 端的互补重叠以防止引物二聚体(DimerCross dimer)的形成。引物之间不能有连续4个碱基的互补。

引物二聚体及发夹结构如果不可避免的话,应尽量使其G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行。

8. 引物5′ 端和中间G值应该相对较高,而3′ G值较低。

G值是指DNA 双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,G值越大,则双链越稳定。应当选用5′ 端和中间G值相对较高,而3′ G值较低(绝对值不超过9)的引物。引物3′ 端的G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。(不同位置的G值可以用Oligo 6软件进行分析)

9.引物的5′端可以修饰,而3′端不可修饰。

引物的5′ 端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′ 端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。

引物的延伸是从3′ 端开始的,不能进行任何修饰。3′ 端也不能有形成任何二级结构可能。

10. 扩增产物的单链不能形成二级结构。

某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能()小于58.6l kJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

11. 引物应具有特异性。

引物设计完成以后,应对其进行BLAST检测。如果与其它基因不具有互补性,就可以进行下一步的实验了。

值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。

Real Time,用于SYBR Green I法时的一对引物与一般PCR的引物,在引物设计上所要求的参数是不同的。引物设计的要求:

1)避免重复碱基,尤其是G.

2)Tm=58-60度。

3GC=30-80%.

4)3'端最后5个碱基内不能有多于2个的GC.

5)正向引物与探针离得越近越好,但不能重叠。

6)PCR扩增产物长度: 引物的产物大小不要太大,一般在80-250bp之间都可;80150 bp最为合适(可以延长至300 bp)。

7)引物的退火温度要高,一般要在60度以上;

要特别注意避免引物二聚体和非特异性扩增的存在。

而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组污染的影响。 DNA

至于设计软件,PRIMER3,PRIMER5,PRIMER EXPRESS都应该可以的。

做染料法最关键的就是寻找到合适的引物和做污染的预防工作。对于引物,你要有从一大堆引物中挑出一两个能用的引物的思想准备---寻找合适的引物非常不容易。

关于BLAST的作用应该是通过比对,发现你所设计的这个引物,在已经发现并在GENEBANK中公开的不物种基因序列当中,除了和你的目标基因之外,还有没有和其他物种或其他序列当中存在相同的序列,如和你的目标序列之外的序列相同的序列,则可能扩出其他序列的产物,那么这个引物的特异性就很差,从而不能用。

本文来源:https://www.2haoxitong.net/k/doc/def47020192e45361066f5d3.html

《引物设计原则汇总.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式