一、模板序列确定 模板的选择。如果以DNA为模板设计引物,如果该基因组已经完成测序,则可以直接通过BLAST找到相关基因位置,设计引物。如果没有被测序,则首先在Genebank中找到与待分离新基因同源的其它物种的该基因。首先在NCBI找本属的相同基因,属名为拉丁文,注意查找。在genebank中以搜索FAD8为例,然后看检索结果左边页面(如图)找到所要查找的属名后点击结果就只显示该属的某物种的该基因的序列包括DNA,mRNA根据需要下载相应的序列利用http://www.ncbi.nlm./blast/的Blast工具和http://www./elustalw/的Clustalw工具把已检索到的基因进行同源性比较, 注意: 1.找到同源基因的蛋白氨基酸序列,比对,找到高度同源区域,再回到cDNA序列设计引物,核苷酸序列同源性高,就用核苷酸,否则用氨基酸,设计简并引物。一般在mRNA序列的中间偏下游即靠3'端的部分序列设计引物(习惯问题)。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。 2.简并引物的设计 最好还是使用CDS序列来做比对,然后根据保守区设计简并引物,CDS两端的非翻译区在物种间变化太大,不适合设计引物。把获得各个物种的CDS做成fasta格式的,序列最好处理成纯序列格式的不含其它任何字符。然后用比对软件比对一下,如mega,DNAman或者是vectorNTI里的比对工具都可以做比对。在比对结果里找到非常保守的区域就可以设计简并引物了。设计的简并引物可以根据经验公式自个算Tm值。不用计较打分的问题。因为你只能在保守区设计引物。引物的3'端最好位于最保守的区域。一般是寻找该基因的ORF框即编码区域作为该引物的保守序列。你可以用软件查找ORF框,找一个比较长的位置在序列中下游的区域设计引物。 二、引物设计的原则 首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primerlength)、产物长度(product length)、序列Tm值(melting temperature)、ΔG值(internal stability)、引物二聚体及发夹结构(duplexformation and hairpin)、错误引发位点(false priming site)、引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo 软件分析设计引物为例,笔者总结出以下的要点: 1.引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74℃,即Taq 酶的最适温度。 2.引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。 3.引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大,大概在2℃以下较好),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs 4.引物所对应模板序列的Tm 值最好在72℃左右。(Tm 值曲线以选取72 度附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间 5.ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2 kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。 6.可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450 以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。 7.Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq 值相对较低的片断。 8.引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG 或CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。 9.以公式(4×G/C + 2×A/T–5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内 10.要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500bp,选用短的(16~18 mer)的引物:若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。 11.在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。 12.如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。 13.引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板DNA中没有重复序列。如果该物种有基因组,则检查的方法非常简单就是用引物序列去做blast,看看能比对到几个位点,如果是唯一比对,则特异性会非常好。(做blast一般去NCBI Genome数据库http://www.ncbi.nlm./genome/browse/,找到自己的物种,然后做blast即可)。应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。 14.引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。 15.对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。 值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低下) |
|
来自: sailing_387 > 《待分类》