分享

生工技术 | [万字长文] Primer-BLAST设计qPCR引物

 njmuxch 2023-08-04 发布于江苏

大家好,欢迎收看生工生物技术文章,在今天的文章中,我将详细介绍NCBI Primer-BLAST工具,了解各项参数的设置意义,然后通过几个大家经常遇到的案例,带大家设计几套引物,所以本次讲座比较适合有qPCR实验需求的朋友或初进实验室的研究生新生。希望大家可以从今天的讲座中,学习到Primer-BLAST的初级及高级使用方法,做到引物设计不求人。


背景


尽管Primer-BLAST可以胜任多种不同引物的设计,但它最擅长的领域以及本文章的重点还是围绕在荧光定量PCR的引物设计方面,原因是荧光定量PCR在当今生命科学、医疗领域中的巨大作用。

图片

比如,在分子生物学研究过程中,qPCR可以说是多数研究者的必经之路,其应用领域非常广泛,核酸定量分析方面,qPCR可以检测一个样本中某个核酸的数量。基因表达差异分析方面,qPCR是检测目的基因在干预前后的表达量变化倍数的最常用方法。基因突变检测方面,经常使用探针检测某个单核苷酸的基因型等等。

在医学领域,qPCR更是广泛用于大健康检测,病原体检测,基因分型等方面,比如新冠肺炎疫情中,最先出现的诊断方法全都是基于探针的荧光定量PCR方法,用药指导方面,比如通过检测人EGFR基因的790位氨基酸的基因型,来为非小细胞肺癌患者的用药进行指导等。
qPCR实验起始于目的基因的引物设计,引物设计的好坏将直接决定qPCR结果的精确度和可信度。

图片

qPCR引物影响扩增效果主要体现在两个方面,第一方面是PCR的扩增效率,引物的Tm值过高,序列不正确,3端结合效率低等因素,都会使引物在退火、延伸阶段不能够较好地结合到模板上继而实现延伸,体现在宏观方面,就是PCR的扩增效率降低。

对于qPCR来讲,引物的特异性也是不可忽视的一个影响因素,尤其对于SYBR Green I染料法荧光定量PCR,因为这种核酸嵌合染料并不能识别并特异性的结合正确的扩增产物,只要是双链,包括正常的扩增产物,非特异性的扩增产物,引物多聚体等等都会结合上核酸嵌合染料,而一旦结合就会产生荧光信号,所以在引物特异性不好的情况下,你看到的扩增曲线或Ct值并不代表实际模板的含量,严重情况下甚至会得到相反的结果。引物的诸多性质都会影响扩增的特异性,比如引物的序列、引物的Tm值,3端GC占比等等。对于检测真核基因表达量的研究者来说,引物相对于外显子的分布位置也是一个不得不考虑的问题。
可以看到,仅仅在扩增效率和特异性方面,引物对PCR的制约因素就如此之多,仅靠人工去手动设计出质量比较好的引物,那是非常困难的,是一个看脸的过程,因此,我们才迫切需要一个比较好的引物设计软件,帮我们针对上面这些因素进行把关。

图片

仅针对荧光定量PCR来讲,我们可以使用的引物设计软件就多到一只手数不过来,,比如Primer-BLAST,Primer3,5、6,Primer Express,Beacon Designer,Array Designer,MRPrimerW,Genome Compiler等等。

虽然各个软件都把自己吹上了天,比如设计多方便、结果多准确等。但为什么我要从这些众多的引物设计工具中选出Primer-BLAST来为大家进行讲解呢?有以下几个原因:

图片

  • 首先是这个工具非常的方便快捷,直接打开一个网页就能设计,不需要安装软件。在某些情况下,比如我们知道了基因的accession编号,甚至都不需要查找序列就能完成引物的设计。

  • 第二点,Primer-BLAST是引物设计界的高富帅,设置选项极其丰富,你能看得懂的还有看不懂的选项应有尽有。

  • 第三点,使用Primer-BLAST可以设计出特异性非常好的引物,从而避免非特异性扩增的产生,至少理论上是如此

  • 最后,是其结果输出的形式非常直观,我们能够轻松的在结果中读取到关键信息,比如引物的序列、长度、tm值,它们的结合位置,产物长度,以及结合的模板等等。

正是因为这些特点,所以我才将Primer-BLAST称之为“引物设计的艺术家”。

Primer-BLAST设计引物的流程主要分为四部分:

  • 首先我们给它输入参数,让程序知道自己要做什么,比如模板是什么,要多长的产物等,

  • 然后程序会按照自己的算法设计出大量的候选引物,

  • 接下来对这些候选者进行筛选,比如特异性是否足够好,是否存在多聚体的可能性等,将大量的候选者淘汰掉。

  • 最后,以固定的格式将优秀的结果输出,我们根据输出的结果进行进一步的筛选。

图片

从这个步骤可以看出,引物设计者仅参与到初始的输入环节和最终输出结果的决策环节,设计和筛选步骤完全由Primer-BLAST程序完成,从而节省了设计者的大量精力和时间。但是合理的参数设置,对于得到高成功率的结果也是至关重要的。

对于荧光定量PCR的引物,我们有这样一些重要的参数:

图片

  • 首先是引物的序列,要求GC含量适中,30%~70%比较好,ACTG碱基分布平均,3端不能出现连续的相同碱基,连续的AT或者连续的GC都不好。

  • 第二是引物的Tm值,qPCR引物的Tm值在60°C是比较合适的,稍高或稍低是允许的,但不能过高或过低,正反向引物的Tm值也不能差异太大。

  • 第三是引物的长度,通常引物的长度在17~25nt是比较合适的。太长或太短一方面可能影响tm值,另一方面可能带来特异性的问题。

  • 第四是引物的位置,引物最好分布于容易被检测到的位置,比如检测RNA时,引物所处位置要避开高级结构,并容易被逆转录,引物不能处在重复片段比如str位点以及其他的一些易突变的位置。

  • 第五是产物的长度,对于荧光定量PCR来讲,50~300bp的产物长度都是可以满足需求的,但通常情况下。80~150bp的产物长度是比较理想的。产物的Tm值在80~90°C左右,不能过低或者过高。

此外还有很多需要注意的点,比如引物要跨外显子设计以消除基因组DNA污染的影响,基因多个不同转录变体的处理等等。


认识Primer-BLAST

知道了这些关键参数,我们就可以使用软件进行qPCR引物的设计了,不过到目前为止,Primer-BLAST仍然是犹抱琵琶半遮面,没有显露出真实面貌。那么接下来的第二部分,我们就揭开她的面纱,一睹他的真容。

首先,我们要找到Primer-BLAST的入口,打开NCBI的主页,在featured一栏中,就能轻松找到Primer-BLAST的链接。可以看到,Primer-BLAST是作为NCBI的一项特色功能存在的,此外,Primer-BLAST还有另外一种进入的方式,这个我们放在实战的环节中去讲解。

图片

点击进去,我们可以看到这样一个页面,里面有大大小小的输入框以及各种各样的数值,可能对于新手来说界面不是那么友好,但是没关系,Primer-BLAST将这些参数进行了分类,总的来说分为了五类:

图片

第一类是PCR template,即设置PCR模板的参数。Primer parameters是指对引物的参数设置,如果设计的是针对真核生物的,那么可以在Exon/intron selection的部分对引物与外显子内含子的位置关系进行设置,第四类是Primer Pair Specificity Checking Parameters,这是Primer-BLAST最引以为傲的功能,在这里我们可以设置引物特异性的一些要求。此外,下面还有一些高级设置选项,提供给高级玩家来进行设置。


首先:PCR模板的设置

图片

在最大的输入框中,允许我们输入基因的fasta序列,gi号或者基因的accession号,下面是一个例子,我们可以将基因的atcg序列直接粘贴进去,或者如果我们知道要研究的基因的accession号,比如对于人的β-actin的mRNA的编号为NM_001101,那我们也可以将这个编号直接输入进去,而不必纠结于其序列。

图片

序列输入框的右侧是range设置栏,如果有需要,我们可以在这里设置正反向引物在模板上的结合位置范围。比如某些情况下,我要规定我的正向引物只能结合在100~900这段区域而反向引物只能结合在950~1600这个范围,此时将对应的起始数字填写进range框中即可。

第二部分:引物基本参数的设置

图片

  • 两个长的输入框,是用于我们输入已有序列来检测已知引物的对应产物及特异性的,在设计的时候,我们没有引物序列,因此这两个空着就可以的。

  • PCR product size这里可以设置PCR产物的大小,对于荧光定量PCR,我们可以设置为80~150。这是常见的qPCR产物大小范围,更宽泛地,50~300都是可以的。

  • Number of primers to return是指最终引物设计好了之后,挑取多少对引物展示给您,一般10对候选引物就足够了,当然,如果您要对最终的结果进行精挑细选,也可以适当增加这个数值。

  • 最后我们可以设置引物的Tm值,分别定义引物允许的最大、最小或最佳的Tm值,对于荧光定量PCR来讲,默认值就可以了,以我们的经验,Primer-BLAST使用的Tm值算法还是比较准确的。最后的max tm difference是指正反向引物Tm值所允许的最大差异,默认不超过3°C,但通常情况下,Primer-BLAST设计出的引物tm值差异很小,所以这一项也不需要进行改动。

实际上,了解了PCR模板和引物参数的设置之后,已经可以使用Primer-BLAST进行初步的引物设计了,仅仅上面这些小伎俩,怎么能衬托我们qPCR实验的伟大意义呢?所以我们继续往下看其他的参数:


第三部分:外显子内含子的设置

图片

在了解其设置之前,我们首先需要明确什么情况下需要考虑外显子和内含子的问题,在真核生物中,一个基因是由很多外显子和内含子相互间隔拼接组成的,如图genomic DNA所示,每一个外显子都是被内含子间隔开的,这些内含子有的很短,不超过几十个碱基,但有的就很长,几千个碱基都有。而mRNA转录之后,通过体内的剪切机制,会将内含子去除,从而形成图片中mRNA的结构形式。

图片

我们知道,在提取样本RNA的过程中,如果不加DNA去除的操作步骤,很容易引入基因组DNA的污染,这样逆转录之后得到的产物将是cDNA和gDNA的混合物。

图片

如果引物设计不合理,比如上方示例中的绿色正向引物和红色反向引物,将正反向引物都设计在同一个外显子上,此时无论基因组DNA还是cDNA都能实现扩增,那么基因组DNA将会对qPCR的结果产生很大影响。因此,在引物设计的过程中,需要精巧安排正反向引物的结合位置。这个对于研究真核生物基因表达量变化的研究者来说至关重要。

目前,比较主流的避免gDNA干扰的设计方式有两种:

图片

第一种是引物本身要跨越相邻的两个外显子的拼接位点,英文称之为Exon junction span,如图所示,正向引物的上游13个核苷酸结合在外显子1上,而后7个核苷酸则结合在外显子2上。反向引物也是这样,不过通常情况下一条引物跨拼接位点就能满足需求。那么对于基因组DNA来讲,外显子1和2之间还有内含子序列,也就是说正向引物的结合序列根本不存在于基因组DNA上,从而避免了基因组DNA的干扰。

图片

第二种设计方法叫intron inclusion,意思是保证正反向引物结合在不同的外显子上,从而使产物包含外显子的拼接位点。如图所示。对于基因组DNA来说,虽然正反向引物仍然能够结合相应的外显子上,但是中间会包含一段或者多段内含子,内含子的加入,会使得以基因组为模板的扩增产物很长,在qPCR的反应流程中,很长的产物是不会被扩增出来的,从而避免了基因组DNA的干扰。这种方法有个要求,那就是中间包含的intron的大小要大一点,通常要大于1000bp。

上述所讲述的两种引物设计方式,在Primer-BLAST的外显子内含子设置中都是可以自定义的,Exon junction span中有三个偏好选项,分别是no preference:无所谓,引物一定要跨外显子拼接位点,以及引物可以不跨拼接位点。

图片

下方三个数字是指引物最多或最少要有几个碱基分别跟两个外显子结合,这个我推荐大家将max 3 match的数值设的小一点(但最好不小于2),这样能够保证引物多数序列不会分布在后面的外显子上,从而避免了引物与后面外显子部分结合而导致扩增。

图片

如果要包含内含子,则勾选上intron inclusion选项即可,下方的数字规定了所包含的内含子大小,最小不能小于1000,这个设置也是比较合理的,因为通常情况下,超过1000的扩增产物在qPCR过程中无法生成。如果包含的内含子太小,也是有可能扩增出来的。

那么问题来了,我提交一段序列给Primer-BLAST,它怎么知道外显子和内含子在哪里呢?所以,设置外显子内含子选项的前提是,我们不能单纯提交fasta序列,而是要提交基因的编号,或者能让Primer-BLAST对应到某个基因编号的序列。比如将人的rps18基因的mRNA编号NM_022551提交到序列框中。Primer-BLAST会调取NCBI GenBank中的数据,其中就有该编号的序列以及外显子内含子的信息了。

这两种设计方案既可以同时满足,也可以只选择其一。两种方案的特性是不同的,junction span方案只将引物放在拼接位点,而由于一个RNA的外显子拼接位点数量是非常有限的,所以经常会导致设计不出合适的引物,而intron inclusion只要将引物放在不同的外显子上,并且保证中间内含子足够大就行,所以相对成功率是比较高的。

图片

当然,上述这些都是针对真核生物而言的,而线粒体、原核生物或者病毒等不含有内含子的基因,此功能是完全不适用的。只能尽可能保证提取的RNA不含有基因组DNA污染。


第四部分:引物特异性检测参数的设置

这个功能是Primer-BLAST引以为傲的功能,在这里详细讲解一下,

图片

第一项Specificity check,是一个特异性检测的总开关,需要进行特异性引物的设计时,需要将其勾选上。Search Mode分为automatic自动模式,user guided用户引导模式,用户引导模式是指当Primer-BLAST不太确定您提交的是什么序列的时候,会在设计过程中弹出页面,询问我们提交的这个序列是不是Primer-BLAST所预测的这个?此时我们在候选中选择正确的即可。一般情况下,我们使用automatic自动模式就可以了,它是在不确定的时候,还是会问我们的。

数据库的选择的确是一门学问,他的意思是我们提交的这段序列,是处于哪个数据库之中的,选择好了数据库,Primer-BLAST才会在对应的数据库中比对数据库中的所有序列,来判断设计出的引物是否是特异性的。

图片

下面我罗列出了这几个下拉选项的具体含义

图片

  • 最常用的是refseq mRNA,里面包含了特定真核物种所有的mRNA序列集合,注意是真核生物的。我们在研究真核生物某个基因表达时设计的qPCR引物,选这项就可以了。

  • 还有Refseq representative genomes,就是特定物种的参考或代表基因组序列,对于原核生物来讲,其mRNA的序列跟基因组的序列是一致的,因此原核生物没有单独的mRNA数据库,统统包含在genome数据库里面。

  • 其他几个数据库用的并不是特别多,比如有些物种研究较少,没有参考基因组,那么我们可以看看是否有初步组装好的染色体序列。再比如,我们要研究lncRNA长链非编码RNA的表达,它并不属于mRNA,因此可以选择覆盖范围更广的refseq RNA数据库。实在不行,可以选择nr。

数据库的选择实际上是Primer-BLAST减轻工作压力,加快特异性比对速度的一个做法,原因很简单,NCBI的序列实在是太多了,一个个比对过去他们的服务器怕是要炸,所以先通过数据库的选择,限定一个模板种类。这个是有道理的,因为我们要保证引物在cDNA中的特异性,无需关注他在基因组上是否特异,所以就不需要在基因组数据库中进行特异性比对。

Primer-BLAST减轻服务器压力的另一个做法就是选择正确的物种,这个还是很明确的,我们设计一个人的基因的引物,没必要保证它在小鼠中是特异的。输入框中可以使用物种的英文,比如我输入一个human空格,预测框中就会自动弹出包含该英文的物种选项。然后我们点选即可。如果您的模板种类比较复杂,比如检测人样本中的肠杆菌,那么提取出来的DNA既有人的也有细菌的,这样我们可以点击“add more organisms”按钮,继续添加物种。

图片

特异性检测的最后,是对特异性严格程度的设置。我们知道,一个引物之所以特异性不好,是由于其3端与非特异性的位置有很大的相似性,3端一个碱基的不同并不会阻挡引物的非特异性结合,而引物的5端则对特异性影响不大,如下图所示。

图片

那么Primer-BLAST就特意开发了对引物的3端特异性严格程度进行设置的选项,比如我们可以要求引物至少要有2个碱基与非特异性靶标不匹配,3端最后的5个碱基中要存在至少2个碱基与非特异性产物不匹配,忽略6个以上不匹配的结果等。如果要更严格,可以将这些数字增大。比如要求引物必须与其他非特异性区域有6个碱基不匹配,包括3端5个碱基中至少要有5个不同等等。这样可以让设计出的引物更加特异,但设置过高可能会导致找不到满足要求的引物。

图片

Max target size是指扩增产物的最大值,因为qPCR的扩增时间较短,太长的产物是扩增不出来的,所以Primer-BLAST默认认为最大的扩增产物大小不超过4000,超过这个值非特异性产物Primer-BLAST会忽略掉。

Allow splice variants是指允许Primer-BLAST将不同转录变体的产物,都当作正确的目的产物,比如我的目的基因有3个转录变体,模板序列中我填写的是转录变体1的编号,如果勾选此项,那么设计出的引物,除了变体1,也【有可能】扩增变体2和3,注意是有可能,而不是一定也能扩增2和3。如果要求引物一定能够扩增所有的转录变体,需要其他的操作,我们后面的实战中会讲。 

到此为止,已经将基本设置参数都讲完了,包括四大部分:PCR模板、引物参数、外显子/内含子设置,以及引物特异性参数设置。这几个设置的下方,就有get primer按钮,可以看到完成这几项设置之后就可以完成比较不错的引物设计过程了。

但是各位还会注意到,Get Primer的下方还有一个按钮,advanced parameters,高级参数,点击这个按钮,Primer-BLAST才会显示其真正彪悍的一面。

图片

高级参数相当于对上述四个基本设置项目的进一步细化,并且细化到了发指的程度,所以这里我仅挑选几个常用的为大家讲解。


高级参数的第一部分:对引物特异性筛选的细化

图片

  • 包括筛选时最多选取多少目标序列、这个值越大,非特异性筛选的库容就越大,筛选也越严格。

  • Word size是指查询序列与目标序列最小连续碱基的匹配数,数值越小,引物匹配到非特异性序列的可能性就越大,筛查就越严格。

  • Max primer pairs to screen是指Primer-BLAST拿出多少对引物进行特异性筛查,一般500对已经足够筛选到很多特异性引物了,如果筛选不出特异性引物,可以尝试调大这个值。

  • Max targets to show,是指Primer-BLAST在结果中,会将引物可能结合的靶标罗列出来,罗列出的靶标数量。采取默认值就可以了。


高级参数设置还可以对产物、引物的性质进行进一步设置:

图片

  • 比如,可以规定扩增产物的Tm值范围,因为染料法荧光定量PCR的最终步骤是对产物进行加热处理,使其在某个温度下解链,导致嵌合染料脱落荧光值降低,通过检测这个温度是否单一,来判断是否只扩增了目的产物。如果产物的Tm值较低,那么可能会跟引物二聚体的产生混淆,如果产物的Tm值很高,则会影响熔解曲线的美观和熔解温度的判断。因此产物的Tm值设置在80~90°C范围内是比较合适的。

图片

一个比较好的熔解曲线

  • 引物的长度和GC含量使用默认值即可,引物的Tm值、长度以及GC含量是相互制约的关系,默认的参数能够保证引物的Tm值在50~65°C这样一个合理的范围。

  • GC clamp叫GC夹或者GC钳,是指正反向引物的3端末端连续GC的数量,如下图所示,分别是GC clamp设置为0~3的设计结果,这种连续的GC对引物稳定结合到靶标上是有帮助的,3端GC夹越多,引物的结合稳定性越强,但是特异性也会相应变差。

    图片

  • Max Poly-X是设置引物序列中最多允许几个连续相同的碱基,默认值为5即表示引物序列中,不能出现6个或以上连续相同的碱基,太多连续相同的碱基会使引物结合靶标时发生偏移,不利于正常的互补配对。

  • Max 3’ stability以及Max GC in primer 3 end都是对引物3端稳定性的描述,第一个是指3端最后五个碱基的ΔG吉布斯自由能,数字越大,表示3'端越稳定。比如3端是GCGCG,其数值为7左右,相反全是AT的话,其数值不到1。Max GC是指引物3端的5个碱基中GC碱基的最大数量,默认允许全部是G或C,不过我总觉得3端都是GC容易产生非特异性扩增,因此这一项我经常调节到3。


高级参数设置对引物的结合位置的进一步划定:

除了对引物的本身性质进行详细设置,还可以对引物的结合位置进行进一步划定,用到的就是excluded regions和overlap junctions。

图片

通过对excluded regions的设定,可以让引物避免结合到某一段位置,比如填写500英文逗号700,就是告诉Primer-BLAST从500位开始,往后的700bp这段区域不允许结合引物,那么设计出的引物就会像下图一样老老实实呆在excluded region的外面。更简单的写法是直接在模板序列中,将排除的结合区域用尖括号标记上。

图片

overlap junction的作用就是让设计出的正向引物或者反向引物必须跨越某个位点,比如我在这一项中输入500和1000,那么设计出的引物,要么正向引物要么反向引物,必定会跨在我规定的500或1000的位点上。如果您想要引物结合到模板上特定的连接处,则此选项很有用。

图片

overlap junction在功能上与基础设置中的Exon junction span跨外显子拼接位点非常相似,但还是有很多区别:

首先,overlap junction选项是可以用于任何fasta序列的,而Exon junction span选项只允许模板对应到某个特定accession编号,如果您的模板序列在NCBI数据库中没有,那么可以选用overlap junction让引物跨越某个拼接位点。

第二,overlap junction选项是我们人工定义拼接位点的,而Exon junction span则是系统根据refseq编号自动调取序列中的外显子拼接位点数据,我们无法定义。举个例子,我要求引物必须跨越外显子1和2的拼接位点,那么使用overlap junction可以轻松实现,而Exon junction span设计出的结果可能不跨外显子12拼接位点,而是可能跨越23或45外显子的拼接位点。

图片

虽然这项功能应用到实际使用过程中的概率不大,但在某些特殊情况下,overlap junction的功能还是很重要的

另外,对于模板的序列,尤其是NCBI已经收录的序列,Primer-BLAST也进行了严格的要求,比如SNP位点,Primer-BLAST可以让引物的结合位置避开常见的SNP位点或其他含有重复序列的区域,一些低复杂度的序列比如连续的CA重复,也能够避免引物设计在这些地方。

图片

最后,除了常规的qPCR引物,我们还可以在高级参数设置中设计探针,在Internal hybridization oligo parameter中,可以对探针的长度、Tm值、GC含量进行设置,这样Primer-BLAST的设计结果中不光包含有正反向引物,还会提供出对应的内部探针序列。

图片

不过对于探针而言,要考虑的因素还远远不止这些,比如探针的位置要尽量靠近同方向的引物、探针的末端碱基不能是G等,Primer-BLAST并没有这些设置参数,所以我推荐设计探针法的同学们还是使用更专业的探针设计软件更好。

下面对这些参数进行一个总结,Primer-BLAST将引物设计的参数分为了四个部分,分别是模板、引物性质、外显子设置以及特异性筛选。

  • 模板方面,我们可以输入纯fasta序列或者NCBI accession号,并可以规定产物大小及Tm值,还可以定义哪些位置允许引物结合或不允许引物结合。

  • 引物性质方面,除了常见的引物长度、Tm值、GC含量设置之外,还可以规定其中的碱基组成及比例,尤其是3端的稳定性和GC含量。

  • 外显子内含子方面,Primer-BLAST能够设置引物与外显子以及拼接位点的位置关系。

  • 最后特异性筛选方面,我们可以定义筛选检测的物种及对应的数据库,以及特异性筛选的严苛程度等。

图片

可以看到,虽然Primer-BLAST的很多功能借用了primer3的参数,但是得益于NCBI的强大数据,Primer-BLAST在序列调取、外显子设置、特别是特异性筛选方面,的确是有自己独到的见解与解决方案的。

讲到这里,相信很多参数大家都会进行调节了。那么很多朋友会问了,我辛辛苦苦调了这么多参数,但是一旦关了页面,一切又回到解放前,下次再设计引物的话又要一个个重新调过去,太不方便了。

图片

没问题,Primer-BLAST已经为我们想到了这点,看到页面上方有几个按钮了吧,有个叫save search parameters,当所有参数设置好了之后,点击此按钮,页面会弹出对话框,提示我们保存页面,点击确定之后,会弹出一个新的页面,将新的页面保存为书签即可。

图片

其实如果仔细看的话。保存的书签是一个超长链接,比如这是我保存的一个书签,

图片

其实,Primer-BLAST所有设置参数甚至是模板序列,都在这个链接里面,所有相邻的两个“&” 符号之间都代表了一个特定的设置参数。比如

  • 红色位置,我们可以更改为需要设计的RNA编号,

  • 紫色是产物大小,墨绿色是需要让引物跨内含子的开关,

  • 橙色是物种和特异性比对的数据库,

  • 淡蓝色是特异性严格程度,

  • 绿色的是引物连续碱基的数量和3端GC数量

  • 等等。

我甚至可以直接将这个链接进行修改,改好之后直接在浏览器中打开这个链接,就可以点击设计按钮了。

啰啰嗦嗦说了这么多,无非是想让大家对这些设置的定义和功能有所了解,但是大家不要被这些复杂的设置参数吓到,在我的引物设计经历中,需要设置的参数也只有下图的这些,其他的我都采用默认值。

图片

大家掌握了这几个,已经足够满足日常的物设计需求了。其他的功能日常我们根本用不到,但一旦用到会给我们很大的帮助。同时,了解这些功能,也会对引物设计的原理甚至日常一些qPCR实验中遇到的问题产生更深刻的认识。


实战演示

下面我们进入实战,正所谓是骡子是马拉出来溜溜,我将用几个案例,来为大家展示Primer-BLAST的使用流程。

图片

首先是案例1,设计一段DNA序列的qPCR引物,我只要求最快设计出满足实验的引物来,无需考虑其特异性,这个案例只涉及到了Primer-BLAST最基础的功能。

上面这个案例适用于我们有目的基因序列的情况,但在我们的日常研究过程中,我们更多遇到的是下面这种情况,就是我要研究靶基因的表达量变化,比如人的IL10基因,需要设计IL10的特异性的荧光定量PCR引物。

图片

通常情况下,我们需要知道IL10的基因序列,通过序列才能设计出引物,但是对于Primer-BLAST,查询序列的步骤完全可以省略。为我们可以直接从基因RNA页面中进入Primer-BLAST的程序,而无需关注基因的具体序列。操作步骤是这样的。

可以看到,上述案例是直接从基因的RNA页面中进入了Primer-BLAST程序,但是细心的大家可能会发现,案例中的基因,人的IL10,它只有一个转录变体,也就是说这个基因只表达一种RNA,只有一个相应的RNA页面。

图片

更多情况下,我们会发现,我们要研究的这个基因有很多个转录变体,也就是说有很多个转录本的页面,那我该从哪个转录本页面进去呢?默认选择第一个吗?这个时候就要小心了,有可能设计出的引物,只能覆盖其中几个转录变体,而其他几个转录变体则检测不到。

图片

这里举一个例子,人的caspase3基因有9个转录变体:

图片

他们的外显子分布情况如下图所示:

图片

图中绿色的方块就是组成各转录变体的外显子情况,浅绿色的是非编码区,而深绿色的是编码区。要注意,不管是浅绿色还是深绿色,它们都是外显子,都是mRNA的组成部分,唯一的区别就是在于这些外显子是否编码蛋白的氨基酸序列。

如果我们将引物设计到红色箭头所示位置,那么前四个转录变体就会完全在我们的检测中遗漏。因为前四个变体没有正向引物所结合的外显子。

图片

而如果我们将引物设计到蓝色箭头所示位置,那么这几个转录变体都会被检测到。因为这9个变体,都含有引物所在的外显子。

图片

上述的示例为我们提供了一条核心思想,那就是如果我们想要考察一个基因的总体表达量变化情况,需要找到基因所有转录变体的连续共有区域来进行引物的设计共有:保证了结合与这个区域的引物,能够覆盖到所有的转录本。而连续:则保证了不同转录本间的产物大小一致,从而方便我们进行反应特异性的判断。

而实现上述目的的最佳方法就是align,就是将这些转录本进行多重序列比对,从比对结果中找到这些转录本的连续共有区域。

具体如何最快速地操作呢?请看下面的示例:

上述示例的主要流程是:通过基因card找到转录本列表,blast找到共有区域,基因页面中查看共有区域性质最终选择合适的一段区域,MRNA页面,转到设计引物页面,输入结合范围,设置其他参数,完成设计。

图片

图片

最后一个案例,是验证已有引物序列的特异性。我们在做相关研究过程中,经常会从文献中看到相关的基因引物序列,那么通常情况下,我们可以直接使用文献当中的引物,当然如果您不放心的话呢,也可以使用Primer-BLAST对文献中或者现有的引物序列进行一下特异性、产物大小或tm值的预测。

从上面的示例我们能够看到,Primer-BLAST能够对文献中引物的质量好坏给出自己的判断,那么有人可能会产生这样的一个疑问,文献中的引物为什么会不好呢,Primer-BLAST和文献我究竟要相信哪一个?

图片

我的意见是,这两个都不要盲目相信,要相信自己的实验结果。首先说一下Primer-BLAST,其实任何引物设计软件,都是利用一定的参数和算法,对引物的性质进行预测,注意是预测,并不是精确计算,所以并不代表实际情况。所以并不是Primer-BLAST设计出的引物特异性一定好,也不是所有文献中的引物都可以直接为您所用。实际实验结果,是衡量一对引物的最终好用与否的金标准。

另外还有几点感受分享给大家,首先,引物设计是科学和玄学的矛盾集合体,引物的设计原则参与了科学的部分,而其他一些未知因素则构成了玄学的组成部分。正确的使用引物设计工具,能够将引物设计的过程向科学一方靠拢,尽量减少玄学的不确定性。从而让您的成功实验更加归因于您的实力,而非运气。第二点,荧光定量PCR虽然做起来非常快,但是引物设计与合成会占用您的大量时间,我们不妨算笔账,一对引物充其量也就几十块钱,如果您的课题时间紧张,合成了一对引物不好用,再重新设计重新合成,那么耽误的这几天时间成本,将远远大于引物的价值。所以倒不如在实际实验之前就多合成几对引物,通过预实验一起进行检测,筛选出最好的,这样做看起来挺浪费,但实际上是真正节约的明智之举。

所以,Primer-BLAST该用还是要用的,这可以提升我们的试验成功率,哪怕只提升了10%,也算是发挥了其应有的功能。


总结

所以今天的技术文章是授人以渔,让朋友们从求别人设计引物的束缚和漫长的等待时间中解脱出来。真正做到我的引物我做主!而NCBI的Primer-BLAST之所以从众多设计软件中脱颖而出,是得益于它方便快捷的操作方式,丰富的设置参数、独有的特异性比对功能等诸多优点,其实不光是Primer-BLAST,整个NCBI都是由无数个神器组成的,参透NCBI的使用方法,将对大家的科研之路有很大的帮助。

图片

图片

我知道你们有些人:

收藏永不停止,实践从未开始……

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多