分享

驾驭基因表达调控(5)如何设计沉默效率更好的 siRNA?

 演戲599 2020-07-05

上期咱们介绍基因沉默技术时提到目前常见的基因沉默方法—— RNAi,大家也了解了这种基因调控依赖于体外转染一种名为 siRNA 的小 RNA 结构。这一期咱们来详细说说在实践中如何导入和设计 siRNA 以达到最佳基因沉默效果。

体外实验外源转染 siRNA 的方式分瞬时转染和稳定转染两种:

  • 瞬时转染,指外源直接导入合成并修饰的 siRNA,一般需要经过化学修饰以保持 RNA 结构稳定,成本较高。

  • 稳定转染,指外源导入dsDNA,将其整合到宿主基因组后,稳定转录shRNA(shRNA是在 siRNA 序列基础上加上一段形成茎环结构的序列),再加工转运至核外胞质。



转染成功后,胞质中 shNRA/siRNA 募集 Dicer,TRBP,Ago 组成 RNA 诱导沉默复合物(RNA induced silencing complex ,RISC)。复合体内双链 RNA 解链后正义链被剪切,留下反义链用于 mRNA 互补配对。
依据反义链的配对序列类型,如匹配 CDS 区还是 3'UTR,RISC 最终在转录后水平或翻译水平实现基因表达抑制
 
在排除转染效率影响的前提下,大家在做 RNAi 时经常遇到的沉默效率不理想和脱靶现象,最重要的影响因素就是 siRNA 设计。
 
siRNA 基因沉默效率取决于靶序列和 siRNA 两部分。


  

对于靶序列选择,我们需要避免选择基因内含子、5'UTR、3'UTR 设计 siRNA。UTR 存在的丰富调控蛋白结合位点可能影响 RISC 和靶序列的结合。一般来说 RNAi 沉默最佳靶序列区域是基因 CDS 转录起始位点下游 50-100bp。

此外,长期实践发现,针对特定序列模型的靶序列(常见的有 5′-AA(N19)TT, 5′-AA(N21) 和 5′-NA(N21))设计的 siRNA 具有更高的沉默效率。

以 5′-AA(N19)TT 为例,该模式代表在两个 A 碱基后接 19bp siRNA 并以两个 T 碱基结束的靶序列。

最后,若靶序列转录 mRNA 碱基 GC 含量大于 50% 或可以形成二级结构,也不利于 RISC 结合,影响沉默效率。
 
对于 siRNA,我们需要考虑其长度特异性碱基组成
 
最佳 siRNA 长度是 19-25bp,过短降低特异性,过长容易引发免疫反应(尤其在哺乳动物宿主中)。
 
siRNA 设计时,一般认为除靶序列外存在小于 78% 完全匹配的序列是可以接受的。即对一个 19bp 的 siRNA 来说,若在靶序列之外发现存在 15 个以上碱基匹配则 siRNA 特异性存疑,有脱靶风险。
 
siRNA 的 GC 含量目前没有定论,但基本在 30%-50% 左右的范围波动。过低 GC 含量影响 siRNA 结合 mRNA 效率,过高则使双链结构不容易在 RISC 中解旋形成具有识别能力的单链结构。
 
siRNA 简单双链结构在 RISC 组装过程中非常重要,因此 siRNA 内部需避免回文序列和高度重复序列,防止形成 2 级结构,影响 RISC 形成效率。
 
满足以上基本条件以后,我们还可以进一步优化特定位置的碱基种类,增加siRNA 沉默效率。
 
大量研究已经给出了不尽相同的优化方法。其中,siRNA 第十位 U 碱基和沉默效率高度相关,这可能是因为 RISC 切割的 mRNA 碱基位点在 10-11 之间,并且倾向于剪切 U 碱基的 3' 端。
 
下图中总结了部分特定 siRNA 碱基的设计优化原则。红色的碱基种类代表需要避免的情况,绿色碱基则是推荐选项。
 

此外,一项针对 600 个化学合成 siRNA 沉默效率的研究总结出一套四个级别的高沉默效率 siRNA 碱基优化规则,推荐程度逐级递减。
  • 第一级:第 1 位为 G/C,第 19 位为A/U,第 10 位为 A/U,第 13-19 位有大于 3 个 A/U。

  • 第二级:第 1 位为 G/C,第 19 位为 A/U,第 10 位为 G/C,第 13-19 位有大于 3 个 A/U。

  • 第三级:第 1 位为 G/C,第 19 位为 G/C第 11 位为 G/C第 5-19 位有大于 6 个 A/U

  • 第四级:第 1 和 19 位为 A/U第 13-19 位有大于 3 个 A/U


最后,我们还可以在 siRNA 双链 3’ 端额外加两个 T,以减少 siRNA 合成成本,增强其 RNAase 抵抗力。
 
综上,简单来说,设计 siRNA 需要兼顾如下要点:
1、 确定靶序列区域:最好的区域是起始密码子下游 50-100bp;序列模式符合 5′-AA(N19)TT, 5′-AA(N21) 或 5′-NA(N21);GC 含量小于 50%。
2、 控制siRNA长度:siRNA 长度在 19-25 之间。
3、 siRNA特异性检查:确保 siRNA 在靶序列之外没有高于总序列碱基数目 78% 的相同碱基。
4、 siRNA碱基优化:控制 siRNA 的 G/C 碱基含量为 30%-50% 左右,第十位碱基最好是 A/U。
 
对于那些不想自己费心设计,或是需要批量设计的读者,也可使用现存的大量线上 siRNA 设计算法。

一篇 2016 年 Nature 文章总结列举了大量 siRNA 线上设计工具,限于篇幅这里就不逐一介绍,直接上表:

 



从这些种类丰富标准、不尽相同的线上设计工具可以看到,目前 siRNA 设计原则还没有形成共识,我们在实践过程中还是要具体实验来评估沉默效果。

因此在设计时我们尽最大可能满足上述原则即可,最后结果也可能满足预期。当然,鉴于 siRNA 设计合成成本并不算高,强烈建议针对一种基因设计多个(一般 3 个就足够)siRNA,提高成功概率。
 
细心的读者可能已经发现了,以上讨论内容主要针对编码基因的沉默,对于非编码序列,比如 miRNA,该如何进行抑制调控呢?答案下期揭晓,敬请期待。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多