分享

阳奉阴违,可变剪切作用模式的套路总结

 生物_医药_科研 2018-12-21

蹭可变剪切热点,基因研究亦可老树开新花。



现已知晓,分子机制研究有直接和间接之分。多元变量论证的16字心法:“先辨主次,再分上下,两两调控,三三回复”其实也是间接机制的论证思路;而关于直接机制,亦有一个16字口诀需要谨记,即“直接交互,分子归类,横向纵向,二维展开”


其中,“直接交互,分子归类”意味着以交互的分子类型来归纳作用模式是逻辑上最清晰的分类体系,与实验研究方法一一对应,如此在提炼出分子框架后可对后续出现的数据结果产生一定的预判性。


而在“横向纵向,二维展开”中,横向是变量间上下游串联,纵向则是变量向内部拓展细节。各种分子修饰就是机制纵向展开的细节模式之一,其中,若是仅仅讨论修饰状态的变化,不揭露施加修饰的上游因变量,则属于半套直接机制的做法


此外,纵向研究还有另外一种重要的类型,即可变剪切(alternative splicing),也称之为选择性剪切。因而,本策“阳奉阴违”主要讲述可变剪切在直接机制研究中的做法。


01


通常,当基因的初级转录产物前体mRNA经过去除内含子外显子连接起来成为成熟mRNA的过程,即为剪接(splicing);


而当同一个前体mRNA通过不同的剪接方式产生不同的mRNA剪接异构体(transcript variant),可翻译成不同的蛋白转录本亚型(isoform),即为可变剪切。因而,一个基因是可以编码出多个不同转录产物和蛋白产物的。


通过高通量测序技术以及生信分析,现已发现整个人类基因组大概有35%-60%的基因存在可变剪接形式,一半左右的基因都有多个转录本,这就意味着可变剪切是具有普遍性的机制。


那么要知道一个编码基因有无可变剪切形式,可通过信息数据库里的三大基因组数据库:NCBI、UCSC、ensembl进行查询。


以NCBI为例,在GENE子数据库中,输入一个基因名称(如PTEN),点击检索结果界面里第一个种属为homo sapiens(人类)的PTEN,可查看基因的详细信息。




其中,NCBI Reference Sequences (RefSeq)中的mRNA and Protein(s)就是这个基因的mRNA和蛋白序列,如NM_000314.6 → NP_000305.3,M就是mRNA,P是蛋白,后面数字每个序列是唯一的,点几是版本号。





由此可知,PTEN基因有3个已知转录本isoforms,每一个都有Description描述。第一个表达丰度最高,是常规意义上的PTEN;另外两种剪切形式中,更长一点为PTEN-L,即PTENalpha;更短一点则是PTENbeta。


02


当一篇文章涉及了多个变量之间的调控关系时,即为二元、三元变量;而当一篇文章涉及同一家族或者同一基因的不同亚型或转录本时,则它们不是调控关系,而是平行结构,可将之称为双变量、三变量


在做基因的可变剪切研究时,一般建议转录本数量最好是2个或者3个;超过3个以上,研究工作量会太过繁重,一个课题里面根本做不过来,应该通过预实验确定某一个具有特别的表达分布或者是功能表型的亚型来聚焦研究。


细胞中不同的转录本可能造成以下4种不同的功能结果:


1)不同转录本编码同样的蛋白,但是mRNA的非翻译区不一样,所以翻译调控不一样;


2)编码不同的蛋白但功能一样,但这种课题则纯属悲剧;


3)编码不同的蛋白功能不一样,属于各司其职。因而可用不同转录本执行不同功能来解释不同机制;


4)编码不同的蛋白功能不但不一样而且相反,具有拮抗作用。


03


在双变量、三变量论证的过程中,可先检测变量的表达差异。因可变剪切具组织特异性和时空特异性,应先选好相应的组织标本、细胞株对象;随后再用每个蛋白亚型的特异性抗体或设计特异性引物的定量PCR来进行转录本的检测。


接下来进行一正一反操作观察表型Gain of function中,可构建不同剪切变异体的过表达载体。但Loss of function可能做不了RNAi,因为有些情况下两个转录本间只有几十个碱基的差异,或者长的版本覆盖短的版本,导致可以设计siRNA序列的空间不足。


此时,可进行先沉默再过表达的Rescue实验,即先针对同源区设计一段siRNA把所有转录本都敲了,然后一个一个Rescue过表达进去,看功能情况。


又因双变量、三变量研究在本质上仍可看成是单变量的一种升级模式,因而在机制研究上,可变剪切的下游,主要是为了解释表型,还是找明星分子或通路。


做可变剪切的上游,则可以找参与可变剪切的蛋白酶,比如在已知的调控可变剪切的酶里面,小范围的筛选出哪个酶调控了主变量可变剪切,从而使得不同转录本表达丰度发生变化。


当转录本多于3个时,选其中一个转录本来研究,并将其当做一个新的分子代入五恒量,然后上下游做机制。


此外,由于RNA的m6A甲基化可以作为可变剪切识别的一个信号,而这种cross-talk绝对是非常新的领域,所以当一个选择性剪切的转录本上面还有RNA的m6A甲基化调控时,文章创新性、逻辑性都会有大幅度的提高


而且除了可变剪切+分子修饰的纵向两层嵌套,新的分子类型——非编码RNA也有可变剪切的展开模式,连最新的分子类型circRNA可变剪切的文章也都有


04


通常单变量没机制的文章,只要记住有组织、细胞、动物三个维度的数据可以呈现,逻辑就完整了。由于围绕主变量来论证是一篇文章的核心逻辑,而因变量论证一定有省略的步骤,所以多元变量论证时,要分清楚主变量和因变量,并区别对待。


主次之后,关于上下的问题就是搞清楚到底谁调节谁。“你动我也动”是一个金标准,即人为改变上游,下游应该随之而动,主要是上下调的变化,也包含一些特殊的分子修饰变化;而反过来操作下游,上游是不会变的。但这只能证明间接,如果是直接机制,那就一定有co-IP、RIP、pulldown、luciferase这些经典实验。


而要把直接机制搞清楚,依据分子类型来逻辑归类是最好的方法。但是直接机制不仅仅有分子交互,还有可变剪切这种模式。而可变剪切本质上就是一种平行的变量叠加,而且变量间还有亲缘关系。通常高分文章既有上下游多个分子嵌套,又有主变量的可变剪切精细调控。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多