分享

全转录组: 1 份数据,2 篇文章

 微笑如酒 2017-12-20

随着RNA研究系统化和高通量测序技术的发展,基于测序的全转录组研究可以对多种RNA信息包括mRNA和ncRNA(miRNA,lncRNA, circRNA等)进行整合分析,能够比较全面地探索潜在的网络调控机制,已逐渐成为RNA组学研究的趋势。


先前我们在农学circRNA微信文章中分享过猕猴桃circRNA研究案例,这次我们增加lncRNA的文章部分。作者利用一种建库方法,阐述了猕猴桃不同品种抗病相关的lncRNA,circRNA以及分别与mRNA关系,发表两篇文章。通过对两篇文章思路的梳理,可以更好帮助我们设计全转录组研究方案。

研究思路

 

研究目的

 

利用全转录组测序对非编码RNA如:lncRNA,circRNA以及和编码基因间的关系进行多种分析,可以系统地研究植物免疫应答中的RNA调控作用,深入了解宿主−病原互作相关分子生物学机制,从而有效控制病原感染。

研究结果
1  circRNA研究部分


circRNAs研究内容和结果可以参考前期微信文章(戳这里)。主要通过以下几个方面来研究不同品种,病原感染相关的circRNA:

1
circRNAs测序数量统计和可变剪切分析
2
circRNAs表达模式研究
3
circRNAs和编码基因共表达网络研究
4
WGCNA分析 


2  LncRNA研究部分

 



lncRNA的研究思路与circRNA部分很相似,在基因互作方面,circRNA侧重于研究circRNA与其来源基因的相关性;而lncRNA主要分析cis/trans调控。

1
lncRNA数量和类型,转录本长度,GC含量和外显子数目信息

 

共鉴定到14,845个lncRNA transcripts,根据基因组位置,可以分为intergenic lncRNAs (10,238个), antisense lncRNAs (1,874个), intronic lncRNAs (75个), overlapping lncRNAs (1434个)以及其它lncRNAs (1,805) (图. 1c)。lncRNAs的平均长度774 bp,平均 GC content为36.78%, 两者都低于编码基因(分别为~2.8 kb和42.49%,) (图. 2d)。结果显示与编码基因相比,lncRNAs的序列特征呈现一定的多样性。


图 1. LncRNA流程分析和结果统计

2
品种特异性的lncRNA和mRNA

 

PCA分析显示3个品种的猕猴桃基因表达聚成3组,说明基因表达的品种特异性。维恩图直观的展示不同品种间mRNA和lncRNA的情况。


图 2. lncRNA和mRNA表达PCA分析和不同品种间基因维恩图

 

3
lncRNA和mRNA表达相关性分析

 

通过计算基因间的相关性Spearman相关系数(rs),作者发现cis/trans间一些正负调控规律,如在在1.58 × 10^9个trans调控关系中,正调控的比例较高,其中1.33% mRNA-mRNA, 0.79% mRNA-lncRNA, 以及1.94%的lncRNA–lncRNA显著正相关(rs > 0.8)。

 

在1.69 × 10^5个cis关系中显著正调控的比例也要高于负调控;lncRNA-lncRNA间没有显著负调控(rs <>)。

 

再对cis调控显著正相关lncRNA-mRNA进行GO富集分析,显示与应激,免疫和代谢等生物学进程相关,暗示这些基因参与了病原-宿主相关调控。


 


图 3. Cis/trans基因对间相关性研究和GO富集分析

4
WGCNA分析

将998个lncRNAs和8,700个mRNA根据共表达关系归类成22个模块,发现有14个模块与品种显著相关;模块6, 12和15与样本处理阶段DPI显著相关(图4)。

 

图 4. 共表达的WGCNA模块基因与表型关联分析(leaf area

, DPI和species

 

作者再以模块17为例,对其模块基因mRNA进行GO富集分析,发现一些与lncRNA显著相关的mRNA在植物免疫和抗病相关信号通路中,如lncRNA TCONS_0019494涉及systemic acquired resistance, MAPK cascade;TCONS_00202033与先天性免疫应答和

salicylic acid-mediated信号通路有关(图5)。


图5. 模块17中lncRNA显著相关的mRNA GO富集分析

 

 

总    结

1. 全转录组关键在于如何利用测序数据,从不同角度进行整合分析,这两篇文章都是从鉴定lncRNA和circRNA入手,分别分析了两两基因间(nc-mRNA)的相关性,对差异基因和基因对进行功能注释研究,两篇文章思路相似,一份测序达到事半功倍的效果;

 

2. 文章测序样本量相对较多(>15个),基因表达模式比较研究较为复杂,在样本量逐渐增多的研究趋势下,采用WGCNA等其它生物信息学方法进行数据挖掘的需求也会越来越多;

 

3. 作者只分析了两两基因间(nc-mRNA)的相关性和调控方式,此外,通过预测靶向miRNA或miRNA测序,分析三种基因间的ceRNA网络调控也是全转录组的另一种思路。


今天的内容就到这里啦~


相关文章

《WGCNA在植物circRNA研究中的应用》


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多