分享

两篇文章告诉你lncRNA的主要研究思路

 微笑如酒 2017-06-20

长链非编码RNA(long non-coding RNA,LncRNA)一般指不具有蛋白编码能力,转录本长度超过200 nt的RNA分子,包括intronic/exonic lncRNAs、antisense lncRNAs、overlapping lncRNA和long intergenic ncRNAs(lincRNAs)。LncRNA与细胞周期和分化、发育、生殖、性别调控、衰老以及多种人类疾病密切相关。


lncRNA数量比较多,大约是为mRNA的3-100倍,但是目前多数lncRNA的功能仍不清楚,有很大的研究空间。最近,有文章报道lncRNA可以编码微肽并具有特定生物学功能,又拓展了新的研究方向。因此,lncRNA是目前生物和医学研究中的热点话题之一。


高通量研究lncRNA主要思路


1. 利用组学研究LncRNA时空表达模式 

包括不同发育阶段、疾病发展进程等生物学连续过程中的lncRNA的种类、数量和表达丰度。



2. 候选lncRNA的功能研究 

高通量筛选出对照组/处理组、处理不同时间点间以及其它生物学相关差异候选lncRNA,再进行后续功能学研究或作为疾病治疗靶点和biomarker研究。



3. LncRNA-mRNA或LncRNA-lncRNA interaction调控生物学功能研究 

例如利用Genome-scale RNA interactome analysis(RIA-Seq)分析到TINCR lncRNA与多种mRNA结合调控细胞发育。



4. miRNA-dependent CeRNA研究转录组层面)。



5. LncRNA的多组学研究基因组、转录组、表观组学等多层面)。



6. LncRNA编码肽段的研究 

高通量预测组学lncRNA数据的蛋白编码能力,生信分析流程中保留可以编码的lncRNA进行后续研究。


下面我们通过两篇基迪奥项目文章,看看别人如何研究lncRNA的表达模式。


一、LncRNA测序研究山羊骨骼肌发育


发表期刊:《BMC Genomics》

影响因子:3.867


研究背景:山羊发育过程中,有关骨骼肌lncRNA的研究很少。

研究思路:取4个不同发育时间、3个生物学重复的肌肉,进行链特异性RNA-Seq建库,生信分析lncRNA数量,表达情况。


研究结果


1. LncRNA高通量测序


通过链特异性RNA-Seq建库,对下机raw data进行过滤后,75.20–86.60% clean reads能够比对上山羊参考基因组(CHIR_1.0, NCBI)。再通过生信流程分析鉴定到3515个intergenic lncRNAs(88.29 %)和466个anti-sense lncRNAs(11.71 %)转录本,对应2739个lncRNA genes。平均长度1296 bp,含有2.4 exons。


同时检测到24,383个protein coding转录本,平均长度1978 bp,含有8.4 exons,其中只有10.6%含有2-3个exons。



2. LncRNA差异表达研究


利用Cuffdiff软件计算lncRNA转录本的表达量FPKM(fragments per kilo-base of exon per million fragments mapped),共577 lncRNA transcripts在发育过程中差异表达。



3. lncRNAs cis调控研究


查找protein-coding genes上下游10-kb的区域的lncRNA,发现1153 lncRNAs与1455 protein-coding gene位置临近,可能参与调控基因转录或者转录后水平。接着对共表达基因进行GO和KEGG富集分析,研究它们相关生物学功能。结果显示RBP4, PLN, MYLK2, RARA, 等基因处于muscle development-related GO term(GO:0014706),与肌肉发育密切相关。


4. lncRNAs trans调控研究


通过生信分析lncRNA trans调控的靶基因,结果显示1747 lncRNA transcripts与19,846 protein-coding transcripts有结合的关系。同样对共表达基因进行GO和KEGG富集分析,研究它们相关生物学功能和通路。


5. qPCR验证


随机挑选6个差异表达lncRNAs进行qPCR验证,qPCR结果显示与RNA-Seq的一致性。说明高通量测序和生信分析lncRNA的可靠性非常高。



二、利用大鼠模型研究阿兹海默症相关lncRNA和mRNA


发表期刊:《Mol Neurobiol》

影响因子:5.397


研究背景:阿兹海默病(AD)的发病机理没有完全研究清楚,并且lncRNA在阿兹海默病中的作用研究较少。

研究思路:构建大鼠疾病模型,对AD组(n = 10)和 control组(n = 10)进行芯片分析,生信分析差异lncRNA和mRNA。


研究结果


1. 组间差异表达lncRNA和mRNA


Case-control组间发现315个显著差异的lncRNA(238个上调,77个下调)。同时发现311个显著差异的mRNA(191个上调,120个下调)。



2. qPCR验证


qRT-PCR结果与microarray data存在一致性,lncRNAs BC092582、MRAK050857和mRNA S100A8 在AD中下调;

lncRNAs MRAK088596、MRAK081790和mRNA MAPK10 在AD大鼠中上调。



3. lncRNA调控的mRNA功能富集分析


通过生信方法分析lncRNA调控的mRNA,再进行GO和KEGG富集分析。发现这些mRNAs的功能与endocrine process(ontology: biological process, GO:0050886), extracellular region part(ontology: cellular component, GO:0044421)和neurokinin receptor binding(ontology: molecular function, GO:0031834)相关。



4. lncRNA-mRNA共表达网络分析


利用差异lncRNA和差异mRNA构建共表达网络,共有454 network nodes和478个相互作用关系将168个差异mRNAs 和286个差异lncRNAs联系起来。1个mRNA可以结合1-66个lncRNAs,1个lncRNA可以与2个mRNA发生作用。


总结


  1. 这两篇文章(3-5分)中的LncRNA的测序分析内容并不复杂,包括:转录本统计和注释、差异表达分析、cis/trans调控分析、靶基因功能富集分析、共表达网络分析等。这表明常规的标准生信流程分析足够普通文章的发表分量。

  2. 都只有简单的qPCR对测序结果的验证,如果加入更多的基因功能研究,文章的将会再上一个层次。

  3. 第一篇文章采用了四个不同发育时间的12个样本,数量比较充足;第二篇中成功构建了特定的疾病模型,也容易找到与正常样本差异表达的基因。这说明样本的设计和选择是非常重要的,直接影响后续结果优劣。

  4. 这两篇文章都是关于lncRNA整体表达的,只是比较常见的一种思路。文章开头还例举了其它的一些思路供参考,可以根据研究目的,设计合适的方案。


参考文献:

【1】Zhan S, Yao D, Wei Z, et al. Genome-wide identification and characterization of long non-coding RNAs in developmental skeletal muscle of fetal goat[J]. BMC Genomics, 2016, 17(1):666.

【2】Yang B, Xia Z A, Zhong B, et al. Distinct Hippocampal Expression Profiles of Long Non-coding RNAs in an Alzheimer's Disease Model[J]. Molecular Neurobiology, 2016:1-14.


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多