长链非编码RNA(long non-coding RNA,LncRNA)一般指不具有蛋白编码能力,转录本长度超过200 nt的RNA分子,包括intronic/exonic lncRNAs、antisense lncRNAs、overlapping lncRNA和long intergenic ncRNAs(lincRNAs)。LncRNA与细胞周期和分化、发育、生殖、性别调控、衰老以及多种人类疾病密切相关。 lncRNA数量比较多,大约是为mRNA的3-100倍,但是目前多数lncRNA的功能仍不清楚,有很大的研究空间。最近,有文章报道lncRNA可以编码微肽并具有特定生物学功能,又拓展了新的研究方向。因此,lncRNA是目前生物和医学研究中的热点话题之一。 1. 利用组学研究LncRNA时空表达模式 包括不同发育阶段、疾病发展进程等生物学连续过程中的lncRNA的种类、数量和表达丰度。 2. 候选lncRNA的功能研究 高通量筛选出对照组/处理组、处理不同时间点间以及其它生物学相关差异候选lncRNA,再进行后续功能学研究或作为疾病治疗靶点和biomarker研究。 3. LncRNA-mRNA或LncRNA-lncRNA interaction调控生物学功能研究 例如利用Genome-scale RNA interactome analysis(RIA-Seq)分析到TINCR lncRNA与多种mRNA结合调控细胞发育。 4. miRNA-dependent CeRNA研究(转录组层面)。 5. LncRNA的多组学研究(基因组、转录组、表观组学等多层面)。 6. LncRNA编码肽段的研究 高通量预测组学lncRNA数据的蛋白编码能力,生信分析流程中保留可以编码的lncRNA进行后续研究。 下面我们通过两篇基迪奥项目文章,看看别人如何研究lncRNA的表达模式。 发表期刊:《BMC Genomics》 影响因子:3.867 研究背景:山羊发育过程中,有关骨骼肌lncRNA的研究很少。 研究思路:取4个不同发育时间、3个生物学重复的肌肉,进行链特异性RNA-Seq建库,生信分析lncRNA数量,表达情况。 研究结果 1. LncRNA高通量测序 通过链特异性RNA-Seq建库,对下机raw data进行过滤后,75.20–86.60% clean reads能够比对上山羊参考基因组(CHIR_1.0, NCBI)。再通过生信流程分析鉴定到3515个intergenic lncRNAs(88.29 %)和466个anti-sense lncRNAs(11.71 %)转录本,对应2739个lncRNA genes。平均长度1296 bp,含有2.4 exons。 同时检测到24,383个protein coding转录本,平均长度1978 bp,含有8.4 exons,其中只有10.6%含有2-3个exons。 2. LncRNA差异表达研究 利用Cuffdiff软件计算lncRNA转录本的表达量FPKM(fragments per kilo-base of exon per million fragments mapped),共577 lncRNA transcripts在发育过程中差异表达。 3. lncRNAs cis调控研究 查找protein-coding genes上下游10-kb的区域的lncRNA,发现1153 lncRNAs与1455 protein-coding gene位置临近,可能参与调控基因转录或者转录后水平。接着对共表达基因进行GO和KEGG富集分析,研究它们相关生物学功能。结果显示RBP4, PLN, MYLK2, RARA, 等基因处于muscle development-related GO term(GO:0014706),与肌肉发育密切相关。 4. lncRNAs trans调控研究 通过生信分析lncRNA trans调控的靶基因,结果显示1747 lncRNA transcripts与19,846 protein-coding transcripts有结合的关系。同样对共表达基因进行GO和KEGG富集分析,研究它们相关生物学功能和通路。 5. qPCR验证 随机挑选6个差异表达lncRNAs进行qPCR验证,qPCR结果显示与RNA-Seq的一致性。说明高通量测序和生信分析lncRNA的可靠性非常高。 发表期刊:《Mol Neurobiol》 影响因子:5.397 研究背景:阿兹海默病(AD)的发病机理没有完全研究清楚,并且lncRNA在阿兹海默病中的作用研究较少。 研究思路:构建大鼠疾病模型,对AD组(n = 10)和 control组(n = 10)进行芯片分析,生信分析差异lncRNA和mRNA。 研究结果 1. 组间差异表达lncRNA和mRNA Case-control组间发现315个显著差异的lncRNA(238个上调,77个下调)。同时发现311个显著差异的mRNA(191个上调,120个下调)。 2. qPCR验证 qRT-PCR结果与microarray data存在一致性,lncRNAs BC092582、MRAK050857和mRNA S100A8 在AD中下调; lncRNAs MRAK088596、MRAK081790和mRNA MAPK10 在AD大鼠中上调。 3. lncRNA调控的mRNA功能富集分析 通过生信方法分析lncRNA调控的mRNA,再进行GO和KEGG富集分析。发现这些mRNAs的功能与endocrine process(ontology: biological process, GO:0050886), extracellular region part(ontology: cellular component, GO:0044421)和neurokinin receptor binding(ontology: molecular function, GO:0031834)相关。 4. lncRNA-mRNA共表达网络分析 利用差异lncRNA和差异mRNA构建共表达网络,共有454 network nodes和478个相互作用关系将168个差异mRNAs 和286个差异lncRNAs联系起来。1个mRNA可以结合1-66个lncRNAs,1个lncRNA可以与2个mRNA发生作用。
参考文献: 【1】Zhan S, Yao D, Wei Z, et al. Genome-wide identification and characterization of long non-coding RNAs in developmental skeletal muscle of fetal goat[J]. BMC Genomics, 2016, 17(1):666. 【2】Yang B, Xia Z A, Zhong B, et al. Distinct Hippocampal Expression Profiles of Long Non-coding RNAs in an Alzheimer's Disease Model[J]. Molecular Neurobiology, 2016:1-14.
|
|