长链非 编 码RNA是一类定位于细胞核或细胞质中,转录本长度大于200nt ,且以 RNA的形式调控基因的表达水平的一类非编码RNA ,与其它非编码 RNA相比较,lncRNA具有三多的特点,即类型多、作用模式多和数量多 主要可分为反义长链非编码 lncRNA(antisense RNA )、 内 含 子 非 编 码 lncRNA(intronic lncRNA ) 、基 因 间 长 链 非 编 码 lncRNA(intergentic lncRNA)、启动子相关长链非编码lncRNA(promoter-associated lncRNA)、非翻译区长链非编码lncRNA (UTR-associated lncRNA) lncRNA功能然而,由于lncRNA缺乏明显的开放阅读框,故不参与蛋白质编码功能 。虽lncRNA不参与蛋白质的表达,但能以RNA形式在表观遗传学,转录及转 录后等多种层面调控基因的表达。这里简要介绍lncRNA其作为信号诱饵、操纵以及脚手架作用的4 种典型的分子功能。
lncRNA表达-TANRICTCGA 数据库里面大部分都是RNA测序的数据,这部分数据在 TCGA 基础分析里面只是做了编码基因的表达定量分析,但是这些数据还包括了大量长非编码 RNA 的信息,所以MD Anderson 肿瘤中心的一群生物信息分析专家就把 TCGA 原始测序数据全部下载下来,然后对这些数据进行了深入的挖掘,并且做成了 The Atlas of Noncoding RNAs in Cancer数据库供大家使用。 TANRIC 除了包括TCGA的数据外,还对 Cancer Cell Line Encyclopedia(CCLE)里各种细胞系的数据进行了深度的分析和整合,集合了不同组织细胞表达数据。下面就以 HOTAIR 这个经典的长非编码RNA在乳腺癌细胞的研究为例,给大家介绍一下这个数据库的用法吧。 网址:http://ibl./tanric/_design/basic/index.html 我们点击进去分别选择肿瘤类型、输入关注的 lncRNA 名字、要研究的样品类型和关联分析的数据情况,然后提交查询即可。对于很多新的lncRNA没被NCBI等数据库收录的,这时候如果按照基因名是无法查询的,对此TANRIC也提供了基于lncRNA上外显子位置信息进行查询的方式,以 HOTAIR 为例,另外一种查询方式是:chr12: 54356092-54357908 ; 54359748- 54359867 ; 54360060-54360161 ; 54362401-54362698(分别是HOTAIR 上 4 个外显子的区域信息),这种方式查询的效果和直接查询 HOTAIR 是一样的。最后点击提交,我们只需静静的等待最终的结果即可。比如:我们输入HOTAIR,选择乳腺癌,然后点击submit
结果在 LncRNA expr 那一列会提供每个样品的表达量信息,包括正常的组织和癌组织。需要注意的是这里的表达水平都是 log2 之后的值 在 Survival 那一列会计算 overall survival 与表达水平的相关性,以便于寻找具有临床意义的 biomarker 。很明显,这条lncRNA不能做预后哦(P>0.05) lncRNA 可以通过不同的作用机制影响下游基因的表达,在这里 TANRIC 通过计算候选lncRNA 和每个编码基因之间的相关系数,以此推断候选 lncRNA 直接作用的下游基因,并且以散点图的方式进行展示。例如和HOXC11共表达值为0.864和HOXC10共表达为0.727.显示出超强共表达 随着RNA调控机制研究的深入,有人提出了 ceRNA(competing endogenous RNAs)假说,该假说认为 microRNA 可以通过结合 mRNA 导致基因沉默,而 ceRNA 可以通过竞争性地结合 microRNA 来调节基因表达,越来越多的文章证明 lncRNA 也是可以发挥 ceRNA 功能的。对此,TANRIC 也是通过计算候选 lncRNA 和每个 microRNA 之间的相关系数,以此推断候选 lncRNA 直接作用的 microRNA 情况。 很不幸,这个并没有哦 关键这个数据库可以支持各个肿瘤组织的表达情况,对于研究组织特异性是不错的选择,具体靠大家慢慢探究 参考资料
|
|