分享

Meta-analysis肺癌中的miRNA的表达

 微笑如酒 2017-12-02




看题目是不是以为作者要自己下载数据进行分析了?事实上,这篇文章的作者并没有自己去找相关数据集后用meta-analysis的方法分析肺癌。而是收集了20篇已经发表的与肺癌相关的miRNA的文章,然后对这20篇文章的数据结果进行重新统计分析。然后。。。就发了篇新文章。。。羡慕吧~~~


咱们来看看整体思路



1.收集文章(既然是从别人的文章的老数据里挖新东西,当然要先收集文章咯~)


2.对这些文章里报道的miRNA进行统计分析,在这里,作者用了一种名为robust rank aggregation的方法(在R语言中可以直接下载对应的package进行分析,PMID:22247279)


3.对筛选到的miRNA靶基因预测(作者可是用了TargetScan,PicTar,DIANA-microT-CDS三种工具进行预测,并且在三个结果中都一致的被认为是靶基因)


4.靶基因有了,接下来自然是代谢通路富集分析,确定筛选的miRNA是否与肺癌相关。


好了,整体思路就是上面四步,看起来是不是很简单。接下来我们一步一步看看作者是怎么做的。

1.收集文章

作者采用miRNA,LUNG,TUMOR,MIRNA等关键词进行组合,检索相关文献,同时在GEO数据库中检索数据集。在这过程中选择的均是英文文献,并且排除掉了仅采用一个细胞样本的文章。最终作者选择了20篇文献,具体情况见TALBE1(当然,附件里有更详细的情况。。。不过要自己去下文献咯。。)


2.统计分析文章里的miRNA在肿瘤和健康样本中的差异表达情况。

作者整理了这20篇文献中miRAN的表达情况(fig1,fig2),最终发现了157条上调miRNA,164条下调的miRNA,此外,还有50条miRNA在不同的报道中出现了不同的差异表达情况。



之后,作者就采用robust rank aggregation,对这些miRNA进行统计分析,最终发现了7条在肺癌样本中上调的miRNA,8条下调的miRNA(Table2)


3.进行靶基因预测。

作者采用了3个数据库对靶标基因进行预测,并且从starBase和TarBase中的实验数据进行了萃取(就是利用实验数据对预测结果进行筛选)。靶基因数据都在附件中,需要自己下载文献哟。。。


4.最后对靶基因的结果进行pathway富集分析。

大家都知道,靶基因预测会预测到很多基因,也就避免不了的会富集到各种各样的代谢通路中。作者最后选择了在各个miRNA靶基因富集结果中的交集(fig3,fig4.。还有附件信息哟。。。)。富集结果发现,富集结果主要与细胞信号(如EGF受体信号通路,wnt信号通路等),癌症相关等代谢通路之中。


好了,这篇文章到这里就结束了,最后作者就筛选结果进行了讨论,升华了一下文章。是不是感觉很简单?


其实,通过已有的文献报道对基因进行筛选,是一个很好的方法,一方面能够更加清楚的了解相关数据库的情况,另一方面,对自己所筛选到的新的基因的功能也能进行更好的预测。


就这篇文章而言,作者后续其实还可做很多事情,比如对所筛选到的miRNA的表达情况在细胞中进行进一步的确认,从而选出一个或两个更有意义的miRNA,这样筛出来的miRNA可能就可以作为肺癌的标志基因,甚至可能可以应用于临床检测。


此外,作者对miRNA的靶标进行了预测,作者完全可以在GEO上再筛选几个mRNA数据集进行分析,之后于靶标结果进行整合分析,从而完全了解miRNA-mRNA-lung cancer的作用机制。


除了上述的思路外,对于miRNA的研究还有很多方式,除了从已有的文章里整合出新的miRNA外,也可以自己去TCGA,GEO等数据库进行下载,然后用类似的方法进行分析,从而发现新的标志性miRNA。


END


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多