分享

分析TCGA数据库的工具这么多,我就只服这一个!

 yjt2004us 2017-11-20

众所周知,以TCGA数据库为主的大数据挖掘很火,通过数据挖掘我们可以发SCI文章(比如有哪些文章让你觉得:这样就可以的话,那我也能发!),也可以为申请基金提供思路(比如师兄最近在各地的讲座:〔免费讲座|成都、重庆〕非编码RNA数据挖掘、国自然来了),当然关于TCGA的数据挖掘,公众号上也介绍了很多工具(比如TCGA数据库挖掘分析,这个网站好用到爆!有没有网站可以分析miRNA与患者预后的关系?生存分析,这个网站还不错!懒人怎么做肿瘤病人的生存分析?等),依凡老师还专门为大家录制了数据挖掘的课程(单击文末链接购买查看)。


今天给大家介绍一个闻着伤心听着落泪的网站,分析TCGA数据的工具这么多,我只服这一个,让人不得不感叹,做肿瘤真好!


这个网站是新上线的一个网站:LinkedOmics,网址:http://www./     主页打开后是这样的:

具体功能太强大,且听我慢慢道来。


首先大家需要先注册账户,在右上角,具体注册方法就不说了。注册后登录打开界面是这样的:

整个分析一共包括五步:

(1)选择肿瘤类型,一共收录了32个癌种的各个类型的数据,比如我们选择肝癌LIHC:

(2)选择数据类型,我们可以看到数据的类型有microRNA,SNP,甲基化,临床数据和突变,我们先演示microRNA的,所以选第一个:

第二步里面还有一个可选项目:样本类型,可以进一步对样本根据分子分型、分期等数据进行分析,打开是这样的:

可以进一步选择,我们在演示的时候就不选了。

(3)选择数据属性,可以选择具体的microRNA,我们以hsa-mir-125a为例:

(4)选择靶数据类型,同样我们可以选择前面的数据:

比如我们想看hsa-mir-125a与临床信息的关系,我们选下Data type为Clinical的选项即可。

(5)选择统计方法,一般会给出几个选项,比如这个:

选好后接下来就是分析了,

我们看一下:

单击View按钮:

就可以看到hsa-mir-125a与临床信息的关系了,比如生存分析、TNM分期、种族等:

当然,在第四步我们选择靶数据类型的时候,我们可以换成其它的数据,比如RNAseq的数据,我们来找一下hsa-mir-125a的靶基因:

统计方法我们选个spearman相关性分析:

提交后查看数据是这样的:

我们可以单击某个基因看hsa-mir-125a与该基因表达相关性,在下面有两张图展示的是与hsa-mir-125a表达正相关和负相关的基因热图,

我们挑选第一个基因MLXIPL进行搜索:

然后查看他们表达的相关性结果:

至于MLXIPL是不是hsa-mir-125a的靶基因以及在肝癌中的作用如何,大家就可以通过targetscan等软件预测并验证了。


当然,这里还有一个相关基因的功能富集,分别是ORA和GSEA:

我们选GSEA看看,

富集分析的选项包括了GO分析等:

我们选个KEGG pathway吧,提交后大家要等一下:

好了以后的界面:

结果可下载可查看:


好了,网站的功能还有很多,大家自己探索吧。


用好这个网站,文章基金神马的都不是事儿! 最后,大家用的时候记得引用文章:

LinkedOmics: analyzing multi-omics data within and across 32 cancer types.Nucleic Acids Res. 2017 Nov 9. doi: 10.1093/nar/gkx1090. 


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多