分享

这么好用的TCGA数据下载工具?!

 微笑如酒 2017-04-28
2017-04-28 

页面很简洁,左边是癌症类型,右边选择样本类型,然后点检索

选择感兴趣的数据类型,即可进行下载

其中选择Clinical可以获取相应的临床信息,点击Clinical解析可以进行临床信息解析

解析完了之后,结果如下

导入EXCEL中结果如下

如果是RNA-seq的数据,可以将ENSG_ID转换成Gene_symbol合并文件功能则能将多个数据整合成数据矩阵

下面就TCGA数据库下载下来的数据名称作一个简单的介绍,更多的信息可以到官网上查看(https://wiki.nci./display/TCGA/TCGA+barcode)。

上图红框中的数字是样本类型,其中01-10是癌组织,11-19是正常组织。

有的时候我们下载的数据是这样的

同样的,01是癌组织,11是正常组织,在做进一步表达谱分析的时候,按照这个编号进行分组。

最后,关于TCGA数据库,本宫说两句。TCGA数据库相对于其他公共数据库(NCBI GEO数据库、SRA数据库、EBI-ArrayExpress数据库等)有着明显的优势:1、TCGA数据库样本量大,基本每种癌症都超过100例样本,这使得统计学意义更加显著;2、组学丰富,TCGA数据库对每个样本都分别做了转录组(RNA-seq、基因芯片、小RNA-seq)、基因组(突变)、表观组(甲基化)的分析;3、数据质量高,背景误差小;4、临床信息完善。但TCGA也有它的缺点:疾病研究方向窄,只包括33种癌症的研究,并且有些数据没有公开

网盘链接:http://pan.baidu.com/s/1sl34dC5 密码:s0m6

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多