分享

TCGA数据库Counts和FPKM以及FPKM

 ypgao 2018-04-19

首选你得知道如何进入TCGA数据库,知道如何选择需要的癌症分类,和数据类型,在选择基因表达的时候,经常遇到一个问题,有个选项:HTSeq-Counts,HTSeq-FPKM,HTSeq-FPKM-UQ,不少学员对此产生困惑,这里究竟应该如何选择,每个选项究竟是什么意思。

counts数据

简单的讲,Counts是数据后台没有处理的原始表达量,而FPKM和FPKM-UQ是两种数据处理方法,也就是说,如果下载Counts数据,是表达量数据,如果下载FPKM数据,那么要注意这些数据是经过处理的。正常情况下,我们下载Counts数据就可以了,特殊情况选择FPKM数据也是可以的。

接下来我们来看看FPKM的具体概念,究竟是什么样的处理结果:

FPKM

下载数据后,在数据分析时,用的方法也是不同的,Counts数据一般使用edgeR包或DESeq包,对数据做分析;如果下载FPKM数据,就不能使用edgeR包,只能只用DESeq包进行处理。

在使用edgeR包做Counts数据处理时,是需要对数据进行normalize的,所以我们在下载数据时,下载counts是比较常用的。

责任编辑:森莘 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多