分享

GEPIA:TCGA和GTEx表达谱数据分析平台

 生信修炼手册 2019-12-24

GEPIA整合了来自TCGA和GTEx项目中的基因表达谱数据,提供了多种数据分析和可视化功能,操作简单,方便广大科研人员对肿瘤的表达谱数据进行挖掘,对应的文章发表在Nucleic Acids Research,链接如下

https://academic./nar/article/45/W1/W98/3605636

该web平台的网址如下

http://gepia./index.html

通过首页的检索框,可以快速检索单个基因的相关结果

TP53为例,结果如下

1. General

这部分对基因的功能进行了简单描述,同时给出相关数据库的链接,示意如下


右侧的body map中红色代表肿瘤患者, 绿色代表正常个体,给出了在不同组织中的表达量,颜色越深,对应的表达量越高,鼠标点击可以看到具体的表达量。

还给出了不同肿瘤中正常样本和肿瘤样本中表达量的对比图,每个点代表一个样本,如下所示

还有柱状图,取了所有样本的平均值,示意如下

无论是哪种可视化方式,都是用于直观的查看肿瘤和正常个体间该基因表达量的差异。

2. Differential Genes

该部分分析在特定肿瘤中正常样本和肿瘤样本中的差异表达基因,可以自己定义差异基因分析的算法和对应的阈值,示意如下

点击List查看差异基因对应的表格数据,示意如下

点击Plot显示差异基因在各个染色体上的分布,示意如下

3. Expression DIY

这部分自己选择感兴趣的肿瘤,查看该基因的表达量在多种肿瘤中的分布,提供了dotplot, boxplot, viovlin plot等展现形式,示意如下


如果输入多个基因列表,还可以以热图的形式进行可视化,示意如下

T代表tumor, N代表normal, 对多种肿瘤中肿瘤患者和正常样本的表达量进行了可视化。

4. Survival

这部分进行生存分析,可以绘制如下所示的生存曲线

还可以分析与生存状态相关的差异基因,结果如下所示

5. Correlation

这部分用于分析两个基因间的相关性,可以自己挑选样本,指定相关系数的算法,结果如下所示

6. PCA

这部分进行PCA分析,指定多组样本,然后根据输入的基因的表达量进行PCA分析,可以生成2D和3D PCA的图,结果如下所示



其核心的差异分析和生存分析等功能,已经可以满足绝大多数TCGA数据挖掘的需求,多种可视化结果更是锦上提花。如果只是对肿瘤的表达谱数据进行挖掘,GEPIA可以称得上是最简便的平台。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多