大型的国际项目如TCGA,GTEx创造出了大量的转录组数据,为人们提供了数据挖掘、理解基因功能的机会。为了让没有生物信息学背景的研究人员也能够轻易获取、分析生物大数据,北京大学张泽民教授实验室的唐泽方等人通过 R 、Perl等语言对数据进行处理、可视化,设计了癌症大数据分析网站GEPIA 。研究人员能够通过GEPIA来提出问题或是验证假设。 GEPIA提供了关键的交互分析和定制功能,包括肿瘤/正常差异表达谱分析、剖面绘制、病理分期、患者生存分析,相似基因检测分析和降维分析。通过简单的点击GEPIA 就可以进行综合全面的表达分析。接下来我们就详细地介绍下: 1、首先,打开网站:/ 2、输入你关注的基因,例如'KRAS'。打开后显示该基因在人体的表达情况: 也可以查看该基因在不同肿瘤中的表达情况: 查看该基因在癌组织与癌旁组织中的表达情况: 3、点击differential gene,可以用ANOVA来统计某种肿瘤中的差异基因 差异基因有不同的显示形式,如下图是在染色体中的位置,此外差异列表也可以以箱线图的方式显示: 4、GEPIA还能搜寻共表达基因,选择肿瘤和对应的正常组织,就能看共表达趋势了: 接下来就可以看到共表达的散点图: |
|