GeneOntology富集分析是高通量数据分析的标配,不管是转录组、甲基化、ChIP-seq还是重测序,都会用到对一个或多个集合的基因进行功能富集分析。分析结果可以指示这个集合的基因具有什么样的功能偏好性,进而据此判断相应的生物学意义。 GOEAST,去东方今天向大家推荐一款,中科院遗传所王秀杰老师组2008年发表的在线工具GOEAST ,访问网站是http://omicslab./GOEAST/index.php。GOEAST 自发表以来一直在更新维护,并且每周与Gene Ontology 网站同步GO注释数据库,保证分析结果的时效性和准确性。文章从发表至今,被引用504 次,总访问量近140万 次,总使用量近87万 次。 这款工具最初是为芯片研究开发的,有一些芯片分析特有的功能。但这次我们用到的是GOEAST 的Advance -Btach-Genes 功能。同时GOEAST 还支持多个GO 富集分析结果的比较和自定义背景数据集。 
GOEAST 使用很简单,用户只需提交常见的一组Gene Symbol 或Gene ID ,选择对应的物种 (支持动植物真菌细菌等59个物种),等待平均10 分钟即可获得结果。也可以输入邮箱,给自己的提交取一个名字,把多组基因分别上传,等着去邮箱查收结果就好了。


点击提交后,出现如下跳转页面。这页会自动更新程序运行信息,通常10 分钟左右即可获得结果。如果你填写了邮箱,也可以关掉此页面,在邮件中打开即可。 
结果页如下所示,包含3个PDF图(蓝色带下划线的Biological Process , Cellular Component , Molecular Function )和一个富集分析表格。 展示的富集分析图为常见的树形图样式,每个方格代表一个GO 条目,连线代表它们之间的层级关系,颜色越深表示富集越显著。 
上述的树图,能反应富集的GO 条目之间的层级关系,但图会较大,看着不太方便。通常会使用泡泡图来展示其中一部分最为富集的结果。这时就需要用到刚才生成的表格数据,点击Plain Text Format 下载表格数据,格式如下: 选择前面15行存储为文件goeast.txt 作为测试 (注意是tab 键分割的txt 文件),用R语言学习 - 富集分析泡泡图 (文末有彩蛋)和富集分析DotPlot,可以服中提到的方法绘图 (两篇文章结合着看,效果更佳)。 sp_enrichmentPlot.sh -f goeast.txt -o log_odds_ratio -T numeric -v Term -c p -s q -l p -a 12 -x 'Log odds ratio' -y 'GO description' -w 12 -P 'c(0.75,0.45)'

后期的文章图修改可参考教师节献礼 - 文章用图的修改和排版 命令行下的基因富集分析如果你是在命令行下做富集分析,出门左拐找clusterprofiler 。 宏基因组,专业菌群分析公众号点击宏基因组学习专业菌群分析。
点击原文链接直达富集分析界面。
|