GO,Kegg,GSEA富集分析神包clusterprofiler

杉杉之园 2017-09-20

展开全文

原来本菜鸟做玩差异分析后通路注释都是喜欢跑到DAVID里面的网页搞定，感觉还要整理表格之类，贼烦。最近翻了翻群主大大的富集分析帖子，发现了该bioconductor神包clusterprifiler，于是参照群主自己探索了一下用法，确实太好用了，代码非常简单和简洁。据说写该包的作业也是NB人物。

接下来切入正题：先要转化成entrezID，这个参考博客中的http://www./thread-404-1-1.html，大神写很清楚了
                              1.做GO和KEGG：

接下来就是clusterprofiler的函数：

library(clusterProfiler)
ego=enrichGO(OrgDb="org.Hs.eg.db", gene = gene1,pvalueCutoff = 0.01,readable=TRUE)#一行代码完成GO富集，gene1就是上图的entrezID的list
Pvalue可自己调节
接下来输出结果：
write.csv(summary(ego),"G-enrich.csv",row.names =F)
同样的KEGG:
ekk <- enrichKEGG(gene       = gene1,
               organism    = 'hsa',
               pvalueCutoff = 0.05)
write.csv(summary(ekk),"KEGG-enrich.csv",row.names =F);

那么这样我们就用4行代码完成了GO和kegg的富集分析。

后面我在bioconductor的Rscript里还发现这包还能玩GSEA富集.....（TM好强啊我去）
代码也是极其简单的：
gmtfile <- system.file("extdata", "c5.cc.v5.0.entrez.gmt", package="clusterProfiler")
c5 <- read.gmt(gmtfile)#前面俩行大概就是来选择GSEA的数据库用的，c5.cc.v5.0.entrez.gmt这里他事例用的是GO的cc数据库，这个可以调整的，参考GSEA的网站来选择

egmt <- enricher(gene1, TERM2GENE=c5)
write.table()write.csv(summary(egmt),"Gsea-enrich.csv",row.names =F)#后面俩行就调整你的GENElist，我这里是上述的gene1。

到此，GO，Kegg，GSEA完成。这包真的是强。。。。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：杉杉之园 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多