搜索

分享

QQ空间 QQ好友新浪微博微信

clusterprofiler

zhuqiaoxiaoxue 2016-07-11

展开全文

一：下载安装该R包

clusterProfiler是业界很出名的YGC写的R包，非常通俗易懂，也很好用，可以直接根据cuffdiff等找差异的软件找出的差异基因entrez ID号直接做好富集的所有内容；

Bioconductor网站上面有关于它的介绍，按照上面说的方式来安装即可

http://www./packages/release/bioc/html/clusterProfiler.html

source(“http:///biocLite.R”);biocLite(“clusterProfiler”)

二、输入数据

diff_gene.entrez文件，是通过各种差异基因软件找出来的差异基因的entrez ID号列表，每一个ID号一行，几百个差异基因就几百行

三、R语言代码

[R]

setwd(“C:\\Users\\Administrator\\Desktop\\ref”)
a=read.table(“diff_gene.entrez”)
require(DOSE)
require(clusterProfiler)
gene=as.character(a[,1])
ego <- enrichGO(gene=gene,organism=”human”,ont=”CC”,pvalueCutoff=0.01,readable=TRUE)
ekk <- enrichKEGG(gene=gene,organism=”human”,pvalueCutoff=0.01,readable=TRUE)
write.csv(summary(ekk),”KEGG-enrich.csv”,row.names =F)
write.csv(summary(ego),”GO-enrich.csv”,row.names =F)

[/R]

四、输出文件解读

看得懂R语言的都知道，这个代码输出了两个文件KEGG-enrich.csv和GO-enrich.csv，就是我们的GO和KEGG富集的结果，其中内容如下

上述表格为差异基因的Gene Ontology富集分析结果表格。

GO ID: Gene Ontology数据库中唯一的标号信息

Description ：Gene Ontology功能的描述信息

GeneRatio：差异基因中与该Term相关的基因数与整个该Term的总基因数的比值

BgRation：所有（ bg）基因中与该Term相关的基因数与所有（ bg）基因的比值

pvalue: 富集分析统计学显著水平，一般情况下， P-value < 0.05 该功能为富集项

p.adjust 矫正后的P-Value

qvalue：对p值进行统计学检验的q值

Count：差异基因中与该Term相关的基因数

上述表格为差异基因的KEGG Pathway富集分析结果表格。

ID： KEGG 数据库中通路唯一的编号信息。

Description ：Gene Ontology功能的描述信息

GeneRatio：差异基因中与该ID相关的基因数与整个该Term的总基因数的比值

BgRation：所有（ bg）基因中与该ID相关的基因数与所有（ bg）基因的比值

pvalue: 富集分析统计学显著水平，一般情况下， P-value < 0.05 该功能为富集项

p.adjust 矫正后的P-Value

qvalue：对p值进行统计学检验的q值

Count：差异基因中与该Term相关的基因数

在我的群里面共享了所有的代码及帖子内容，欢迎加群201161227，生信菜鸟团！

http://www./?p=1

线下交流-生物信息学
同时欢迎下载使用我的手机安卓APP

http://www./app/down/840375

本文固定链接: http://www./370.html | 生信菜鸟团

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： zhuqiaoxiaoxue > 《生物信息学》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

zhuqiaoxiaoxue

关注对话

TA的最新馆藏

[转] GEO数据挖掘小尝试：（三）利用clusterProfiler进行富集分析输入标题
[转] 第一作者 | 癌症大数据可视化的中国智造者，专访GEPIA和GE-mini APP作者唐泽方博士
[转] 中国制造:碉堡的TCGA可视化网站GEPIA
[转] 生物信息学常见1000个软件的安装代码！
[转] RNA和蛋白结合预测工具——catRAPID
LncRNA调控机制及研究策略

喜欢该文的人也喜欢更多

热门阅读换一换