一:下载安装该R包 clusterProfiler是业界很出名的YGC写的R包,非常通俗易懂,也很好用,可以直接根据cuffdiff等找差异的软件找出的差异基因entrez ID号直接做好富集的所有内容; Bioconductor网站上面有关于它的介绍,按照上面说的方式来安装即可 http://www./packages/release/bioc/html/clusterProfiler.html source(“http:///biocLite.R”);biocLite(“clusterProfiler”) 二、输入数据 diff_gene.entrez文件,是通过各种差异基因软件找出来的差异基因的entrez ID号列表,每一个ID号一行,几百个差异基因就几百行 三、R语言代码 [R]
[/R] 四、输出文件解读 看得懂R语言的都知道,这个代码输出了两个文件KEGG-enrich.csv和GO-enrich.csv,就是我们的GO和KEGG富集的结果,其中内容如下 上述表格为差异基因的Gene Ontology富集分析结果表格。 GO ID: Gene Ontology数据库中唯一的标号信息 Description :Gene Ontology功能的描述信息 GeneRatio:差异基因中与该Term相关的基因数与整个该Term的总基因数的比值 BgRation:所有( bg)基因中与该Term相关的基因数与所有( bg)基因的比值 pvalue: 富集分析统计学显著水平,一般情况下, P-value < 0.05 该功能为富集项 p.adjust 矫正后的P-Value qvalue:对p值进行统计学检验的q值 Count:差异基因中与该Term相关的基因数 上述表格为差异基因的KEGG Pathway富集分析结果表格。 ID: KEGG 数据库中通路唯一的编号信息。 Description :Gene Ontology功能的描述信息 GeneRatio:差异基因中与该ID相关的基因数与整个该Term的总基因数的比值 BgRation:所有( bg)基因中与该ID相关的基因数与所有( bg)基因的比值 pvalue: 富集分析统计学显著水平,一般情况下, P-value < 0.05 该功能为富集项 p.adjust 矫正后的P-Value qvalue:对p值进行统计学检验的q值 Count:差异基因中与该Term相关的基因数 在我的群里面共享了所有的代码及帖子内容,欢迎加群201161227,生信菜鸟团! http://www./?p=1 线下交流-生物信息学 http://www./app/down/840375 本文固定链接: http://www./370.html | 生信菜鸟团 |
|
来自: zhuqiaoxiaoxue > 《生物信息学》