GO富集介绍 具体介绍: 概念明晰: 为什么做基因富集分析? 富集分析一般包括以下步骤:1.GO分析根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO 返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。 GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。 2.Pathway分析根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集。 3.基因网络分析目的:根据文献,数据库和已知的pathway 寻找基因编码的蛋白之间的相互关系(不超过1000 个基因)。 GO数据的分析GO官网的Term enrichment services提供丰富的GO terms分析,可以帮助研究者找到所提交的基因集中是否具有共同的GO术语或者有共同的上级GO术语(某些基因都在某个GO术语子集里),以帮助发现哪些输入基因可能具有某些共同特点(比如说都在某个催化反应中起作用,都是某类细胞器的组成成分,都在某个通路里执行功能等)。 当然,也许我们发现了(获得了)一些基因,想知道他在某一个物种里在哪些部分发挥功能,他在GO术语库中归属于哪一个目录层次,这时GO富集就起作用了。 到哪里找呢?
640.jpg
实例展示以下为实例展示GO数据库自带富集功能,以具体感觉富集的含义: 下面以一份蛋白质ID集为例,命名为protein.txt,格式为每行一个蛋白质ID, 740.jpg
展示一:GO slimmer设置如下: 840.jpg
上述设置你要研究的目标基因或基因产物集(protein.txt),基因ID的格式为UniProtKB,要研究的GO参考集(背景集)是宏基因GO条目,提交,等待结果。 940.jpg
生物过程、细胞组分或者分子功能三大类里的GO术语选一个, 640.jpg
本术语相关的术语: 640 (1).jpg
可以用不同形式展示,选择图表展示(graph view)如下: 740.jpg
在QuickGO里边查看: 子术语(Child Terms),注释等条目也都会一一列出来,更多信息各位可以自己去试试,在此以祖先图表(Ancestor Chart)为例展示: 可以看到祖先图表(Ancestor Chart)一栏,点选表格选项(chart options)可以看到更详细的图标内容,如下: 90.jpg
局部放大如下: 91.jpg
可以看到各个GO term子集的GO ID以及GO功能,连线的不同颜色代表不同的隶属关系,方框中的颜色条也代表不同物种等属性,这个具体的说明图例已经给出来了,如下: 92.jpg
展示二:Enrichment analysis93.jpg
提交,结果如下: 94.jpg
可以看到protein.txt里的蛋白质在这么多通路中起作用,最显著的是黄颜色这个蛋白质,可以说显著表达了。 其他的选项比如功能分类: 666.jpg
Protein.txt里的蛋白主要还是起结合蛋白作用(对应归类到binding这一GO术语中)的。GO数据库提供了其他几项选项,想要详细了解的可以自己试一下。 总结Gene Ontology(GO)包含了基因参与的生物过程,所处的细胞位置,发挥的分子功能三方面功能信息,并将概念粗细不同的功能概念组织成DAG(有向无环图)的结构。GO常用于提供基因功能分类标签和基因功能研究的背景知识。利用GO的知识体系和结构特点,旨在发掘与基因差异表达现象关联的单个特征基因功能类或多个特征功能类的组合。 GO富集可以提供基因差异筛选的候选集,也可以帮助了解前景基因集在功能上的富集,得出基因潜在的可能功能。可以帮助研究者找到所提交的基因集中是否具有共同的GO术语或者有共同的上级GO术语(某些基因都在某个GO术语子集里),以帮助发现哪些输入基因可能具有某些共同特点(比如说都在某个催化反应中起作用,都是某类细胞器的组成成分,都在某个通路里执行功能等)。 原文:GO富集分析 |
|