GO和KEGG富集分析作为差异基因富集分析的双生花,从基因功能和通路分析两个侧重点解读差异基因的生物学功能,是数据解读的两大重要工具。 上次我们从认识KEGG信号通路图里的常见符号,数字以及图标的颜色三个方面介绍了KEGG信号通路图的基础知识(手把手教你看KEGG通路图!),使我们能读懂KEGG复杂信号通路这本天书,基于该结果解读我们研究的生物学问题。下面我们认识一下GO富集分析的真面目。 GO,Gene Ontology,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。我们使用GOseq软件,基于 Wallenius non-central hyper-geometric distribution数学模型,对差异基因进行GO富集分析。 GO富集分析的结果主要有两种展现形式:柱状图和DAG(有向无环图),柱状图主要是对富集结果的统计,故在此我们主要挖掘反映GO term上下层级关系以及富集程度的DAG图,实例如下: 1.认识DAG图里的符号 2. 认识DAG图里的数字 3.认识DAG图里的颜色 图形的颜色反映了差异基因在GO term的富集程度,颜色越深富集越显著,红色最显著,黄色次之,无色代表富集不显著。 通过以上三点我们看懂GO富集的天书,但是看懂不是目的,结合生物学问题对天书的解读是关键,基本原则如下:
综上可知,GO富集分析结果的解读,应该从生物学意义的角度出发,Pvalue 和 Q value只是个参考而已(那些不显著的GO term也值得解读),真的不用太迷信哦! 记住,解决生物学问题才是数据解读的真正目的,富集分析只是从统计学上寻找核心基因。数据的功能注释角度的解读比统计学角度的解度更重要!!! 奥维森基因科技是行业领先的跨组学技术合作伙伴,公司具有多年大项目合作经验的生物信息分析团队,及技术实力雄厚的研发团队。同时,公司还拥有多年相关行业经验的企业运营管理人才、有海外工作经历和海外留学背景的国际化人才以及国内外资深行业顾问团队。奥维森基因科技致力于将国际领先的基因组学和生物信息学技术相结合,提供优质、高效、性价比优的技术服务。 文案 | 吉老师 编辑 | 王小纪 |
|
来自: 田明17grajsnth > 《Go KEGG》