分享

手把手教你看富集分析结果之GO富集

 田明17grajsnth 2017-09-19

GOKEGG富集分析作为差异基因富集分析的双生花,从基因功能和通路分析两个侧重点解读差异基因的生物学功能,是数据解读的两大重要工具。

上次我们从认识KEGG信号通路图里的常见符号,数字以及图标的颜色三个方面介绍了KEGG信号通路图的基础知识(手把手教你看KEGG通路图!),使我们能读懂KEGG复杂信号通路这本天书,基于该结果解读我们研究的生物学问题。下面我们认识一下GO富集分析的真面目。

GO,Gene Ontology,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。我们使用GOseq软件,基于 Wallenius non-central hyper-geometric distribution数学模型,对差异基因进行GO富集分析。

案例

GO富集分析的结果主要有两种展现形式:柱状图和DAG(有向无环图),柱状图主要是对富集结果的统计,故在此我们主要挖掘反映GO term上下层级关系以及富集程度的DAG图,实例如下:


1.认识DAG图里的符号

2. 认识DAG图里的数字



3.认识DAG图里的颜色

图形的颜色反映了差异基因在GO term的富集程度,颜色越深富集越显著,红色最显著,黄色次之,无色代表富集不显著。   

通过以上三点我们看懂GO富集的天书,但是看懂不是目的,结合生物学问题对天书的解读是关键,基本原则如下:

  •  GO term分为三大类,每一类从不同的层面解释基因的生物学功能,我们可以结合生物学问题的特殊性,有针对性的关注GO term:例如我们期望从离子通道这一层面解释植物耐旱,耐盐的的机理,我们可以优先关注细胞组成里面膜蛋白。

  • GO term间具有包含关系,GO term之间可以构建复杂的结构网络。

    GO term 层级越低,功能描述越具体,越是低层级,越能解释生物学的问题,所以我们要关注显著富集的低层级GO term,以便具体而详尽的解释生物学问题。

  • GO富集分析的统计假设,并不能完全代基因功能的重要程度。要结合生物学问题、结合基因的功能注释,才能判断其中的基因变化是否有重要的生物学意义。


综上可知,GO富集分析结果的解读,应该从生物学意义的角度出发,Pvalue 和 Q value只是个参考而已(那些不显著的GO term也值得解读),真的不用太迷信哦!

记住,解决生物学问题才是数据解读的真正目的,富集分析只是从统计学上寻找核心基因。数据的功能注释角度的解读比统计学角度的解度更重要!!!


关于奥维森

奥维森基因科技是行业领先的跨组学技术合作伙伴,公司具有多年大项目合作经验的生物信息分析团队,及技术实力雄厚的研发团队。同时,公司还拥有多年相关行业经验的企业运营管理人才、有海外工作经历和海外留学背景的国际化人才以及国内外资深行业顾问团队。奥维森基因科技致力于将国际领先的基因组学和生物信息学技术相结合,提供优质、高效、性价比优的技术服务。




文案 | 吉老师

编辑 | 王小纪

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多