分享

浅谈GSEA分析和KEGG富集分析的异同

 非idpeiv46d5b6 2020-01-06

今天实验室有个师妹问我这个问题,好久不做生信的我想了一会,觉得这个问题对于比较少接触生信的同学们来说应该比较费脑筋。借此,我简单说一下,详细的可以自行百度~

GSEA:即基因探针富集分析,是通过基础知识来揭示基因组表达数据的一种方法。

简单来说它可以以KEGG数据库(或其他基因注释数据库,例如GO)为背景,根据所选样品所有的基因表达量来做富集分析,得到的结果是所有表达的基因在各个代谢通路中的富集情况。

KEGG:KEGG 是了解高级功能和生物系统(如细胞、 生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源。

我们通常用这个数据库做代谢通路富集分析(kegg pathway富集分析),主要算法是先挑选出显著差异表达的基因,然后利用超几何分布等统计算法根据通路的差异基因数目计算该通路是否显著的P值(一般还要校验得到Q值),根据Q值由小到大排序即得到显著程度。

说白了,GSEA的输入变量是基因表达量,KEGG pathway富集分析的输入变量是基因列表;二者都能筛选出显著富集的通路,区别是GSEA针对所有基因,KEGG针对差异基因富集的通路,现在一般结合两者的结果来做推断。

以上是我的个人理解,也没有详细查资料,如需详细了解,还请入木三分~~O(∩_∩)O

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多