分享

技术贴 | 微生太宏基因组报告解读 | 第六篇:功能分析-基于KEGG数据库

 微生态 2021-04-13

本文由阿童木根据实践经验而整理,希望对大家有帮助。

原创微文,欢迎转发转载。

导读

KEGG 数据库由Kanehisa Laboratories1995年推出,现在已经发展成为一个综合性数据库。KEGG数据库包含KEGG PATHWAY KEGG ORTHOLOGYKEGG ORTHOLOGY 数据库将行使相同功能的基因聚集成 Ortholog Groups (KO entries),每个KO表示一类同源基因的功能。KEGG PATHWAY是一组手工绘制的通路图,代表我们对分子相互作用、反应和关系的认识。KEGG PATHWAY 数据库将生物通路划分为 6 类:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems),其中每类又被系统分类为二、三、四层,第二层目前包括有 57个子Pathway;第三层是通路图;第四层是每个代谢通路图的具体注释信息。下面一起来看微生太宏基因组分析报告中基于KEGG数据库分析的部分结果。

一、功能丰度概况

根据数据库的注释结果,绘制各样品Pathway [level 1/2}/Module/KO的相对丰度统计图。下图是相对丰度前20Pathway Level1相对丰度柱形图,其中不同的颜色代表不同的 Pathway类别。

二、LEfSe差异分析

LEfSe是一种结合了非参数检验和线性判别分析的方法用于寻找可以区分多组样品的BiomarkerLEfSe分析结果中Pathway/Module/KOLDA>阈值,表示该功能在相应分组中丰度较高,在其他分组中丰度较低,可作为候选Biomarker。下图是PathwayLEfSe分析LDA柱形图

结果说明:

每一横向柱形体代表一个Pathway,柱形体的长度对应LDA值,LDA值越高则差异越大。柱形的颜色对应代谢通路ID是哪个分组的特征Pathway,特征Pathway表示在对应分组中丰度相对较高的Pathway。为了方便客户了解不同KEGG功能层级上的组间差异,微生太对各个功能层级进行LEfSe分析。

三、Pathway可视化

利用KEGG数据库还可以绘制自己感兴趣或者组间有显著丰度差异的Pathway图(如下),在通路图中可以标注各个分组的特征基因(Gene biomarker)。

另外,点击报告中网页文件可查看每个通路矩形节点的详细信息,鼠标悬在矩形框上可以看到对应通路节点有哪些KO在样本中检测到,以及这些KO是哪个分组的特征KO。网页形式如下: 

四、功能物种来源分析

LEfSe分析得到的差异Pathway/Module/KO结合HUMAnN2的分析结果,可进行功能物种来源分析,分析特征Pathway/Module/KO在每个样品的物种中的分布情况。下图是KO物种来源组成柱形图。其中横坐标对应样本,以及样本分组,不同分组用不同颜色标出。纵坐标对应各个样本该功能的相对丰度,不同物种来源用不同颜色标出。

五、聚类分析

Pathway/Module/KO的相对丰度表中筛选出最大丰度排名前20的功能,接着可以通过对多个样品的功能进行丰度聚类来考察Pathway/Module/KO丰度在不同样品或者分组间的相似或差异性。下图是Pathway聚类热图

六、 Circos图分析

Circos图可以用于展示每个样本中Pathway/Module/KO(丰度前10的比例,以及各个功能在各个样本中的比例。下图是Pathway在各个样本中的分布Circos图。其中左半圈为丰度最高的十个Pathway,每个Pathway内,不同颜色代表不同样本来源的比例;右边半圈为样本,样本内不同颜色代表不同Pathway的比例。

七、 相关分析

相关分析可用于分析环境因子或其它组学数据与宏组学数据之间的相关性。先选出丰度较高的Pathway/Module/KO,再计算环境因子与抗性基因间的Spearman相关系数进行,最后选出与环境因子相关最多的20Pathway,可以得到如下的Pathway与环境因子之间的相互关系热图。其中X轴上为环境因子,Y轴为PathwayR(相关系数)在图中以不同颜色展示,右侧图例是不同R值的颜色区间。* 0.01≤ P <0.05** 0.001≤P < 0.01*** P < 0.001

八、 RDA分析

RDA分析可用于研究环境因子、样品、功能三者之间的关系,寻找影响样品分布的重要环境驱动因子。RDA分析更多的描述请见前面的篇章。下是两种Pathway RDA分析的结果。

RDA(展示功能) 

RDA(展示样品)

感谢阅读~




你可能还喜欢

1 技术贴 | 微生太宏基因组报告解读(开篇)

2 技术贴 | 微生太宏基因组报告解读 | 第一篇:测序数据过滤

3 技术贴 | 微生太宏基因组报告解读 | 第二篇:物种组成分析

技术贴 | 微生太宏基因组报告解读 | 第三篇:物种分组统计分析

技术贴 | 微生太宏基因组报告解读 | 第四篇:PCoA、NMDS、RDA/CCA、相关分析

6 技术贴 | 微生太宏基因组报告解读 | 第五篇:EggNOG、CAZy、CARD等7大数据库助力宏基因组功能分析


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多