一、基于统计学的关联分析 1. 关联热图 通过计算代谢物与菌群(或者功能蛋白)之间Pearson相关系数或spearman等级相关系数及其显著性差异,来分析代谢物与菌群(或者功能蛋白)之间的相关性。 2. 关联散点图 通过计算代谢物和菌群(或功能蛋白)之间的Pearson或Spearman相关系数,获得具有较强关联的代谢物和菌群(或功能蛋白),同时展示各个样本在代谢物与菌群(或功能蛋白)影响下的相对分布。 3. 受试者工作特征曲线 (receiver operating characteristic curve,ROC曲线) 在两种不同的判定标准下对同一信号刺激的反应结果,曲线上各点反映着相同的感受性,以假阳性概率(False positive rate)为横轴,真阳性(True positive rate)为纵轴所组成。ROC曲线表达了潜在标记代谢物和菌群物种对不同组别的识别分类能力。 4. 冗余分析(Redundancy analysis, RDA) 一种回归分析结合主成分分析的排序方法,也是多相应变量回归分析的拓展。基本上来讲,RDA展示了相应标量与解释变量之间多元多重线性回归的关系。 二、基于代谢通路的关联分析 1. 基于KEGG(https://www.)数据库中已经绘制好的代谢通路,将感兴趣的代谢物,或基因、蛋白,在代谢通路上通过不同颜色显著标示,从而清楚知晓感兴趣的代谢物或基因、蛋白之间在代谢基础上的相互关系。 2. 对感兴趣代谢物和基因(蛋白)进行Pearson或Spearman相关性分析,及其显著性检验,通过不同节点(代谢物,基因或蛋白)之间的连线颜色来表示关联的正负相关,并根据代谢通路的共同性,对不同节点(代谢物,基因或蛋白)进行聚类。 |
|