分享

想发高分文章,应该怎样做组学数据的整合分析?

 生物_医药_科研 2019-04-02

一、基于统计学的关联分析

1. 关联热图

    通过计算代谢物与菌群(或者功能蛋白)之间Pearson相关系数或spearman等级相关系数及其显著性差异,来分析代谢物与菌群(或者功能蛋白)之间的相关性。

2. 关联散点图

    通过计算代谢物和菌群(或功能蛋白)之间的Pearson或Spearman相关系数,获得具有较强关联的代谢物和菌群(或功能蛋白),同时展示各个样本在代谢物与菌群(或功能蛋白)影响下的相对分布。

3. 受试者工作特征曲线 (receiver operating characteristic curve,ROC曲线)

    在两种不同的判定标准下对同一信号刺激的反应结果,曲线上各点反映着相同的感受性,以假阳性概率(False positive rate)为横轴,真阳性(True positive rate)为纵轴所组成。ROC曲线表达了潜在标记代谢物和菌群物种对不同组别的识别分类能力。

4. 冗余分析(Redundancy analysis, RDA)

    一种回归分析结合主成分分析的排序方法,也是多相应变量回归分析的拓展。基本上来讲,RDA展示了相应标量与解释变量之间多元多重线性回归的关系。

二、基于代谢通路的关联分析

1. 基于KEGG(https://www.)数据库中已经绘制好的代谢通路,将感兴趣的代谢物,或基因、蛋白,在代谢通路上通过不同颜色显著标示,从而清楚知晓感兴趣的代谢物或基因、蛋白之间在代谢基础上的相互关系。

2. 对感兴趣代谢物和基因(蛋白)进行Pearson或Spearman相关性分析,及其显著性检验,通过不同节点(代谢物,基因或蛋白)之间的连线颜色来表示关联的正负相关,并根据代谢通路的共同性,对不同节点(代谢物,基因或蛋白)进行聚类。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多