分享

非肿瘤WGCNA+机器学习+Mfuzz纯生信思路,轻松拿捏5+!

 智汇基因 2022-11-17 发布于广东

导语

今天给同学们分享一篇非肿瘤机器学习结合WGCNA分析鉴定关键基因的生信文章“Screening of potential biomarkers in peripheral blood of patients with depression based on weighted gene co-expression network analysis and machine learning algorithms”,这篇文章于2022年10月17日发表在Front Psychiatry期刊上,影响因子为5.435。近年来,抑郁症在世界范围内的患病率呈上升趋势,给患者和社会带来沉重负担。然而,可用于该疾病的诊断和治疗手段不足。因此,本研究的重点是识别抑郁症患者外周血中潜在的生物标志物。结果显示,外周血清中的 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 基因是抑郁症的可行诊断生物标志物。并在临床实践中为抑郁症的诊断和预防做出贡献。

1. 抑郁症患者外周血差异表达基因的鉴定

首先对样品进行标准化(图 1A),以获得抑郁症患者外周血清中的 550 个差异表达基因(DEG),这些 DEG 中有 242 个被上调,308 个被下调(图 1B)。在图 1C 中可视化了抑郁症和正常对照组之间具有最显着差异的前 30 个基因的表达。最后,550 DEGs 的 GSEA 产生了核糖体、蛋白质输出和抗叶酸途径(图 1D)。

图1 抑郁症患者外周血中DEGs的鉴定

2. 使用加权基因共表达网络分析筛选 Hub 基因

在样本聚类期间未检测到异常值。随后,将无标度拟合指数设置为 0.9,以获得构建无标度网络的最小软阈值 9(图 2A)。此外,特征因子大于 0.75 的模块被组合以获得四个模块(图 2B)。MM表示模块基因表达值与模块特征基因的相关性。GS表示模块基因与样本的相关性。通过计算 MM 和 GS 值将模块与临床特征相关联。棕色模块与抑郁症最相关(图 2C)。最后,棕色模块基因与 DEG 相交,产生 140 个与抑郁症相关的潜在目标(图 2D)。

图2 抑郁症相关的关键模块识别

3. 富集分析

GO 分析表明,这些靶标具有多种功能,如脂多糖结合、糖胺聚糖结合和内肽酶抑制剂活性。此外,它们还与特异性颗粒、特异性颗粒腔和分泌颗粒腔等多种CC相关,并参与抗菌体液反应、抗菌肽介导的抗菌体液反应和抗菌体液反应等多种BPs(图3A). KEGG 富集分析结果表明,这些靶基因主要通过信号通路富集,包括补体和凝血级联反应、癌症中的转录失调、金黄色葡萄球菌感染和造血细胞谱系(图 3C、D)。DO 分析显示,目标与心肌梗塞、动脉粥样硬化和动脉硬化性心血管疾病密切相关(图 3B)。

图3 潜在目标的功能分析

4. 构建蛋白质互质网络(PPI)

构建了潜在目标的交互网络(图 4)。该网络由 60 个节点和 133 条线路组成。影响其他基因的网络中心的几个基因包括 S100A12、ELANE、MMP9、MPO、LTF 和 FCGR1A。此外,该网络中的60个节点基因被选择用于后续的生物标志物筛选。

图4 PPI分析

5. 基于机器学习算法的抑郁症患者外周血生物标志物筛选

研究使用机器学习方法进一步研究 60 个关键目标中与抑郁症相关的潜在生物标志物。SVM-REF 分析表明,包含 58 个基因的模型具有最佳准确性(图 5A)。来自随机森林结果的前 10 个基因被选为候选生物标志物(图 5B)。此外,LASSO 回归模型是根据抑郁症和对照样本设计的。λ 分析强调该模型可以在 λ = 10 时准确预测抑郁症。因此,LASSO 分析产生了 10 个候选基因(图 5C)。最后,结合三种算法的结果,得出外周血中的 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 作为抑郁症相关的潜在生物标志物(图 5D)。

图5 基于机器学习的潜在生物标志物筛选

随后,通过整合每个基因的分数(图 6A)和校准曲线来评估患者被诊断为抑郁症的概率,还表明柱线图模型具有良好的预测能力(图 6B)。此外,DCA(图 6C)和 CIC(图 6D)直观地证明了柱状图在广泛且实用的阈值概率范围内具有优越的整体净收益,表明作者当前研究中获得的柱状图可以帮助临床医生更准确地评估患者的预后。以上结果表明,S100A12、TIGIT、SERPINB2、GRB10、LHFPL2均有潜力成为抑郁症的诊断生物标志物。

图6 列线图

6. 潜在生物标志物与基因集富集分析的相关性

相关性分析显示TIGIT与抑郁症患者的SERPINB2和GRB10表达水平呈显着负相关。此外,S100A12 与 LHFPL2 表达水平呈显着负相关,与 GRB10 表达水平呈显着正相关(图 7A)。随后,作者对五种潜在生物标志物进行了 GSEA 功能分析,并检测了包括核糖体功能、真核生物核糖体生物发生、蛋白质输出和抗叶酸抗性在内的多条通路,这与 DEG 功能分析结果一致。此外,还鉴定了促炎细胞因子和免疫细胞通路,如 IL-17、TNF、B 细胞受体和 T 细胞受体信号通路,表明炎症在抑郁症的发生和发展中起着关键作用。最后,如图 7B–F 所示,可视化了五种潜在生物标志物的 GSEA 功能分析结果。

图7 关键基因与富集分析的相关性

7. 免疫细胞浸润分析

首先,测量了抑郁症患者血清中22种不同类型免疫细胞的浸润状态(图8A)。随后,评估了这些细胞群之间的相关性(图 8B)。观察到 T 细胞 CD8 和嗜中性粒细胞之间存在很强的负相关性 (r = –0.68),而 B 细胞记忆和静止 T 细胞 CD4 记忆之间存在更强的正相关 (r = 0.49)。此外,还比较了抑郁症和正常对照组外周血中免疫细胞的浸润水平。免疫细胞如幼稚B细胞、T细胞CD8、静息肥大细胞在抑郁症组患者中表达明显增高,而记忆B细胞和T细胞CD4记忆静息在正常对照组患者中表达显着增高 (图 8C)。

图8 免疫浸润分析

GRB10 表达与嗜中性粒细胞、巨噬细胞 MO 和浆细胞的浸润状态呈正相关,而与幼稚 B 细胞和静息肥大细胞的浸润状态呈负相关。lHFPL2 表达与中性粒细胞、巨噬细胞 M2 和 B 细胞记忆的浸润状态呈正相关,与 B 细胞幼稚和 T 细胞 CD8 呈负相关。此外,S100A12 表达与巨噬细胞 MO、单核细胞和幼稚 B 细胞的浸润状态呈正相关,与嗜酸性粒细胞、B 细胞记忆和巨噬细胞 M2 的浸润状态呈负相关。SERPINB2 表达与浆细胞、中性粒细胞和 T 细胞 CD4 记忆静息的浸润状态呈正相关,与 T 细胞 CD8、肥大细胞静息和 B 细胞浸润状态呈负相关。此外,TIGIT 表达与 T 细胞 CD8、T 细胞 CD4 记忆激活和 B 细胞浸润状态呈正相关,与中性粒细胞浸润状态、B 细胞记忆和 T 细胞 CD4 记忆静息呈负相关。

图9 潜在生物标志物与抑郁症免疫浸润的关系

8. 潜在生物标志物的表达特征

作者进一步研究了 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 在抑郁症中的作用,并观察了它们在患者中的表达谱。100A12、SERPINB2、GRB10 和 LHFPL2 的表达水平在抑郁症组中较高,而 TIGIT 在正常对照组中表现出高表达谱(图 10A)。上述发现也在 GSE76826 数据集中得到验证(图 10B)。此外,作者在 Genencards 数据库中对抑郁症相关基因的搜索也证实了上述生物标志物与抑郁症密切相关。其中,S100A12、TIGIT、SERPINB2、GRB10、LHFPL2与抑郁症的相关性得分分别为4.356、4.232、3.064、1.516、0.698。

图10 潜在生物标志物的表达特征

9. 潜在生物标志物的调控机制

为了研究 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 的调控机制,预测了它们的转录因子,并构建了转录因子潜在生物标志物网络(图 11A)。S100A12 可能受 STAT3、GATA3 和 GATA2 调控;TIGIT 可能受 TP53、SRF 和 NR3C 监管;LHFPL2 可能受 TFAP2A、NFKB1 和 REL 的调控;SERPINB2 和 GRB10 可能受 JUN、FOXC1 和 IRF2 调控。随后,构建了一个 miRNA-潜在生物标志物网络(图 11B)以获得发挥关键调节作用的 miRNA,包括 has-mir-164a-5p。

图11 潜在生物标志物的调控机制

10. 治疗药物的预测

在 DSigDB 数据库的帮助下,基于抑郁症患者外周血清中的五种潜在生物标志物预测具有相关作用的药物。作者将预测结果中 P 值排名前 10 的药物视为具有生物标志物相互作用的潜在药物,包括亚硒酸二钠、米格列醇、哇巴因和毒胡萝卜素(图 12)。此外,作者还构建了药物对应的生物标志物网络(图13A),并选择与相关药物(8-氮鸟嘌呤)P值最小的药物密切相关的生物标志物(SERPINB2)作为代表进行分子对接,通过DockThor在线平台验证生物标志物与药物的结合水平,并通过PyMOL软件将结果可视化。结果表明,对接能量为–6.258 KJ/mol,在生物标志物和药物之间显示出良好的结合能力(图 13B)。

图12 药物预测结果

图13 药物-生物标志物网络和分子对接结果

11. 生物标志物临床诊断能力

基于 GSE98793 和 GSE76826 数据集的 ROC 分析表明,外周血清中的 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 有可能作为抑郁症的诊断生物标志物(图 14A、B)。其中,S100A12和GRB10均表现出突出的临床诊断能力。随后,对 GSE22132 数据集的 ROC 分析表明,S100A12 可能是外周血中抑郁症最有潜力的诊断标志物(图 14C)。

图14 生物标志物临床诊断能力

12. 最佳诊断生物标志物的 Mfuzz 表达模式聚类和功能分析

研究中,作者根据 S100A12 的表达水平对 Mfuzz 表达模式进行聚类,得到 50 个聚类结果(图 15),结合聚类模块的 ssGSEA 评分和表达特征,对抑郁组和正常组进行聚类 组(图 16)。类模块与 S100A12 之间的相关性(图 17),发现 Cluster6 是与 S100A12 联系最紧密的基因模块。

图15 Mfuzz 表达模式聚类结果

图16 抑郁组与正常组聚类模块ssGSEA评分及表达特征

图17 集群模块与S100A12的相关性

Cluster6模块基因的功能富集结果表明,这些基因参与免疫受体活性的调控,与动脉粥样硬化等疾病相关,与抑郁症潜在靶点的富集功能一致。此外,还发现了FoxO信号通路和mTOR信号通路,这可能有助于进一步了解抑郁症的病理机制(图18)。最后,作者将 ARG1、TPST1 和 F5 鉴定为与抑郁症中 S100A12 表达相关的关键基因(图 19)。

图18 GO、KEGG分析

图19 ARG1、TPST1 和 F5 作为与抑郁症中 S100A12 表达相关的关键基因

总结

作者使用三种机器学习算法将 S100A12、TIGIT、SERPINB2、GRB10 和 LHFPL2 确定为抑郁症患者外周血的潜在诊断生物标志物。其中,S100A12 是最有价值的诊断生物标志物。免疫浸润分析还发现免疫细胞与抑郁症密切相关。抑郁症的发生与免疫系统密切相关。因此,在未来的研究中,通过研究人体免疫系统的变化特征,可能为抑郁症的预防、诊断和治疗提供新的思路。此外,亚硒酸二钠和依普利农等抗抑郁药也被预测。总的来说,作者的研究结果有助于改善抑郁症的诊断和治疗。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多