导语 今天给同学们分享一篇非肿瘤WGCNA确定关键基因并构建预测模型的生信文章“Integrated Analysis of Weighted Gene Coexpression Network Analysis Identifying Six Genes as Novel Biomarkers for Alzheimer's Disease”,这篇文章于2022年7月26日发表在Oxid Med Cell Longev期刊上,影响因子为7.31。阿尔茨海默病(AD)是一种慢性进行性神经退行性疾病;然而,没有全面的治疗干预措施。因此,研究旨在确定新的分子靶点,以改善AD患者的诊断和治疗。使用WGCNA和LASSO模型,作者的研究结果提供了对生物标志物EIF3H、RAD51C、FAM162A、BLVRA、ATP6V1H和BRAF的作用的更好理解,并为进一步研究AD进展提供了基础。 图1 确定阿尔茨海默病关键模块和关键基因的工作流程 1. 富集分析 GSEA是使用来自AD和对照组的数据进行的,结果如图2所示。此外,作者发现AD组在ECM受体相互作用和NOTCH信号通路方面表现过多(图2(d))。 图2 GSEA分析 2. 差异基因的识别 为了识别显着影响AD的基因,作者首先从GEO数据库中获得了在AD患者和对照组之间差异表达的基因。发现其中2349个基因下调,2325个基因上调。使用火山图说明相关的DEG(图3(a))。图3(b)显示了代表前40个基因的热图。 图3 差异分析 3. WGCNA和关键模块和中心基因的识别 图4 WGCNA分析结果 4. 关键模块的GO和KEGG通路分析 为了更好地解释这些基因在blue模块中的潜在生物学作用,作者使用R软件中的“clusterProfiler”包对它们进行了GO和KEGG富集分析。此外,根据KEGG分析,blue模块中的基因在“神经变性途径-多种疾病”、“阿尔茨海默病”、“氧化磷酸化”、“蛋白酶体”和其他途径。可视化结果如图6所示。此外,作者利用Cytoscape根据KEGG信号通路和相应的富集基因建立了基因通路网络,如图7所示。该网络清楚地展示了多个信号通路与基因之间的相互作用和串扰。 图5 GO分析 图6 KEGG分析 图7 基因通路的相互作用网络 5.LASSO模型的建立和ROC曲线的评估 提取所选关键基因的表达谱并用于建立LASSO模型(图8(a))。然后,基于进一步对16个基因进行LASSO回归分析,并鉴定出6个基因(EIF3H,RAD51C,FAM162A,BLVRA,ATP6V1H和BRAF)。此外,作者通过创建使用AUC值指定的ROC曲线来评估LASSO模型的准确性。如图8(b)所示,基于六基因的模型的AUC值为0.940,表明这些基因可以作为AD的潜在生物标志物进行进一步测试。 图8 AD预测模型的建立及其验证 总结 综上所述,使用WGCNA和综合分析,研究提供了对生物标志物EIF3H、RAD51C、FAM162A、BLVRA、ATP6V1H和BRAF的作用的更好理解,并为进一步研究AD进展提供了生物学基础。对非肿瘤感兴趣的老师,欢迎扫码咨询! 生信分析定制服务 请扫描下方二维码 |
|