分享

GEO数据挖掘经典套路文章

 生物_医药_科研 2019-12-15

摘要

宫颈癌是全球女性第四大恶性肿瘤,宫颈鳞状细胞癌(CESC) 是宫颈癌最常见的组织学类型。基因的失调在癌症中起着重要作用。在本研究中,我们从基因表达综合数据库的 GSE63514数据集中筛选出CESC的差异表达基因 (DEGs)。采用整合的生物信息学分析选择 hub 基因,以及研究其相关的预后标签、功能注释、甲基化机制和候选分子药物。结果共鉴定出1907个差异表达基因(上调944个,下调 963 个)。在蛋白质-蛋白质相互作用网络中,鉴定出3个中心模块和30个中心基因。并通过加权基因共表达网络分析从4个CESC相关模块中筛选出2个hub模块和116个hub基因。基因本体论术语丰富分析和京都百科全书的基因和基因组的途径分析被执行以便更好地理解功能和途径。通过预后特征分析发现具有显著预后价值的基因。并且有5个基因(EPHX2、CHAF1B、KIAA1524、CDC45和RMI2)在表达验证和生存分析后被确定为显著的CESC相关基因。其中,EPHX2和RMI2被认为是CESC 相关甲基化和表达的两个新的关键基因。此外,还定义了4种CESC候选小分子药物(喜树碱、白藜芦醇、伏立诺他和曲古抑菌素 A)。

研究结果

图1

图1:我们研究的数据准备、处理和分析。

图2

图2:GSE63514 中识别的差异表达基因。 

CESC组织与正常宫颈组织差异表达基因的火山图。火山图的红色点代表上调,绿色图代表下调 (a)。根据|logFC|值的前200个DEGs的热图。热图中的颜色从绿色到红色显示了从低表达到高表达的进展 (b)。 

  • CESC:宫颈鳞状细胞癌

  • DEGs:差异表达基因

  • logFC:对数倍数变化

图3

图3:在MOCDE 中评价的PPI网络的前三个枢纽模块,红色圆圈代表上调基因,蓝色圆圈代表下调基因。 

  • MCODE 1 包含 56 个节点和 1452 个边 (a)。 

  • MCODE 2 包含 17 个节点和 136 个边 (b)。 

  • MCODE 3 包含 27 个节点和 206 个边 (c)。 

  • MCODE1-3 (d‐e) 中基因富集分析中的重要GO 术语。 

  • GO:基因本体论

  • PPI:蛋白质-蛋白质相互作用

图4

图4:指定模块颜色的DEGs聚类树状图 (a)。模块特征基因的聚类 (b)。每个模块的Modul‐trait 关系。每个细胞中的上数是指性状中各模块的相关系数,下数是相应的 p 值。模数-性状图中的颜色(从绿色到红色)显示了与CESC(c) 的相关性(从阴性到阳性)。CESC:宫颈鳞状细胞癌;DEGs:差异表达基因

图5

图5:蓝色模块中的模块成员(蓝色模块中GS与MM的散点图)。

(a)brown 模块中的模块成员(brown模块中GS与MM的散点图)(b)。所有基因的网络热图图。层次聚类树状图的分支对应于每个模块。树状图下方和右侧的色条显示彩色编码的模块成员。饱和度较高的黄色和红色表示热图中高度共表达的互连性 (c)。合并模块特征基因的聚类和邻接点 (d) 的热图图。GS:基因显著性;和MM:模块成员;CESC:宫颈鳞状细胞癌

图6

图6:高危组与低危组总生存期的Kapla‐Meier生存曲线 (a)。5 年生存时间依赖性 ROC 曲线。我们获得的5个基因标记的AUC为0.719 (b)。训练数据集 (c‐e) 中患者的5个基因特征、生存状态和5 个基因表达谱的分布。AUC:曲线下面积;ROC:受试者工作特征

图7

图7:基因 EPHX2 甲基化的表达箱线图 (a)。基因 RMI2 甲基化的表达箱线图 (b)。基因RMI2甲基化的Kaplan–Meier生存曲线 (c)。基因 RMI2 甲基化和表达组合的Kaplan–Meier生存曲线 (d)。

图8

图8:四种CESC候选小分子药物的断层图像。氨苄西林 (a)、白藜芦醇 (b)、伏立诺他 (c) 和曲古抑菌素 (d)。CESC:宫颈鳞状细胞癌

结论

需要进一步研究探索这些重要的CESC 相关基因在诊断、预后和靶向治疗方面的潜力。

DOI:10.1002/jcp.28731

参考文献

[1].Aparicio, T., Ibarra, A., & Méndez, J. (2006). Cdc45‐MCM‐GINS, a new power player for DNA replication. Cell Division, 1, 18. 

[2].Bahrami, A., Hasanzadeh, M., Shahidsales, S., Farazestanian, M., Hassanian, S. M., Moetamani ahmadi, M., … Avan, A. (2018). Genetic susceptibility in cervical cancer: From bench to bedside. Journal of Cellular Physiology, 233(3), 1929–1939. 

[3].Bandettini, W. P., Kellman, P., Mancini, C., Booker, O. J., Vasu, S., … Leung, S. W., et al. (2012). MultiContrast Delayed Enhancement (MCODE) improves detection of subendocardial myocardial infarction by late gadolinium enhancement cardiovascular magnetic resonance: A clinical validation study. Journal of Cardiovascular Magnetic Resonance, 14, 83. 

[4].Chabanais, J., Labrousse, F., Chaunavel, A., Germot, A., & Maftah, A. (2018). POFUT1 as a promising novel biomarker of colorectal cancer. Cancers (Basel), 10(11), 411.

END

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多