分享

文献讲解WGCNA研究思路,拿走不谢

 生物_医药_科研 2019-06-03

通过共表达分析鉴定了与胰腺癌的进展和预后

相关的10个hub基因

Ten hub genes associated with progression and prognosis of pancreatic carcinoma identified by co-expression analysis.

亲爱的小伙伴们,好久不见了呦,甚是想念,今天为大家分享一篇有关胰腺癌的进展以及预后研究的文章,该文章于2018年发表在International Journal of Biological Sciences杂志上,

影响因子为4.057。

首先,小编先带大家简单了解一下该文章的目的以及主要内容,我们知道胰腺导管腺癌(PDAC)是癌症死亡的第四大原因,并且时刻威胁着人类的健康,因此作者对胰腺癌进行了研究。首先,作者选择数据集GSE62452进行差异表达分析,应用WGCNA对得到的差异表达基构建共表达网络,筛选出了与PDAC分期相关的模块。然后作者结合共表达网络和PPI网络,筛选了36个候选基因。接下来,作者在使用GSE62452和TCGA数据集进行生存和回归分析后,鉴定了与PDAC进展密切相关的10个hub基因(CCNA2,CCNB1,CENPF,DLGAP5,KIF14,KIF23,NEK2,RACGAP1,TPX2和UBE2C)。作者根据Oncomine数据库和HPA,发现以上分析得到的hub基因在转录和翻译水平上与正常组织相比在胰腺癌中过表达,并绘制了ROC曲线并计算AUC以区分复发和非复发PDAC。最后,作者进行了功能富集分析和GSEA分析,两者均表明细胞周期在PDAC中起着至关重要的作用。

该研究的流程图如下所示:

结果展示:

结果一:训练集的评估以及临床数据

作者应用WGCNA R包进行质量检查,没有从GSE62452数据集中去除数据并基于PDAC中肿瘤样本和非肿瘤样本之间差异表达基因的表达数据进行了聚类。图中显示了4种类型的临床数据,包括组织学分级,肿瘤病理分期,生存月数和PDAC患者的生存状态。

结果二:DEGs筛选

作者在数据预处理和质量评估之后,从训练集GSE62452中的69个样本中获得表达矩阵。在FDR <0.05和| log="" 2="" fc="" |="">

结果三:加权共表达网络构建和关键模块识别

作者应用R中的“WGCNA”包通过平均连锁聚类将具有相似表达模式的DEG放入模块中,并且基于PDAC的组织学等级总共鉴定了5个模块,然后使用2种方法来测试每个模块与PDAC进展之间的相关性。最后作者发现黄色模块是与PDAC疾病进展最相关的模块。

结果四:在黄色模块中识别Hub基因

作者将总共43个与黄色模块高度连接的基因鉴定为候选hub基因。此外,作者还根据STRING数据库,通过Cytoscape构建黄色模块中所有基因的蛋白质 - 蛋白质相互作用网络(PPI),最终作者筛选出36个常见的网络基因作为待进一步分析和验证的候选基因。

结果五:hub基因的生存分析和回归分析

作者应用数据集GSE62452包含的69个胰腺肿瘤和mRNAseq数据以及TCGA中146例PDAC患者的信息,分别进行了生存分析和回归分析。最后在36个候选基因中识别了10个真实的hub基因(CCNA2,CCNB1,CENPF,DLGAP5,KIF14,KIF23,NEK2,RACGAP1,TPX2和UBE2C)。

数据集GSE62452中真实中hub基因的生存分析:

TCGA数据集中真实hub基因的生存分析:

数据集GSE62452中真实hub基因的表达水平与PDAC疾病进展之间的相关性:

TCGA数据集中真实hub基因的表达水平与PDAC的疾病进展之间的相关性:

结果六:真正的hub基因验证和效能评估

基于Oncomine数据库,作者发现,与正常组织相比,胰腺癌中真实hub基因的表达显著升高。此外,从The Human Protein Atlas数据库获得的免疫组织化学染色也证实了实际hub基因表达的失调。

此外,作者绘制了ROC曲线以评估真实hub基因以区分复发性和非复发性PDAC以及肿瘤和正常组织的能力。其中10个基因的AUC值大于0.5。

结果七:功能富集分析

GO分析结果显示这些基因在有丝分裂核分裂和细胞分裂这两个生物学过程中显著富集,在KEGG通路分析中细胞周期最显著富集。

结果八:基因集富集分析(GSEA)

为了确定PDAC中真正的hub基因的潜在功能,作者应用GSEA来搜索高表达样本中富集的KEGG通路。结果显示富集到了6个基因集,“细胞周期”,“DNA复制”,“错配修复”,“蛋白酶体”,“同源重组”和“碱基切除修复”。

结论:本研究可能有助于改善PDAC患者的治疗决策,风险分层,并对PDAC患者的预后预测具有一定的指导意义。

好啦,这篇文章就简单介绍到这里啦,感兴趣的小伙伴可以认真研读呦!

参考文献:Ten hub genes associated with progression and prognosis of pancreatic carcinoma identified by co-expression analysis.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多