分享

GEO联合TCGA数据挖掘文献分享

 SCI狂人团队 2020-11-13

今天要介绍的这篇章是我们中国人写的,发表在Med Sci Monit上,这篇文章主要是通过下载GEO和TCGA的数据,通过差异表达分析,GO富集分析、KEGG富集分析,PPI分析,COX回归分析,筛选出核心基因和5个与结直肠癌预后相关的biomarker。

题目:

Identification of Critical Genes and Five Prognostic Biomarkers Associated with Colorectal Cancer

论文摘要:

背景:结直肠癌(CRC)是一种常见的恶性肿瘤,在世界范围内具有高发病和高死亡率。

目的:这项研究的目的是评估可能起作用的差异表达基因(DEGs)之间的关联

作为CRC预后和治疗的生物标志物,以及CRC患者的临床结果。

材料/方法:从Gene Expression下载总共116个正常粘液组织和930个CRC组织数据集综合数据库(GEO)和癌症基因组图谱(TCGA)。根据limma包筛选DEGsR. Gene Ontology(GO)和KEGG富集分析以及蛋白质 - 蛋白质相互作用(PPI)进行网络以预测这些DEG的功能。同时,Cox比例风险回归 用于建立这些DEG的预后模型。然后,使用Kaplan-Meier风险分析进行测试

TCGA数据集和验证数据集中的模型。

结果:在本研究中,鉴定了具有100个上调基因和200个下调基因的300°。该

构建了包含162°和256个节点的PPI网络,选择了2个高度模块。

此外,使用Cox鉴定了5个基因(MMP1,ACSL6,SMPD1,PPARGC1A和HEPACAM2)比例风险逐步回归。 TCGA和验证队列中的Kaplan-Meier风险曲线显示高风险组的总体生存率显着低于低风险组。

结论我们的研究提供了对CRC形成机制的见解,并发现了5个预后基因,可以

潜在的进一步研究和临床治疗。

论文的主要操作内容:

1、在GEO和TCGA上下载数据

2、分别对GEO和TCGA数据做差异表达分析并且取交集基因

3、GO和KEGG富集分析

4、PPI分析

5、Cox回归分析,生存分析

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多