分享

万众期待! GEO/TCGA 数据挖掘实战线下培训课来啦!

 祥雲山人杨克昌 2019-11-24
羡慕别人实验室可以做测序做芯片,样本多,数据多。听说利用 GEO、TCGA 数据库就能挖掘大量数据,发自己的文章,虽然只有三分,但堪称性价比最高的套路!
那么到底如何做 GEO、TCGA 数据挖掘呢?
第一步,自己要分析的疾病,然后下载数据,差异表达分析,筛选得到几个关键的分子(可以是lncRNA,mRNA,miRNA,circRNA)。
差异基因表达量聚类热图:肿瘤样品与正常组织之间对比做差异表达分析,筛选出肿瘤细胞中表达显著差异的基因,之后根据表达量绘制表达热图
 
差异基因差异倍数与显著性的分布图,左边蓝色点代表下调基因,右边蓝色点代表上调基因
第二步,进行 GO 富集分析、Pathway 富集分析、GSEA 富集分析、PPI 分析、IPA 通路分析等,最后再做生存分析、ROC曲线分析等,就可以得到与疾病诊断相关的biomarker。
 
Cox回归分析与预后相关的biomarker,构建预后模型。根据预后模型划分病人风险,检验预后模型的可靠性。左图为模型ROC曲线结果,右图为生存分析结果
 
找到与肿瘤预后相关的关键基因,做蛋白互作网络分析结果
第三步,如果发高分的文章,可以再做一下小鼠模型,细胞模型,敲除,过表达等补充实验,对分子机理进行深入研究,干湿结合,文章就能再上一个档次。
另外,还有其他套路组合,例如做一下 WGCNA 或者联合 Oncomine 数据挖掘等等。

WGCNA分析:所有基因共表达基因模块的划分(左边的层次聚类每一个分支代表一个基因,旁边对应的彩色条带表示不同模块),以及基因之间共表达相关性(热图)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多