搜索

分享

QQ空间 QQ好友新浪微博微信

Uanle TCGA数据挖掘——预后相关的甲基化位点及构建重要基因的风险模型

九斗酒 2017-07-31

展开全文

TCGA数据库想必大家都不陌生，它以丰富的数据类型、大规模的样本量和完备的临床信息著称，对肿瘤研究者来讲是一座宝贵的矿藏。数据类型主要包括mRNA芯片/测序、miRNA测序、甲基化芯片、CNV等多种组学，疾病包括39种常见癌症。我们今天给大家介绍一个预后相关的甲基化与表达谱整合的数据分析思路。

流程图如下：

流程图

具体步骤简要介绍：

甲基化数据差异分析
各差异甲基化位点的生存分析
差异甲基化位点-mRNA相关性分析
mRNA表达水平的生存分析

通过以上步骤筛选得到关键研究因子（文献调研），作为进一步深度研究分析的对象。

示例图关键甲基化水平beta值分布图

5.根据上一步所选的甲基化位点，将患者分为高/低甲基化组，筛选组间差异基因。

6.利用Cox模型和ROC曲线构建预后生存相关的signature基因集，并计算每个患者的Risk score。

示例图 K-M曲线和ROC曲线

7.利用验证数据集进行Risk score打分系统的验证。

示例图 Risk Score打分系统结果

8.与Risk Score正/负相关的基因集的GO和通路分析。

9.实验验证。

以上流程借助COX回归模型，结合TCGA的甲基化和mRNA测序数据，从海量的数据中筛选出影响预后的甲基化位点/基因集合，通过风险评分区分高/低风险患者，具有很高的科研和临床价值。大家看明白了吗？不妨一试！

1. Wang W, Zhang L, Wang Z, et al.A three-gene signature for prognosis in patients with MGMT promoter-methylatedglioblastoma[J]. Oncotarget, 2016, 7(43): 69991-69999.

2. 王可, 赵荣仙,杨素莲, 等. 基于 TCGA 数据库挖掘肺腺癌预后相关的甲基化位点和基因[J]. 南京医科大学学报: 自然科学版, 2016 (6): 665-669.

---------------------------------------------------------------------------------------------------

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：九斗酒 > 《科研》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

九斗酒

关注对话

TA的最新馆藏

[转] 张载“横渠四句”
史上最全的30个生物实验技术及原理
在读文献做笔记时顺手把文章写了
「简单粗暴」画出高大上的论文配图
这样做笔记，让你看文献的效率提升 10 倍
这些与审稿人过招的套路，请收好了

喜欢该文的人也喜欢更多

热门阅读换一换