分享

是时候提高TCGA数据分析的门槛了!

 生物_医药_科研 2020-04-30

2年前的TCGA入门门槛是酱婶的:

[这次一定带你进入生信分析的大门] 

那时候点点鼠标,组合几个在线数据库的结果,再搭配一点R语言基础,做一些在线数据库无法完成的分析就能获取一些有效的结果,并发表一篇文章。

虽然现在也有这种文章,但是随着掌握TCGA分析的人越来越多,对于文章的要求也在逐步提高:新颖的研究思路,丰富的研究内容,还有更美观的可视化展示等。

最近发现了一篇门槛较之前有所提高的文章:

我们来理一理这篇文章的思路:

1、从TCGA数据库中下载mRNA-seq, miRNA-seq 和临床信息三个层面的数据,并对样本进行过滤,得到三线表,部分展示如下:

其中,对PARPBP高低表达组的定义并非表达中值,而是使用X-tile软件计算获得:

另外,Table1中可见PARPBP表达与AFP, Vascular invasion, Histologic grade, TNM stage, Recurrence status 及 Living status 等临床因素显著相关(P < 0.05)。

2、从基因和蛋白表达两个层面,均能看到目标基因PARPBP在肝细胞癌组织中高表达,且ROC分析结果显示PARPBP基因表达对HCC的诊断准确率较高(AUC = 0.96, p < 0.001):

3、对于与PARPBP表达显著相关的几个临床指标,作者将PARPB表达作为连续变量进一步进行验证,得到与Table1较为一致的结论:

4、基于X-tile软件计算获得的最优分类点,高低表达组样本预后(OS和RFS)具有显著差异:

单因素和多因素COX分析的结果表明,PARPBP表达Stage分期都是独立的预后因素:

而PARPBP表达在Stage子集样本中也有较好的预后作用:

5、基于上述发现,作者将目标基因PARPBP与Stage分期信息组合构建了列线图模型,用于预测患者的1/3/5年生存。并使用C-indexcalibration校准曲线两个指标对模型的准确性进行评估,证明其有效性:

事情到这里还没有结束,作者对于PARPBP在HCC样本中表达上调的机制进行了分析...

6、结果显示,拷贝数扩增是个显著的影响因素(P < 0.05),而甲基化水平则对基因表达无显著影响(Pearson’s r = −0.0873, P = 0.0982)。

7、进一步地,作者使用 DIANA-microT 和 miRwalk 两个数据库对调控PARPBP的miRNA进行了预测,同时要求该miRNA在HCC样本中显著下调,最终得到一个关键因子:miR‑139‑5p。该miRNA同样能够预测预后:

8、为了探讨肝癌中PARPBP上调的潜在生物学功能,作者进行了GSEA分析,并富集到了几个关键的KEGG通路:

事情到这里还没有结束...

9、作者发现在HCC样本中,PARPBP表达与TP53基因突变显著相关:

TP53 mutation group had significantly higher PARPBP expression level (P < 0.05)

且生存分析结果显示,TP53突变是OS和RFS的不利因素:

Besides, survival analyses revealed that TP53 mutation group was correlated with unfavorable OS and RFS in the TCGA-LIHC dataset (all P < 0.05)

至此,文章就结束了!

与两年前的 [基础入门级文章] 比起来,有两个比较明显的变化:

1、减少了在线工具的使用;

2、增加了研究内容的丰富度(虽然感觉最后TP53有点儿抢戏...)

现在,我们来讲第二个重点,那就是...

TCGA数据分析全攻略(第二期) 

它来了! 手动@所有人

要模拟的文章就是这篇,并且小编特意在此基础上又加高了门槛:

1、除了Fig.1A/D/E之类必须用数据库/软件得到的结果外,其余全部使用R语言完成:

例如 X-tile 这种点点点,用眼瞅分界点的软件当然要被取代,在课程中一个R命令即可!连Tabe1和COX分析表格都不用手动整理,直接生成一个html文件,如下:

表头加粗?p值加粗斜体?p<0.05的加粗?这种...当然也在R里自动解决啦~

第一个原则:能用R解决的绝不动手

2、全面优化文中的可视化,直接用脚本绘制发表级:

另一个原则:美观是个加分项

3、R语言进阶,使用tidyverse整理数据

并使用ggplot2绘制图形:

第三个原则:生信控的粉丝们,R语言要进阶啦!!!

总之,如果你还是生信/TCGA/R语言萌新小白,建议尽快完成基础入门课程(第一期)的学习:

[告示: 生信控10天后将下架第一期TCGA课程]

最后一个重点:

课程已经正式发布!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多