分享

如何用RNA结合蛋白思路一月之内连发3篇纯生信SCI,IF累计过10?

 葛医生_EP日记 2020-04-10

第一篇:Development and validation of a RNA binding protein-associated prognostic model for lung adenocarcinoma,2020年2月发表在Aging杂志上,影响因子5.515。

第二篇:Integrated Analysis of the Functions and Prognostic Values of RNA Binding Proteins in Lung Squamous Cell Carcinoma,2020年3月发表在Front Genet杂志上,影响因子3.517。

第三篇:Integrated analysis of the roles and prognostic value of RNA binding proteins in lung adenocarcinoma,2020年2月发表在PeerJ杂志上,影响因子2.353。

三篇文章均出自一人之手,影响因子之和大于10分!下面让我们一起看一下三篇文章的异同点以及高分文章与低分文章的区别。

术语

RBPs:RNA结合蛋白,是一类伴随RNA的调控代谢过程,与RNA结合的蛋白质的总称。RBP伴随RNA生命始终,可以不夸张的说:没有RBP,RNA寸步难行。其主要作用是介导RNA的成熟、转运、定位和翻译;一个RBP可能存在多种靶标RNA;且其表达缺陷会造成多种疾病。

LUSC:肺鳞癌

LUAD:肺腺癌

相同点

三篇文章大致研究思路是相同的。首先,从之前发表的相关文章中的得到1542个RBPs,利用TCGA肺癌的RNA-seq数据得到差异表达基因,差异表达基因与RBPs的交集为差异表达的RBPs,对其进行GO和KEGG的富集分析(基因数目大于5且p<0.05被认为是具有统计学意义的)。然后,利用SRTRING数据库和cytoscape软件对这些差异表达RBPs构建PPI网络,通过cytoscape软件里的MCODE插件获得关键模块和关键基因。最后,对关键基因进行预后模型的构建,并对模型进行验证,并利用HPA在线数据库去探索关键基因的翻译水平。

不同点

三篇文章的研究流程如下图所示

第一篇文章的流程图

第二篇文章的流程图

第三篇文章流程图

第一篇与第三篇文章都是研究肺腺癌(TCGA-LUAD的524个疾病样本和59个正常样本),第二篇研究的是肺鳞癌(TCGA-LUSC的501个疾病样本和49个正常样本)。

类似于第三篇这样2分多的文章,思路比较简单,只是对肺腺癌差异表达的RBPs进行了功能富集分析、PPI网络构建、单因素多因素cox回归和突变与拷贝数变异分析;

而至于第二篇这样3分多的文章,在上述分析方法的基础上,加入了Lasso回归分析、列线图的构建与验证(ROC曲线、对数秩检验),可以说是对关键的RBPs进行了更深层次的分析,新加入的这些分析方法可以使文章的影响因子增加1分左右;

对于第一篇影响因子5分的文章则是在第二篇文章的基础上又加入了对单因素具有显著意义的关键基因进行KM生存分析,并对列线图里的核心基因进行了KM曲线的绘制。相比较第二篇而言,并没有增加多少数据量。至于比第二篇能多发2分,我想在故事描述上可能更全面,另一方面也跟杂志喜好和投稿运气有关。

我们不难发现,高分文章的分析方法都比较全面,像第一篇这样,常见的预测模型分析方法文章都有所涉及(KM生存分析、单因素多因素cox回归分析、Lasso回归分析、ROC曲线分析,富集分析、列线图)。而低分文章的分析方法往往比较精简(第二篇)。还有一个tip,如果你觉得自身的数据量可以发3分,建议先投4分或者更高试一试,说不定你的分析能够被某位杂志编辑青睐。当然,我们更建议针对自身文章内容有着清晰的定位,争取一投击中,不浪费过多时间。

结语

通过上述这三篇文章,我们不仅可以学到如何实现一个思路发多篇文章,还可以看到高分文章与低分文章的差距在哪里,这对我们设计课题具有一定的指导意义。文章的方法越全面,往往可以越有机会成为高分的文章,所以我们在今后构思文章时应尽可能的让分析更加全面,这样才有助于我们发表更高分的文章!

后台准确回复:3篇,获取三篇文章原文。

生信分析定制服务

请扫描下方二维码

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多