昨天给大家推荐了一本2区4分的生信友好型杂志Epigenomics(点击查看),那么今天一起学习一篇2019年8月发表于Epigenomics的文章。标题是Identification of long noncoding RNA RP11-169F17.1 and RP11-669N7.2 as novel prognostic biomarkers of stomach adenocarcinoma based on integrated bioinformatics analysis。文章利用多个网页工具对STAD进行研究,找到作用ceRNA,借鉴之前的结果,落实了与幽门螺杆菌感染相关的靶基因的表达差异,对ceRNA感兴趣但对R不熟悉的同学可以借鉴这篇文章的思路。 01 研究思路 · 确认差异表达lncRNA并进行生存曲线绘制,找出影响生存的2个lncRNA(circlncRNAnet+GEPIA) · 构建ceRNA网络,lncRNA->miRNA->mRNA(UCSC,LncBook,lncLocator,AnnoLnc,miRTarBase) · 对靶基因进行富集分析(Metascape) · 基于先前研究,确认与幽门螺杆菌感染相关的基因 · 对确认的靶基因进行表达差异的探索(GEPIA) 02 结果 2.1差异表达lncRNA生存分析 利用circlncRNAnet网页工具探索TCGA-STAD,阈值设定为|Log2 fold change|>4 and p-adjusted<0.01,筛选出47个上调和5个下调的lncRNA;然后利用GEPIA对以上差异表达的lncRNA进行生存分析的研究,找到影响STAD生存的lncRNA,进行OS和DFS生存分析曲线绘制; 2.2构建ceRNA网络 ceRNA发挥作用一般是在细胞质,因此需要对lncRNA亚细胞定位进行确认,先从UCSC和LncBook获得lncRNA序列,在lncLocator得到对于亚细胞定位的得分;利用AnnoLnc获取对lncRNA靶向的miRNA,并在GEO胃癌数据集GSE54397进行miRNA差异分析,最终确认了8个miRNA;利用miRTarBase获取8个miRNA的靶基因,最终确认 RP11-169F17.1的78个靶基因和RP11-669N7.2的154个靶基因。 2.3富集分析 利用Metascape对确认的靶基因进行富集分析,以柱状图和网络图展示每个lncRNA的靶基因富集的前20个term; 2.4分析靶基因与幽门螺杆菌 这里利用了作者之前研究的内容,将靶基因与先前结果进行对比绘制了维恩图,并绘制相关的lncRNA、miRNA和mRNA网络图; 2.5验证潜在靶基因的表达 对两个lncRNA与幽门螺杆菌感染相关的靶基因取交集,作相关分析,确认出CDK6、CDK4、E2F3、CDC25A这4个基因并利用GEPIA研究其在TCGA-STAD中肿瘤和正常组的表达差异; 结语 文章研究TCGA-STAD从lncRNA入手,找到对应靶向miRNA和靶基因,进行富集分析,结合先前的幽门螺杆菌研究,梳理出4个潜在靶基因;在TCGA-STAD中确认4个基因在正常和肿瘤样本中具有表达差异 |
|