分享

这个最新ceRNA纯生信7+套路,让导师都兴奋得趴到桌子上了!我今天30分钟零代码教你复现(附详细操作教程)

 解螺旋 2021-04-14

解螺旋公众号·陪伴你科研的第2533天

7+纯生信ceRNA文章复现

在pubmed搜索ceRNA,发现很多实验类的文章,做了很多内容,但是只发了2-3分,所以今天想和大家一起学习2021年1月发表于Molecular Therapy Nucleic Acid的ceRNA的肿瘤生信文章,看看这篇纯生信的文章是如何做到7+的水平的。

文章题目

Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma

期刊简介

要素拆解

题目:Comprehensive analysis to identify DLEU2L/TAOK1 axis as a prognostic biomarker in hepatocellular carcinoma

疾病:肝细胞肝癌(hepatocellular carcinoma,HCC)

数据来源:TCGA-LIHC

分析策略:差异表达 + 功能聚类 + 临床意义 + 交互网络 + 甲基化分析 + 免疫分析



复现工具
 仙桃学术工具
(https://www./products)
 Metascape数据库
 (http:///)
◆ HPA数据库
 (https://www./)
◆ cBioPortal数据库
(http://www./)
◆ LNCipedia数据库
(https:///)
◆ lncLocator
(http://www.csbio./bioinf/lncLocator/)
◆ TarBase数据库
(http:///tarbase/)
◆ TargetScan数据库
(http://www./vert_71/)
◆ UALCAN数据库
(http://ualcan.path./)
◆ DiseaseMeth version 2.0数据库
  (http://bio-bigdata./diseasemeth/)
◆ MEXPRESS数据库
  (https://)
◆ TIMER数据库
(https://cistrome./timer/)


数据解读

总体来看,作者先从TCGA数据库中挑出HCC(肝细胞肝癌)的样本,并对肿瘤vs正常以及PTEN高低表达进行差异分析,筛选出差异表达的lncRNA、miRNA、mRNA(图2和图3),构建ceRNA调控网络(图4),并对此ceRNA调控网络进行富集分析(图4)、生存分析(图6)、亚细胞定位分析(图7)、分子相关性分析(图7)、甲基化分析(图8)、免疫分析(图9)等,涉及到差异表达(挑),功能聚类(圈),交互网络(联),临床意义(靠)的各个方面,内容丰富饱满,非常值得学习借鉴。详细解读如下 ▼


文章复现

本文一共9个主图,6个附表,7个附图,很多附图表和主图的绘制方法类似,就不再重复,这里只复现了主图和有代表性的附图表,现在就开始吧。

图1、ceRNA的构建和分析流程图▼

流程图用PPT、思维导图软件、photoshop等都能实现,这里不再赘述。

图2、PTEN在人类肝细胞癌(HCC)中的抑癌作用▼

图2A PTEN在泛癌中的表达分布

进入HPA数据库:https://www./
输入目的基因【PTEN】 → 【Search】▼

选择【PTEN】旁的【Tissue】▼

往下拉,就能看见【RNA EXPRESSION OVERVIEW】,截图保存即可。▼
(注:作者这里犯了个小错误,此图是正常组织的PTEN表达情况,而被作者标注成了pan-cancer了。)

想看泛癌组织的表达情况也很容易
点击页面上方的【PATHOLOGY】▼

拉到页面最下方,就是附图1了。▼
(注:作者这里也标注错了,附图1应该是PTEN在泛癌中的表达)

仙桃学术的生信工具不仅能一键完成此图,还有非配对样本和配对样本的对比,一起来看看吧~

进入仙桃学术生信工具:https://www./products
【高级版】 → 【立即使用】▼
(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)

【分析工具】 → 【表达差异(挑)】 → 【非配对样本】 → 【泛癌】 → 输入分子【PTEN】 → 调整图片颜色和大小 → 【确认】▼
这里就可以看到PTEN在33种肿瘤的非配对样本中的表达情况了。此时即“保存结果”到云端的历史记录,也可用其他格式保存到电脑中。▼
(小贴士:建议后续需要拼图的图片均选择“保存结果”,这样可将保存的结果直接在“拼图工具”中进行拼图,省去了后面上传图片的步骤,咱们能偷懒就尽量偷懒,把时间花在更必要的地方,对吧~)

想要看配对样本的情况呢?
【配对样本】 → 调整图片颜色和大小 → 【确认】▼
(小贴士:现在仙桃学术的记忆力变好的哟,上次搜索的内容,比如【泛癌】、【PTEN】都记在仙桃的小脑袋瓜里,下次检索的时候,只需要再看看是不是自己需要的疾病和分子,更换分析方法就好啦~ 懒癌星人的福音哈哈~)

图2B HPA数据库中PTEN的免疫组化图

依然在HPA数据库中,选择【TISSUE】▼

【TISSUES】 → 【LIVER】▼

挑一个和文章中类似的图片,点击 ▼

觉得合适,鼠标右键,【图片另存为】▼

换个图片,继续【图片另存为】,完成后可点击左上角的x把图片关闭。▼

肿瘤样本用类似的方法,【PATHOLOGY】 → 【CANCER】→ 【LIVER CANCER】▼

同样选择图片,点击进入后【图片另存为】即可▼

图2C PTEN高低表达的Kaplan-Meier生存曲线▼

仍然可在仙桃学术生信工具(https://www./products)中完成。
【临床意义(靠)】 → 调整预后参数 → 【确认】 → 【保存结果】或【下载图片】▼

图2D cBioPortal的OncoPrint图显示TCGA-HCC中PTEN基因组改变的分布 ▼

进入cBioPortal主页(http://www./)
选择【Liver】 → 找到【Liver Hepatocellular Carcinoma】 → 点击【Query By Gene】▼
(小贴士:这里有很多【Liver Hepatocellular Carcinoma】,可以根据需要选择一个或多个研究数据,这里根据原文选择了TCGA数据,一般来说,选择CNS级的数据更可靠哦〜)

选择【Mutations】和【Putative copy-number alterations from GISTIC】 → 输入目的基因【PTEN】 → 【Submit Query】▼

出现的图片【Download】就可以了 ▼

图2E cBioPortal中PTEN拷贝数与mRNA表达之间的关联 ▼

接着上一步,【Plots】 → 【Download】▼

图2F cBioPortal中PTEN拷贝数与mRNA表达之间的相关图▼

接着上一步,选择【Log2 copy-number values】→ 取消【Mutation Type】和【Copy Number】前的选择 → 在【Show Regression Line】前打勾 → 【Download】▼

图1的所有图片都搞定了,现在可以来拼图了。

还是在仙桃学术的生信工具(https://www./products)
点击【基础绘图】 → 点击【上传图片】 → 选择图片并上传 → 【确认】 →【保存结果】至云端。

除了在仙桃中完成并保存的图片,其他图片都逐一上传。▼

将所有图片都上传并保存至云端以后,打开【拼图工具】 → 拖拽图片至空白处 → 调整图片大小和位置 → 调整【ABC标注】格式。▼

这就是完成拼图的结果了,全部自动标注好了ABCD呢〜▼

图3  HCC样本中PTEN高低表达之间的差异lncRNA、DEmiRNA、DEmRNA的火山图和热图▼

图3A 差异lncRNA的火山图 ▼

在仙桃学术中【生信工具】 → 【分析工具】 → 【表达差异(挑)】 → 【单基因差异分析】 → 选择【肝细胞肝癌】 → 分子输入【PTEN】 → 【确认】 ▼
(小贴士:此分析所需时间略长,请耐心等待哟〜 待会儿你就会发现,等待非常值得〜)

在【历史记录】中可以看到分析的状态仍然是【执行中】▼

待状态变为【完成】时,即可下载结果了。这里我们需要【Excel表格下载】和【差异lncRNA】▼

【表达差异(挑)】 → 【火山图】 → 上传刚刚下载的【差异lncRNA】 → 选择【基本参数】(文章中用的是logFC >0.5, P<0.05) → 输入标题【lncRNA】→ 【确认】 → 【保存结果】或下载图片▼
(小贴士:其实火山图的示例数据中只有【gene_name】、【logFC】、【adjP】,不小心发现其实可以将上一步下载的结果直接上传,不用麻烦的整理数据,就迫不及待的把这个偷懒的小招妙告诉你萌啦~)

图3B-C 差异miRNA和mRNA的火山图 ▼

这里就需要打开上一步下载的Excel表格了。
点击【筛选】▼

点击【gene_biotype】旁边的小三角 → 选择【miRNA】 → 【确定】▼

这样就将所有的miRNA筛选出来了,将所有筛选出的数据复制粘贴到一个新的Excel文件,取名“miRNA”,保存。▼

用同样的方法筛选【gene_biotype】为【protein_coding】的行,保存为“mRNA”文件。▼

按照lncRNA的方法,分别上传文件,就能得到相应的火山图了。
(小贴士:其实用筛选miRNA和mRNA的方法来筛选lncRNA,得到的结果和直接下载的结果是一模一样的,大家有兴趣可以尝试一下~)

图3D-E 15个差异最大的lncRNA、miRNA、mRNA的热图 ▼

三者的做法相似,就用“miRNA”作为例子吧。
打开保存好的差异miRNA的Excel文件,新建一列【abslogFC】 → 下一行写公式【=abs()】 → 用鼠标点一下【log2FoldChange】下的第一个数字 → 按回车键 ▼

把鼠标放在这个数字的右下方的绿点处,等鼠标从╬变成+,双击鼠标 ▼

【abslogFC】这一列就自动算出所有【log2FoldChange】的绝对值了▼

【筛选】 → 【pvalue】旁边的小三角 → 【数字筛选】 → 【小于】 ▼
(小贴士:一般选择【padj】,就是校正后的p值,但因此数据【padj】缺失值较多,所以选择了【pvalue】,所以具体情况要具体分析哦~)

【小于】 → 【0.05】 → 【确定】 ▼

选中【abslogFC】列 → 【筛选】 → 【降序】 ▼

【扩展选定区域】 → 【排序】 ▼

这样,就选出了P<0.05的行,并且按照logFC的绝对值从大到小进行了排列。现在只用选中前15个基因名,复制就好了▼

进入仙桃学术生信分析工具 【交互网络(联)】 → 【单基因共表达】 → 选择【肝细胞肝癌】 → 输入目的分子【PTEN】 → 【标题文本】中输入【miRNA】 → 将上一步筛选出的相关基因粘贴至【分子列表】 → 【确认】 → 【保存结果】或【下载结果】▼
(小贴士:如果直接从TCGA数据库下载数据画热图,需要经过数据下载、合并、清洗、基因名称转换、寻找相关基因、排序、数据整理、绘制热图等复杂的步骤和程序,而在仙桃学术不仅能轻松搞定,还能获取更加丰富的信息哦~)
用同样的方法画出其他图片,并拼图,即可得到以下结果▼

图4 lnRNA-miRNA-mRNA调控网络的构建和功能富集分析▼

此图主要是在Metascape数据库(http:///)中完成的。
(小贴士:虽然仙桃学术也能做相应分析,但是目前只能分析700个基因,对于此次分析有点容量不足。仙桃学术的技术小哥哥无所不能,所以大家有什么需求,直接在本文下方或者公众号里许愿,大家的呼声高了,愿望就能早点实现啦~ 顺便也给技术小哥哥一点压力,哈哈哈哈~)

将所有的差异lncRNA+miRNA+mRNA名字都粘贴到【list】 → 【Submit】 → 选择【H.sapiens】(代表人类) → 【Expression Analysis】 → 等待一段时间,直到下方100分 →点击【Analysis Report Page】▼
(小贴士:这里可以上传文件的,也许是网速原因,多次尝试上传文件都没有成功,所以最终选择上传list,网速好的小伙伴们也可以试试直接上传文件哦~)

立刻就出现图4C了,点击【PDF】保存 ▼

往下拉,【Figure 2】即为图4A ▼

【Figure 3】即为图4B ▼

图5 TCGA-HCC数据集中ceRNA调控网络的13种Hub-RNA表达模式的分布▼

【表达差异(挑)】 → 【非配对样本】 → 【TCGA-LIHC】 → 【点图】 → 输入目的分子,如【DLEU2L】 → 【统计分析】选择【p=科学计数】 → 【确认】 → 【保存结果】或下载 ▼
每个小图的做法都类似,只需更改目的分子的名字就好了。

图6 ceRNA调控网络中的生存率分析▼

每个小图的做法也都类似,只需更改目的分子的名字就好了。
【分析工具】 → 【临床意义(靠)】 → 【KM曲线图】 → 【TCGA-LIHC】 → 输入目的分子,如【DLEU2L】 → 【确认】 → 【保存结果】或下载 ▼

图7 ceRNA网络的构建和相关性分析▼


图7A 三种lncRNA(DLEU2L,FAM99A和ARRDC1-AS1)的细胞定位▼

首先找到lncRNA的序列
进入LNCipedia(https:///)主页 → 输入目的分子,如【DLEU2L】 → 搜索 ▼

点击【lnc-PGM1-1:3】▼

将【RNA sequence】全部复制▼

接下来就可以查询lncRNA的细胞定位了。
进入lncLocator(http://www.csbio./bioinf/lncLocator/),将刚刚复制的序列粘贴进来 → 【submit】 ▼

页面最下方即可得到lncRNA在细胞中的分布比例 ▼

将数据粘贴进Excel表格,插入图表即可。▼

图7C 用TarBase预测DLEU2L与miR-99a-5p和miR-100-5p的靶位点之间的碱基配对,用TargetScan预测TAOK1 3'UTR与miR-99a-5p和miR-100-5p的靶位点之间的碱基配对▼

TarBase数据库(http:///tarbase/) → 输入目的分子,如【DLEU2L】 → 选择【Homo sapiens】 → 【Apply】即可得到与DLEU2L结合的miRNA分子▼

TargetScan数据库(http://www./vert_71/)
选择【Human】 → 输入目的分子,如【TAOK1】 → 【Submit】▼

点击【miR-99-5p/100-5p】▼

找到【Human】 → 下方即为【TAOK1】与miRNA的结合位点▼

图7D 肝癌中四个预测性RNA之间及其与PTEN的相关性分析▼

回到仙桃学术生信工具(https://www./products) → 【交互网络(联)】 → 【散点图】 → 选择【肝细胞肝癌】 → 基因A输入【PTEN】 → 基因B输入【DLEU2L】 → 【确认】 → 【保存结果】▼
其余分子相关性分析也类似。

图8 TAOK1的甲基化分析▼

好吧,图8A还没有找到在线的工具可以完成,只能用R语言了,希望仙桃学术的技术小哥哥能早点搞定~

图8B 使用UALCAN评估TAOK1甲基化▼

进入UALCAN数据库(http://ualcan.path./) → 【TCGA analysis】▼

输入【TAOK1】 → 选择【Liver hepatocellular carcinoma】 → 【Explore】▼

【Methylation】▼

出现的图片【Download】即可▼

图8C 使用DiseaseMeth 2.0版评估甲基化▼

DiseaseMeth version 2.0 (http://bio-bigdata./diseasemeth/) → 【Analyze】▼

选择【Liver hepatocellular carcinoma[LIHC]】 → 输入【TAOK1】 → 选择【Array-based technology】 → 【Analysis】▼

选择【NM-025142】 → 【Analysis】▼

选择【chr17:277_5942-27718446】 → 【Analysis】▼

点击Plot下方的【+】即可出图▼

图8D MEXPRESS数据库中显示TAOK1的DNA序列与基因表达的甲基化位点▼

MEXPRESS数据库(https://) → 输入【TAOK1】 → 选择【LIHC】 → 【PLOT】 → 出现图片后【Download】即可 ▼

图9 肝癌组织中TAOK1表达与免疫浸润的相关性分析▼

图9A HCC中TAOK1基因拷贝数与免疫细胞浸润水平之间的关联▼

TIMER数据库(https://cistrome./timer/) → 【SCNA】 → 选择【LIHC】 → 输入【TAOK1】 → 【Submit】 → 出现图片后下载即可 ▼

图9B TAOK1表达与HCC免疫浸润水平的相关性▼

TIMER数据库 → 【Gene】 → 输入【TAOK1】 → 选择【LIHC】 → 【Submit】 → 出现图片后下载即可 ▼

图9C HCC的免疫浸润和总生存率▼

TIMER数据库 → 【Survival】 → 选择【LIHC】 → 输入【TAOK1】 → 【Plot KM Curve】 → 出现图片后下载即可 ▼


END

撰文丨dodo
排版丨豨莶

探索基因间相互作用和功能,除了string还有更友好的它!
一句话证明你是医生
绝了!9+纯生信文章,我用15分钟零代码教你复现!老底儿都没了(附详细操作教程)






    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多