分享

仙桃学术 | 细胞焦亡 预后模型?思路打开!

 外科黄文斌 2023-04-02 发布于广东

文章题目

图片

文章背景

细胞焦亡(pyroptosis)是由炎性小体引发的一种细胞程序性死亡,表现为细胞不断胀大直至细胞膜破裂,导致细胞内容物释放进而引起强烈的炎症反应。细胞焦亡的发生依赖于炎性半胱天冬酶(caspase)和GSDMs蛋白家族,简单来说就是被激活的caspase切割GSDMs蛋白,释放出其N端结构域,该结构域结合膜脂并在细胞膜上打孔,导致细胞渗透压的变化,进而发生胀大直至细胞膜破裂。

胰腺癌(PAAD)是一种扩散迅速、预后差的癌症肿瘤,其5年生存率估计仅为1%。越来越多的研究表明,细胞焦亡在癌症的进展中起着重要的作用。因此,深入研究焦亡在胰腺癌发生和进展中的作用,以及建立相关的焦亡预后模型,对PAAD的治疗具有重要意义。

目前还没有建立与PAAD焦亡相关的预后模型来预测PAAD患者的预后。因此,本研究中,作者系统地探讨了焦相关基因的预后价值及其与临床特征的相关性,从而揭示了焦相关基因作为PAAD患者潜在预后生物标志物和新的治疗靶点的重要作用。

PS:原文中并没有提到焦亡基因的来源,不同文章对焦亡相关基因的定义差距很大,其中应用最多的是从文献综述(PMID: 30842595、PMID: 31501419、PMID: 28813641、PMID: 25879280)中获取的33个焦亡基因,这里我们以这33个焦亡基因进行文章的复现,具体焦亡相关基因如下表所示:

图片

文章思路

  • 差异表达

  • Figure 2:PAAD组织和正常组织之间不同表达焦亡相关基因

  • 临床意义

  • Figure 3:构建TCGA队列中基于焦亡相关基因的风险预后模型

  • Figure 4:TCGA队列中风险模型的构建

  • Figure 5:预测胰腺癌患者生存概率的列线图

  • 交互网络

  • Figure 6:针对PAAD治疗的筛选药物

  • Figure 7:肿瘤微环境与免疫细胞分析

  • 功能聚类

  • Figure S1:GO/KEGG的功能富集

  • Figure S5:GSEA富集分析

文章复现

1、使用工具

仙桃学术工具(https://www./)

Networkanalyst数据库(https://www./)

STRING数据库(https:///)

cBioPortal 数据库(http://www./)

CTD数据库(https:///)

PubChem 网站(https://pubchem.ncbi.nlm./)

TIMER数据库 (https://cistrome./timer/)

2.复现步骤

Figure 1:技术路线图

图片

整个文章的技术路线如Figure 1 所示,关于技术路线图的绘制可参考我们解螺旋《技术路线图绘制教程》的单元课,里面涵盖了多个常用软件的详细操作步骤及实例演示。

图片

Figure 2:PAAD组织和正常组织之间不同表达焦亡相关基因

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择表达差异(挑)中[云]非配对样本→选择胰腺癌的数据集,默认其它参数,点击确认,在下方说明文件中点击数据下载栏中的百度云超链接,即可下载UCSC XENA经Toil流程(Vivian J et al., 2017)统一处理的TCGA的PAAD(胰腺癌)和GTEx中对应的正常组织TPM格式的RNAseq数据。

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择基础绘图中简易ID转换(人源)→上传步骤(1)中下载的数据ID,点击确认,最终转换结果如下

图片
图片

提取33个焦亡基因的表达矩阵如下:

图片

进入Networkanalyst数据库(https://www./),点击左下角Gene Expression Table

图片

选择物种H.sapiens(human),Data type为Microarray data,ID type为Official Gene Symbol,Gene-level summarization为Mean,上传整理好的焦亡基因表达矩阵,点击Submit,运行完成后点击右下方proceed

图片

弹出的界面默认相关参数,点击Submid,运行完成后点击右下方proceed

图片

点击Download即可下载得到差异分析结果

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择表达差异(挑)中(临时)火山图→上传焦亡基因极其log FC和Pvalue,输入标记的分子,默认其它参数,点击确认,即可得到焦亡基因的火山图

图片

进入STRING数据库(https:///),输入差异表达的28个焦亡基因,选五物种homo sapiens,点击search

图片

默认相关参数,点击as a vector graphic:download SVG即可得到差异表达的28个焦亡基因的PPI

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择表达差异(挑)中复杂热图(上传)→上传焦亡基因的表达矩阵,默认其它参数,点击确认,即可得到焦亡基因的热图

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择表达差异(挑)中[云]非配对样本→选择胰腺癌数据集,输入焦亡基因,默认其它参数,点击确认,即可得到焦亡基因的箱式图

图片

进cBioPortal 数据库(http://www./),选择TCGA中胰腺癌数据集,点击Query by Gene

图片

默认相关参数,基因输入框中输入差异表达焦亡基因,点击Submit Query

图片

即可得到差异焦亡基因在胰腺癌中的突变概况图,点击Download即可下载图片

图片

Figure 3:构建TCGA队列中基于焦亡相关基因的风险预后模型

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中临时[云]单因素/多因素Cox回归→选择胰腺癌数据集,输入差异表达的焦亡基因,默认其它参数,点击确认,即可得到焦亡基因在胰腺癌中的单因素/多因素Cox分析结果,分别点击EXCEL和Riskscore保存

图片
图片

进入仙桃学术工具(https://www./),左侧导航栏中选择基础绘图中的森林图→分别上传步骤(1)中得到的单因素和多因素结果,默认其它参数,点击确认,即可分别得到得到单因素和多因素的森林图

图片
图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中[云]lasso系数筛选→选择胰腺癌数据集,输入步骤(2)中单因素Cox分析得到的预后基因,默认其它参数,点击确认,即可得到文中的Figure3C

图片

同时保存结果为lasso系数筛选

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中lasso变量轨迹图→选择步骤(3)保存的lasso系数筛选结果,默认其它参数,点击确认,即可得到文中的Figure3D

图片

Figure 4:TCGA队列中风险模型的构建

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中风险因子图→上传Figure 3中Cox回归分析保存的Riskscore文件

图片

默认相关参数,点击确认,即可得到文中Figure 4中的风险因子图

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择基础绘图中生存曲线-二分类/数值/单组→上传Figure 3中Cox回归分析保存的Riskscore文件

图片

默认相关参数,即可得到文中Figure 4B高低风险组的预后生存曲线

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择表达差异(挑)中复杂热图(上传)→上传lasso系数筛选得到的5个焦亡基因的表达矩阵,同时按照RiskScore进行中位数将其分为高低风险组,默认其它参,点击确认,即可得到文中Figure 4D

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择基础绘图中时间依赖性ROC→上传Figure 3中Cox回归分析保存的Riskscore数据,预测年限调整为1年、3年、5年,默认其它参,点击确认,即可得到文中Figure 4E

图片

Figure 5:预测胰腺癌患者生存概率的列线图

图片

PS:关于列线图模型的构建,一方面可以用lassos筛选的的5个预后焦亡基因的表达联合临床变量构建,另外也可以用焦亡基因Cox回归分析后得到的Riskscore联合临床变量

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中[云]预后列线图→选择胰腺癌数据集,输入临床变量以及预后焦亡基因,预测年限调整为1年、3年、5年,默认其它参,点击确认,即可得到预后焦亡基因的表达联合临床变量构建的列线图

图片
图片

点击下方数据下载里面原始临床数据 RNAseq编号对应的百度云超链接,下载相应的临床数据

图片

提取相关临床变量,同时匹配添加焦亡基因Cox回归分析后得到的Riskscore列,最终整理格式如下

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中预后列线图上传→上传整理好的上方数据,输入临床变量以及预后焦亡基因,预测年限调整为1年、2年、3年,默认其它参,点击确认,即可得到Riskscore联合临床变量构建的列线图

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中[云] 预后Calibration分析→这里上传的数据格式和列线图数据一致,调整预测年限与线图数预测年限一致,默认其它参,点击确认,待分析完成后保存为Calibration分析上传

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择预后分析中[云] Calibration可视化→点击上方分析后保存的云数据,调整预测年限与线图数预测年限一致,默认其它参,点击确认,即可得到对应预测年限的预后Calibration图

图片

进入仙桃学术工具(https://www./),左侧导航栏中选择基础绘图中诊断性ROC-独立指标→上传临床变量、Riskscore以及event的数据并将临床变量亚型转化为数值,具体数据格式如下

图片

默认其它参,点击确认,即可得到文中Figure5E

图片

Figure 6:针对PAAD治疗的筛选药物

图片
图片

PS:原文中药物预测使用了pRRophetic包对高低风险组进行了药物预测,这里我们转换一种思路,零代码对lasso分析得到的预后相关焦亡基因进行药物预测

进入CTD数据库(https:///),检索栏中输入焦亡基因NLRP1,点击Search

图片

弹出的界面选择Chemicals,即可看到与焦亡基因NLRP1相关的化合物(这里可以根据Interactions对化合物筛选)

图片

进入PubChem 网站(https://pubchem.ncbi.nlm./),检索栏中输入Valproic acid,点击右侧放大镜进行搜索

图片

弹出的界面,点击右侧导航栏中3D conformer即可得到Valproic acid的3D结构图

图片

同样操作可以获取其它预后相关焦亡基因的化合物以及其对应的3D结构

Figure 7:肿瘤微环境与免疫细胞分析

图片

PS:原文中Figure 7是通CIBERSORT包对高低分析组进行了免疫分析,这部分相关代码的学习,小伙伴们可参考挑圈联靠推文《免疫浸润利器——CIBERSORT纯代码实操》和《审稿人用的升级版免疫浸润分析,多一个X,CIBERSORT有啥差别?》进行学习和实战;当然这里也可以零代码对lasso分析得到的预后相关焦亡基因进行相关免疫分析,这里以TIMER数据库进行演示

进入TIMER数据库 (https://cistrome./timer/),导航栏中选择Gene,Gene Symbol输入预后相关焦亡基因NLRP1,Cancer Types中输入PAAD,Immune Infiltrates默认B cell,CD8 T cell,CD4 T cell,macrophage,neutrophil ,dendritic cell ,点击Submit,即可得到胰腺癌中焦亡基因NLRP1与多种免疫细胞的关系

图片

Figure S1:GO/KEGG的功能富集

图片

此外,文中补充材料中Figure S1也涉及到差异焦亡基因的GO和KEGG富集分析,这里给大家用仙桃工具进行演示

进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→GO/KEGG富集分析,分子列表输入差异焦亡基因,富集分析选择全部GO项目,点击确认

图片

保存结果为GO并下载excel结果

图片

点击左侧导航栏中的功能聚类(圈)→GO/KEGG可视化,选择分析好的项目GO,类型可选择气泡图,输入显示的富集条目,方法选择分面,点击确认保存即可得到GO富集分析气泡图

图片

进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GOKEGG(联合logFC)→富集分析,上传差异焦亡基因及其对应的LogFC,富集分析类型选择KEGG,点击确认,待分析完成后,保存结果为KEGG,并下载EXCEL结果

图片
图片

进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GOKEGG(联合logFC)→圈图,点击上方刚刚分析好的云数据,基本参数输入显示的KEGG富集条目,点击确认保存即可得到KEGG富集分析圈图

图片

Figure S5:GSEA富集分析

图片
图片

PS:补充材料中的Figure S5是对高低风险组进行的GSEA富集分析,这里可以重复利用Networkanalyst数据库对高低风险组进行差异分析(具体步骤可参见前方Figure2的复现内容),分析后提取所有基因及其对应的LogFC即可进行GSEA富集,这里我们依旧以仙桃学术进行演示

进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→GSEA富集分析,上传高低风险组差异分析结果中的所有基因及其对应的LogFC,默认其它参数,点击确认

图片

进入仙桃学术工具,点击左侧导航栏中的功能聚类(圈)→ GSEAf富集→GSEA可视化,点击上方刚刚分析好的云数据,基本参数输入显示的GSEA富集条目,点击确认保存即可得到GSEA图

图片

整个文章结构布局相对清晰明了,正文结果主要是基于TCGA数据集中的焦亡基因构建临床模型以及对高低风险组进行药物分析、免疫分析,而其补充文件又通过两个GEO数据集对TCGA数据结果进行验证,并且也进行了机制探索(GO/KEGG/GSEA富集分析)和细胞层面实验的验证进行。除了实验部分,其它内容基本上都得到了复现或者同等替换,不知道屏幕前的你是否有所启发和收获?好啦,以上就是本次焦亡生信文献复现分享的全部内容啦,愿屏幕前的你学有所获,下期再见,886

END

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多