分享

仙桃学术 | 2021年最新套路!6 铁代谢热点与肿瘤风险套路复现!快来学!

 外科黄文斌 2021-11-15

国自然热点、诺奖热点好多不知道该怎么和自己的课题擦出绝美火花?今年9月发表在Frontiers in oncology(IF:6.241)的铁代谢肿瘤生信分析文章——《Identification of Iron Metabolism-Related Genes as Prognostic Indicators for Lower-Grade Glioma》,一开始即将重点放在铁代谢,研究了胶质瘤中铁代谢相关基因的预后指示价值。

全文一共8图2表,以TCGA_LGG为训练集数据,以CGGA (Chinese Glioma Genome Atlas)为验证集数据,在差异基因中筛选铁代谢相关基因,通过多种回归分析构建风险预测模型,功能富集分析与免疫浸润为全文锦上添花,讲述了一个相对完整的低级别胶质瘤中铁代谢影响临床预后的小故事,话不多说,今天手把手带大家复现这篇6 生信文章,学习文献思路,掌握复现方法,你离高分生信文章真的不远!

题目Identification of Iron Metabolism-Related Genes as Prognostic Indicators for Lower-Grade Glioma


图片

1. 材料与方法

图片

1)疾病:低级别胶质瘤

2)物种:人类

3)数据来源:TCGA_LGG (n=523) , CGGA_LGG


图片

2. 图表结果及复现

图片

2.1使用工具

1仙桃学术生信工具(https://www./products)

2HPA数据库 (https://www./)

2.2复现任务

Fig.1 Identification and functional enrichment analysis of dysregulated iron metabolism-related genes between the TCGA-LGG cohort and normal brain cortex samples.

TCGA-LGG队列与正常脑皮质中铁代谢相关基因鉴定与功能富集分析

图片

Fig.2 DEGs with univariate Cox regression P-value of < 0.05 are shown. Identification of prognostic signatures in the training set

LASSO Cox构建风险得分模型

图片

Table .1. Iron metabolism-related genes and their relationship with OS, and their coefficients in LASSO regression model.

构建生存相关铁代谢基因LASSO回归模型

图片

Fig. 3. Human Protein Atlas immunohistochemical analysis of LGG and Higher-grade glioma

高、低级别胶质瘤免疫组化分析

图片

Fig. 4. Risk score analysis, survival analysis and prognostic performance of a risk-score model based on differential expression of iron metabolism-related genes in patients with LGG.

LGG患者铁代谢相关基因风险得分预测模型

图片

Fig5. Association between clinicopathologic features and the iron metabolism based risk score in the TCGA dataset.

TCGA数据库中铁代谢相关基因与临床病理特征的联系

图片

Table 2. Univariate and multivariate Cox analysis of OS in TCGA-LGG dataset.

TCGA-LGG数据库中单因素、多因素Cox回归分析

图片

Fig 6. Prognostic nomogram for the 1-, 3-, and 5-year OS times of LGG patients

LGG患者总体生存率预测列线图

图片

Fig 7. GSEA of the iron metabolism-related gene signature in the TCGA cohort.

TCGA数据库中铁代谢相关基因GSEA富集分析

图片

Fig 8. Immune cell infiltration and immune checkpoint analysis in the TCGA cohort.

TCGA数据库中免疫细胞浸润与免疫检查点分析

图片


图片

3. 复现步骤

图片

3.1 Fig.1 TCGA-LGG队列与正常脑皮质中铁代谢相关基因鉴定与功能富集分析

1作者首先基于MSigDB和文献综述,汇总了527个铁代谢相关基因,在TCGA-LGG和CGGA-LGG数据集中匹配取交集,保留了402个铁代谢相关基因列表。

edgeR、limma、DESeq2三种算法分别对523例TCGA-LGG与105例正常脑皮质做差异基因分析后取交集,得到7223个差异基因列表,与402个铁代谢相关基因批量匹配,共得到87个铁代谢相关基因(50个上调、37个下调),对这87个基因进行进一步的GO富集分析发现这些基因与铁离子结合、转运相关,KEGG富集分析发现铁死亡、离子吸收、p53通路和AMPK信号通路被显著富集

2Fig1a为3种算法的差异基因交集结果;进入仙桃学术生信分析模块,“表达差异(挑)—差异分析—筛选分析“,选择”胶质瘤“数据,以肿瘤分级作为分组依据,进行差异分析

目前仙桃学术支持DESeq2算法进行差异分析,仙桃的宗旨一向是呼声高的需求优先满足~留言区让工程师小哥哥看到你们需要什么生信分析模块!

在”历史记录“中下载分析结果表格,从中筛选adj.p < 0.05 & logFC > 2的编码基因,得到差异基因列表后与铁代谢相关基因列表匹配,由于原文的补充材料中没有提供527个铁代谢相关基因的列表

我们这里以分析原文思路和复现操作为主,分析结果可能与原文不完全一致。这里我们分别取logFC降序top50和升序top50,得到高、低表达变化top100基因数据

图片

图片

3Fig1b为87个差异基因的热图分析,此处我们可以以TCGA数据为训练集,以GEO胶质瘤为验证集,验证87个铁代谢相关基因的表达情况,进入“数据集检索“,输入”low grade glioma“,选择低级别胶质瘤数据集加入样本库,仙桃学术支持同一芯片平台的多个数据集合并分析!

根据样本描述设定参考组与实验组,提交分析,待分析完成后下载表达谱数据表格,这里选择了刚才差异分析结果中的高、低表达top50个基因,绘制基因表达热图;进入生信分析工具”表达差异(挑)—复杂数值热图“,按要求整理数据格式后上传文件,提交分析

图片

图片

图片

4Fig1c、d为差异基因GO、KEGG富集分析结果,只需要提供top100差异基因名即可;进入“功能聚类(圈)—GO|KEGG,上传数据,自动生成分子list,2次分别选择“全部GO条目”、“KEGG”,提交分析;进入“GO|KEGG可视化”,可选择柱状图、气泡图等图片类型,支持个性化图片调整,保存结果并下载图片

图片

图片

图片

图片

3.2 Fig2 构建风险评分模型

1接下来作者对87个基因分别进行了单因素Cox回归分析,以p<0.05为cut-off值,得到与OS相关的47个基因列表(原文Table S1),用这47个基因构建LASSO回归模型,筛选得到15个最有价值的预测基因和风险得分模型

2进入“临床意义(靠)—预后分析—[云]Lasso系数筛选“,选择胶质瘤数据集,右侧的”分子list“中输入原文Table S1的47个基因,提交分析,保存结果,下载结果报告等更多分析结果查看分析结果

lambda.min模型筛选得到18个系数非0的基因,lambda,1se模型筛选得到11个系数非0的基因,基因数目适中,如果大家的数据构建lasso模型筛选后仍有较多变量,可以通过进一步的多因素Cox回归分析缩小变量范围

图片

图片

3接下来绘制Lasso变量轨迹图,平台自动选择刚才分析的云端数据结果,提交分析得到Lasso变量轨迹图,保存结果

图片

图片

3.3 Table1构建生存相关铁代谢基因LASSO回归模型

1Table1中为LASSO模型筛选得到的17个系数非0的铁代谢相关基因表格,3.2分析结果中的“变量_系数“结果表格中提供了lasso_coef信息,根据原文整理为Word三线表格式即可

3.4 Fig3 高、低级别胶质瘤免疫组化分析

1Fig3为HPA数据库中GCLC、LAMP2、NCOA4、RRM2、STEAP3、UROS等6个基因在低级别胶质瘤(LGG)和高级别胶质瘤(HGG)中的免疫组化表达验证图片

图片

2检索框中输入“GCLC“,选择”PATHOLOGY—GLIOMA“,点击”Search“,下拉页面,即找到原文同款LGG、HGG表达验证图片

图片

图片

3.5 Fig4 LGG患者铁代谢相关基因风险得分预测模型

1Fig4中作者分别以TCGA训练集、CGGA验证集数据使用LASSO模型中筛选的15个变量构建了风险因子预测模型,以风险得分中位数作为高位组与低危组划分依据,其中高危组预后更差,接着绘制了风险因子的时间依赖ROC曲线,以及高位组、低危组的KM生存曲线

2进入“临床意义(靠)—预后分析—风险因子图”,上传3.4中Lasso回归分析结果中下载的RiskScore结果,可以在“类型”中选择结果组合形式,提交分析,保存结果,可以看到ACP5、ALOX5、CP、RRM2与STEAP3等基因与高风险得分相关

图片

3进入“预后分析—时间依赖ROC曲线”,选择“胶质瘤数据集”,目前仙桃学术ROC曲线支持同时显示5个基因,可以分别绘制1年、3年、5年的曲线,提交作图,保存结果

图片

图片

4进入“预后分析—KM曲线图”,选择“胶质瘤”数据集,“基因”处输入兴趣基因,预后类型支持OS、DSS、PFI等,提交作图,保存结果

图片

图片

3.6 Fig5 TCGA数据库中铁代谢相关基因与临床病理特征的联系

1进入“临床意义(靠)—临床相关性”,选择“胶质瘤”数据集,图片类型可选择点图、箱图/柱状图、小提琴图、组合图等多种类型,并通过调整填充色、线条粗细等实现图片类型个性化

分别选择原文中的“age、WHO garde、Histological type、IDH mutation、MGMT status、1p/19q codeletion等病理特征,提交分析作图,保存结果,还可查看结果报告、统计描述等

图片

图片

3.7 Table2 TCGA-LGG数据库中单因素、多因素Cox回归分析

1table2为TCGA-LGG数据集单因素、多因素Cox回归分析结果表格,进入“临床意义(靠)—预后分析—单|多因素Cox回归”,选择数据集

根据原文设定纳入多因素分析的p值阈值为0.5,依次选择原文中Age、gender、WHO grade、IDH1、1p/19q、MGMT promoter(仙桃中以MGMT基因表达水平代替)、Riskscore(以高危风险因子STEAP3基因代替),保存结果并下载word三线表

图片

图片

图片

图片

3.8 Fig6 LGG患者总体生存率预测列线图

1Fig6中作者对多因素Cox回归中有意义的变量进一步绘制了nomogram与calibration curve,并绘制了nomogram中预测模型的时间依赖ROC曲线

2进入“临床意义(靠)—预后分析—预后列线图,选择疾病数据集,纳入上一步多因素Cox回归分析有意义的变量做列线图,选择预测年限,提交分析,保存结果

图片

图片

3接下来绘制列线图的校准曲线,进入“[云]预后Calibration“,选择数据集,仙桃自动默认上一步nomogram中纳入的变量,提交分析

图片

进入“[云]预后Calibration可视化“,选择刚才完成分析的云端数据,设置预测年限,提交分析,保存结果,可在页面下方的分析结果或结果报告中查看模型的C index,

图片

图片

3.9 Fig7 TCGA数据库中铁代谢相关基因GSEA富集分析

1Fig7中作者通过GSEA富集分析了选定的铁代谢相关基因基因参与的生物信号通路,发现与炎症应激、IL6/JAK/STAT3信号、IL2/STAT5信号、糖酵解、细胞凋亡和EMT信号相关基因在高危组中显著富集,提示铁代谢相关基因与LGG进展、代谢、肿瘤微环境和免疫应答等相关

2进入“功能聚类(圈)—GSEA富集—GSEA分析“,根据3.1结果中的差异分析结果准备数据,选择参考数据集,提交分析,待分析完成后在”历史记录“下载结果,进入”GSEA可视化“绘制GSEA富集分析结果图,支持同时绘制多条通路,每次绘制一条通路可有NES、p.adj等信息

图片

图片

图片

图片

图片

3.10 Fig8 TCGA数据库中免疫细胞浸润与免疫检查点分析

1Fig8中作者分析了TCGA数据集中免疫浸润细胞与免疫检查点的相关性与风险得分,并绘制了高危组、低危组中免疫浸润细胞、免疫检查点的箱线图比较结果,进一步体现了铁代谢相关基因构建的风险因子评分模型的免疫浸润意义

2仙桃学术可以绘制免疫浸润棒棒糖图、散点图及分组比较图,其中棒棒糖图可视化1个分子和多个细胞分数的相关性情况,圆圈的大小和棒高均代表相关性成都,颜色深浅代表p值大小

此处我们以绘制棒棒糖图为例,进入“交互网络(联)—免疫浸润—[云]棒棒糖图“,选择疾病数据集与兴趣基因,提交分析,保存结果,并可下载分析结果和查看详尽的结果报告

图片

现在文章中所有的图表都复现完毕啦~ 最后依然是我们的保留节目——全文总结


图片

文章思路总结

图片


TCGA-LGG队列与正常脑皮质中铁代谢相关基因鉴定与功能富集分析(Fig1)

高、低级别胶质瘤免疫组化分析(Fig3)

TCGA数据库中铁代谢相关基因GSEA富集分析(Fig7)

TCGA数据库中免疫细胞浸润与免疫检查点分析(Fig8)

构建风险评分模型(Fig2)

构建生存相关铁代谢基因LASSO回归模型(Table1)

LGG患者铁代谢相关基因风险得分预测模型(Fig4)

TCGA数据库中铁代谢相关基因与临床病理特征的联系(Fig5)

TCGA-LGG数据库中单因素、多因素Cox回归分析(Table2)

LGG患者总体生存率预测列线图(Fig6)


图片

全文总结

图片

1、文章一开始搜集准备了527个铁代谢相关基因,再在3种不同算法分析差异基因取交集后的7223个基因中批量匹配,之后全文的故事也紧紧围绕铁代谢相关基因展开

2、Lasso回归模型缩小变量数目后构建风险预测模型,将干巴巴的铁代谢相关基因与有血有肉的临床生存预后联系起来,箱线图分析临床病理特征与风险得分的相关性,为生信文章的实际应用价值增加了说服力;单因素、多因素Cox回归分析纳入除铁代谢相关基因之外的其他病理特征,并构建了nomogram,分析了时间依赖ROC曲线;最后以铁代谢相关基因与免疫浸润细胞、免疫检查点相关性分析结尾

3、全文聚焦于铁代谢相关基因与临床生存预后之间的关联,后续可开展相应的动物实验及临床小队列研究加以验证分析,以期寻找更好的干预方式。全文思路简洁,可模仿性高,无论你感兴趣的热点方向是什么,表型相关基因集走起,让仙桃学术丰富的生信功能为你的生信分析降低门槛并提高效率~

图片

E N D

图片

完美6 最新文章套路复现,奈斯~

有这套路工具在手,绝对效率提升500%↑↑↑

扫下方二维码即可免费获取复现神器

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多