|
今天给同学们分享一篇生信文章“Exploring of bladder cancer immune-related genes and potential therapeutic targets based on transcriptomic data and Mendelian randomization analysis”,这篇文章发表在Front Immunol 期刊上,影响因子为5.9 。 3.1. 资源识别倡议为识别膀胱癌相关基因,作者采用三种方法进行差异表达分析:edgeR、limma 和 Wilcoxon 测试,比较膀胱癌组织与相邻非癌变对照组织。EdgeR 鉴定出 3104 个差异表达基因(DEGs),其中 1559 个上调基因和 1545 个下调基因。Limma 鉴定出 2563 个 DEG 基因(1084 个上调基因和 1479 个下调基因),Wilcoxon 测试鉴定 2836 个 DEGs(1560 个上调基因和 1276 个下调基因)。为提高 DEG 鉴定的可靠性,作者仅选择三种方法均识别出的基因,得出 2033 个基因组( 见图 2A)。其中,881 个基因被上调,1152 个基因被下调( 图 2B)。上调和下调的前 30 个基因图 2C。所有已识别的 DEG 均表现出统计学上显著的调整后 P 值(形容词)P-val < 0.01,表明表达具有统计学显著差异。这些 DEG 为进一步的功能性和机制研究奠定了基础。利用 Wilcoxon、edgeR 和 limma 检验识别膀胱癌中差异表达基因(DEGs)。(A) 维恩图,展示了通过 Wilcoxon 秩和检验、edgeR 和 limma 分析识别的膀胱癌 DEGs 的交集情况。(B) 展示膀胱癌 DEGs 及样本层级聚类的火山图。(C) 前 30 个上调和下调 DEG 的热图。3.2. 利用 WGCNA 识别膀胱癌免疫相关基因为识别与膀胱肿瘤微环境中免疫细胞浸润相关的基因,作者对 GSE13507 数据集进行了 WGCNA 分析。首先,样本聚类分析表明 GSE21374 数据集中的全部 197 个样本均适合构建加权基因共表达网络( 图 3A)。随后,作者将β = 8(R² = 0.9)设为,并合并相似度为 0.6%的模块,形成由八个模块组成的加权基因共表达网络( 图 3B 、C)。进一步分析显示,这八个模块与 StromalScore、ImmuneScore、ESTIMATE 评分和肿瘤纯度评分之间存在相关性( 见图 3D)。红色模块(MEred)与免疫相关指标的正相关性最强。此外,作者计算了 MEred 模块中基因与四个评分之间的相关性。应用相关系数阈值 3E 0.8 和 P< 0.05,作者识别出 1391 个与肿瘤免疫微环境中免疫细胞相关的基因。利用加权基因共表达网络分析(WGCNA)识别与浸润免疫细胞相关的模块。(A) 样本聚类树轮图。(B) 各种软阈值能力的无尺度拓扑和平均连通性分析。(C) 基于 1 拓扑交集矩阵(TOM)差异度测量的所有差异表达基因树状图。颜色带代表动态树切分析的结果。(D) 热图显示模块特征基因与浸润免疫细胞特性之间的相关性。选定 MEpurple 模块进行进一步分析。TOM,拓扑交集矩阵;ME,模块特征基因。3.3. 遗传预测 eQTL 对膀胱癌及候选基因鉴定的因果关系本研究探讨了 5,430 个表达定量性状位点(eQTLs)与膀胱癌风险之间的因果关系。根据 MR 分析的筛选标准,187 个 eQTLs 与膀胱癌发生有因果关系。通过整合这 187 个 eQTLs 与 2033 个差异表达基因(DEGs)和 1391 个免疫相关基因,作者识别出 10 个关键基因(见图 4A)。采用过滤策略——将膀胱癌上调基因与具有比值比(OR)> 1 的基因(孟德尔随机分析)交叉,将膀胱癌下调基因与 OR < 1 基因相交——作者获得了两个共表达上调基因和 13 个共表达下调基因(见图 4B)。最后,将这些关键基因与风险一致基因交叉,得到八个与膀胱癌风险负相关的免疫相关基因:LIMS2、TP53INP2、IRAK3、STX2、CYP27A1、IL11RA、KCNMB1 和 PDLIM7(见图 4C)。膀胱癌关键基因的选择。(A) 维恩图,显示膀胱癌中 187 个因果相关基因、2033 个差异表达基因(DEGs)和 1391 个免疫相关基因的交集情况。(B) 维恩图,显示膀胱癌上调基因与孟德尔随机分析中比值比(OR)> 1 的基因之间的交集情况。(C) 维恩图,显示膀胱癌下调基因与比值比(OR)< 1 的基因(来自孟德尔随机分析)之间的交集情况。(D) 维恩图,显示通过孟德尔随机化因果分析识别的基因与膀胱癌中免疫相关基因之间的交集情况。孟德尔随机分析显示,有八个基因与膀胱癌风险呈负相关(见图 5)。根据 IVW 分析,这些基因及其关联如下:LIMS2(OR = 0.9992;95% CI,0.9985-0.9999;P = 0.029);TP53INP2(OR = 0.9989;95% CI,0.9980-0.9998;P = 0.015);IRAK3(OR = 0.9991;95% CI,0.9986-0.9997;P = 0.001);STX2(OR = 0.9995;95% CI,0.9991-0.9999;P = 0.015);CYP27A1(OR = 0.9994;95% CI,0.9990-0.9999;P = 0.024);IL11RA(OR = 0.9995;95% CI,0.9990-0.9999;P = 0.023);KCNMB1(OR = 0.9989;95% CI,0.9984-0.9995;P = 0.001);以及 PDLIM7(OR = 0.9986;95% CI,0.9972-1.0000;P = 0.044)。这些关联的方向性还得到了加权中位数(WM)、MR-Egger、简单模式和加权模式分析结果的支持。值得注意的是,这些基因的比值比(OR)非常接近 1。在孟德尔随机化分析中,OR 值接近 1 是预期的,因为连续变量如基因表达(如每个等位基因的增加)通常对复杂性状影响较小。在复杂疾病的遗传研究中,单基因变异对疾病风险的影响通常很小,使得接近 1 的或比值在生物学上是合理的。敏感性分析未发现显著异质性或水平多效性证据。Cochran 的 Q 检验用于评估由单个遗传变异推导出的工具变量估计值的异质性。采用随机效应逆方差加权(IVW)模型减轻了异质性对结果的影响。漏斗图中因果关联的分散性表明 eQTL 表达水平对膀胱癌因果效应无混杂偏倚。此外,P 值为 3E 0.05 的 MR-Egger 截距测试确认无水平多效性。排除单一 SNP 敏感性分析显示,排除单个 SNP 并未显著改变 MR 分析结果,从而确保了结果的稳健性。森林图显示了这八个基因与膀胱癌的风险关联(图 6)。与膀胱癌因果相关的基因森林图。(A-H) 关键基因对膀胱癌的 MR 效应大小;(A) LIMS2;(B) TP53INP2;(C) IRAK3;(D) STX2;(E) CYP27A1;(F) IL11RA;(G);(H) PDLIM7。3.6. 共享基因的 GO 和 KEGG 富集分析对八个关键基因的染色体位置进行了绘制和可视化。随后,对这八个基因进行了 Go 和 KEGG 富集分析,以阐明其相关的生物过程和途径。在生物过程方面,这些基因主要参与维生素 D 的生物合成和 Toll 信号通路。细胞成分分析定位了基因在焦点粘附、前缘和细胞-基质连接处。分子功能分析主要强调钙激活的钾通道活性和肌肉α-肌动蛋白结合。KEGG 通路分析显示其在初级胆汁酸生物合成中显著参与。合并后的 GEO 数据集(GSE31189、GSE31684 和 GSE37815)用于膀胱癌的 CIBERSORT 分析,结果得到了 xCell 分析的支持。首先排除了 CIBERSORT P 值为 0.05 的样本,得到 163 个肿瘤组织样本和 45 个正常组织样本。通过条形图和热图可视化每个样本中浸润免疫细胞的组成和比例(见图 7A、B)。对 22 种免疫细胞类型的浸润景观分析显示,6 个免疫细胞在膀胱癌与正常组织间表现出显著不同的表达。其中,嗜酸性粒细胞在肿瘤组和正常组均显示浸润丰度较低(P < 0.05),因此被排除在进一步分析之外(图 7C)。肿瘤组织中,先天 B 细胞、静息树突状细胞和活化树突状细胞上调,而 CD8+ T 细胞和静息肥大细胞则下调(图 7D–H)。xCell 方法分析的膀胱癌和正常组织中 64 种免疫细胞类型的免疫浸润景观见。尽管 xCell 结果未显示统计学显著差异(P < 0.05),但它们显示出与 CIBERSORT 分析相同的趋势:新生 B 细胞、静息树突状细胞和活化树突状细胞上调,以及肿瘤组织中 CD8+ T 细胞和静息肥大细胞的下调。因此,初生 B 细胞、静息树突状细胞、活化树突状细胞、CD8+ T 细胞和静息肥大细胞可能在膀胱癌发病机制中发挥关键作用。膀胱癌中免疫细胞浸润的分布。(A) 条形图显示每个样本中 22 种免疫细胞类型的分布。(B) 显示膀胱癌和正常样本中 22 种免疫细胞类型的表达热图。(C) 箱形图,显示膀胱癌和正常样本中 22 种免疫细胞类型的表达。(D-H) 箱形图显示膀胱癌和正常样本中六种免疫细胞类型的差异性浸润景观:(D) 原始 B 细胞;(E)CD8+ T 细胞;(F) 静息树突状细胞;(G) 活化树突状细胞;(H) 静息肥大细胞。每个 p 值显示在对应箱形图上方(NS: p > 0.05; *: p ≤ 0.05; **: p ≤ 0.01;****:p ≤ 0.0001)。为了研究八个关键基因(TP53INP2、STX2、PDLIM7、LIMS2、KCNMB1、IRAK3、IL11RA、CYP27A1)与免疫细胞之间的关联,采用了 Spearman 秩相关分析,分析它们与不同免疫细胞亚组的相关性(见图 8A、B)。结果显示:TP53INP2 基因表达与 M0 巨噬细胞呈正相关,与浆细胞呈负相关;STX2 基因表达与记忆 B 细胞、M0 和 M1 巨噬细胞及活化 NK 细胞呈正相关,与新生 B 细胞、活化树突状细胞、活化肥大细胞、单核细胞、静息 NK 细胞、浆细胞和未发育的 CD4+ T 细胞呈负相关;PDLIM7 基因表达与 M1 和 M2 巨噬细胞及静息肥大细胞呈正相关,与原始 B 细胞、初生树突状细胞、嗜酸性粒细胞、单核细胞、浆细胞和初生 CD4+ T 细胞呈负相关;LIMS2 基因表达与 B 细胞记忆力、M0/M1/M2 巨噬细胞、静息肥大细胞和 CD8+ T 细胞呈正相关,与活化和静息树突状细胞、嗜酸性粒细胞和单核细胞呈负相关;KCNMB1 基因表达与记忆 B 细胞、M0 和 M1 巨噬细胞呈正相关,与新生 B 细胞、活化树突状细胞、活化肥大细胞、单核细胞、浆细胞和新生 CD4+ T 细胞呈负相关;IRAK3 基因表达与 M0 巨噬细胞呈正相关,与新生 B 细胞、浆细胞和新生 CD4+ T 细胞呈负相关;IL11RA 基因表达与活化的 CD4+记忆 T 细胞和 CD8+ T 细胞呈正相关,与新生 B 细胞、活化树突状细胞、嗜酸性粒细胞、活化肥大细胞、中性粒细胞和初生 CD4+ T 细胞呈负相关;CYP27A1 基因表达与静息树突状细胞、M0 巨噬细胞、中性粒细胞和γδ T 细胞呈正相关,与初生 B 细胞、静息 NK 细胞、浆细胞和调控 T 细胞(Tregs)呈负相关。 结果显示,STX2、PDLIM7、LIMS2 和 KCNMB1 与记忆 B 细胞、巨噬细胞 M0/M1/M2、静息肥大细胞和 CD8+ T 细胞的浸润水平呈正相关,其中 M0 巨噬细胞与这四个基因的相关性最强。相比之下,新生 B 细胞、活化树突状细胞、单核细胞、浆细胞和新生 CD4+ T 细胞的浸润水平与 STX2、PDLIM7、LIMS2、KCNMB1 和 IRAK3 呈显著负相关。天真 CD4+ T 细胞与这五个基因的负相关最为显著。这些发现表明,STX2、PDLIM7、LIMS2、KCNMB1 和 IRAK3 可能通过调节肿瘤微环境中的免疫抑制浸润和免疫逃逸,影响肿瘤进展和患者预后。 (A, B): 这些图示展示了 22 种免疫细胞类型与八个关键基因之间的相关分析热图。图 9A 很可能显示了免疫细胞本身之间的相关性,图 9B 则可能显示了免疫细胞与八个关键基因之间的相关性,直观地展示了所描述的关系。为评估八个关键基因在区分肿瘤与非肿瘤样本中的诊断潜力,使用 TCGA 和GSE13507 膀胱癌数据集进行了受试者工作特征(ROC)曲线分析。TCGA 分析显示,所有八个基因的曲线下面积(AUC)均大于 0.7(见图 9A),显示出区分正常组织和肿瘤组织的良好诊断潜力。此外,对 GSE13507 数据集的分析显示,六个基因——LIMS2、IRAK3、STX2、CYP27A1、IL11RA 和 KCNMB1——AUC 值大于 0.7(见图 9B),显示出在区分健康邻近组织与肿瘤样本方面具有良好的诊断潜力。这些结果表明,所有八个基因都表现出膀胱癌与正常组织间的强烈区分能力,其中 LIMS2、IRAK3、STX2、CYP27A1、IL11RA 和 KCNMB1 具有更高的诊断潜力。为验证肿瘤和非肿瘤样本中八个关键基因(LIMS2、TP53INP2、IRAK3、STX2、CYP27A1、IL11RA、KCNMB1 和 PDLIM7)的表达水平,作者分析了它们在 TCGA 和 GSE7476 数据集中的表达。作者观察到,在 TCGA(训练)和 GSE7476(验证)数据集中,这八个关键基因在肿瘤样本中显著下调,符合孟德尔随机化结果(图 9C 、D)。因此,LIMS2、TP53INP2、IRAK3、STX2、CYP27A1、IL11RA、KCNMB1 和 PDLIM7 被提出为膀胱癌的潜在生物标志物。关键基因的 ROC 曲线。(A)TCGA 中枢纽基因的受试者工作特征(ROC)曲线;(B)GSE13507 中枢基因的 ROC 曲线;(C)TCGA 特征的基因交叉单基因表达箱图;(d)GSE7476 特征基因交叉单基因表达箱图。每个 p 值显示在对应箱形图之上(NS: p > 0.05;*: p ≤ 0.05;**: p ≤ 0.01;***: p ≤ 0.001)。为进一步探讨八个关键基因(LIMS2、TP53INP2、IRAK3、STX2、CYP27A1、IL11RA、KCNMB1 和 PDLIM7)在膀胱肿瘤发生中的潜在作用,作者进行了 qRT-PCR 检测,定量其在膀胱正常细胞系 SV 和膀胱癌细胞系 5637、T24 和 HT1376 中的表达水平。差异表达分析显示,与正常膀胱细胞系 SV 相比,LIMS2、IL11RA、KCNMB1 和 PDLIM7 的表达水平在三种膀胱癌细胞系(5637、T24 和 HT1376)中均显著下调。此外,HT1376 细胞中 IRAK3 表达显著下调,而 STX2 在 5637 和 HT1376 细胞中显著下调(见图 10)。后续箱形图分析进一步显示,膀胱癌细胞系中六个基因(LIMS2、IRAK3、STX2、IL11RA、KCNMB1 和 PDLIM7)表达显著降低,与生物信息学分析一致。这强烈支持这些基因在膀胱癌发展中起关键调控作用的结论。这些发现为进一步研究这些基因在膀胱癌免疫微环境中的特异机制及其作为膀胱癌诊断和治疗靶点的潜力提供了重要实验证据。柱状图显示 qRT-PCR 表达及关键基因的差异分析。(A-F) 条形图显示八个关键基因的差别表达分析结果:(A) LIMS2;(B) IRAK3;(C) STX2;(D) IL11RA;(E) KCNMB1; 以及膀胱正常细胞系 SV 和膀胱癌细胞系 5637、T24 和 HT1376 中的 PDLIM7。组间差异通过 Wilcoxon 秩和检验进行评估。每个 p 值显示在对应的条形上方(NS: P > 0.05;*: P ≤ 0.05; **: P ≤ 0.01;***: P ≤ 0.001)。总结 本研究结合多来源转录组数据及孟德尔随机分析,包括差异基因表达分析、加权基因共表达网络分析(WGCNA)和孟德尔随机化,识别出八个与膀胱癌风险显著负相关的候选基因:LIMS2、TP53INP2、IRAK3、STX2、CYP27A1、IL11RA、KCNMB1 和 PDLIM7。通过 ROC 曲线分析和独立数据集验证,确认这八个基因作为膀胱癌诊断生物标志物的强大潜力。体外 qRT-PCR 验证显示膀胱癌细胞系中 LIMS2、IRAK3、STX2、IL11RA、KCNMB1 和 PDLIM7 下调,符合生物信息学发现,表明这些基因可能作为潜在治疗靶点。通过综合多组学分析和实验验证,六个基因——LIMS2、IRAK3、STX2、IL11RA、KCNMB1 和 PDLIM7——被选为膀胱癌潜在的免疫相关生物标志物,为个性化治疗提供了有前景的生物标志物和治疗靶点。
|