分享

TCGA结合自测数据的Risk Score预测早期子宫内膜癌淋巴转移

 科研菌 2020-12-17

即时IF快要5分了!(暗暗搓手)

图片来源:桑格助手

Pilot Study to Establish a Novel Five-Gene Biomarker Panel for Predicting Lymph Node Metastasis in Patients With Early Stage Endometrial Cancer
建立新的五基因生物标志物组以预测早期子宫内膜癌患者淋巴结转移的试验研究

一. 研究背景

在美国和欧洲,子宫体子宫内膜样癌(EEC)是最普遍的妇科恶性肿瘤。淋巴结转移(LNM)是EEC预后和治疗的关键决定因素。预测EEC患者LNM的生物标志物将是有益的,可以进行个性化治疗。当前对EEC中LNM的术前评估不足以准确预测LNM并防止过度治疗,目前术前使用包括肿瘤浸润深度,肿瘤等级或肿瘤大小在内的临床危险因素对淋巴结状态进行评估,但在临床实践中,这种评估的阳性预测值较低。

在本研究中,作者通过分析来自此类患者的手术标本中的基因表达,调查了早期EEC临床患者中LNM的临床病理参数和分子标记。这样的遗传特征可以帮助指导个体化治疗并减少EEC患者的手术发病率。这项初步研究建立了用于预测早期EEC中LNM的生物标志物标记。

二. 分析流程

三. 结果解读

1. 研究人口的基本特征

作者为了确定早期EEC的分子特征,选取了仅包括术前磁共振成像记录的具有临床T1肿瘤的患者的数据,又由于对照研究旨在鉴定可预测EEC患者LNM的mRNA标志,所以作者使用多方法制备这些RNA测序文库,并通过使用RT-PCR来测量EEC患者手术标本中的特定基因表达来鉴定临床预测标记。作者为了鉴定在TCGA和CGH数据集中都高度表达的基因,并且保证样本之间的差异最小,使用了NormFinder用于鉴定适当的归一化基因,根据候选标准化基因在CGH和TCGA数据集中的表达稳定性来对其进行排名。RPL19被确定为这项研究中的合适参考基因。

表1列出了CGH数据集中患者的基本临床病理参数(n = 24)。这些患者被分为18例[LN [–]]淋巴结阴性的患者和6例[LN [+]]淋巴结阳性患者。由表可知,两组的体重指数,年龄,手术途径和绝经状态相似,LN [+]组的高级别肿瘤和LVSI阳性比例更高。

表1. CGH中的患者的RNA测序基本特征(n = 24)

作者分析了TCGA中EEC系列患者中的mRNA表达谱,因为只涉及EEC诊断,所以仅选择患有临床I期(阴性淋巴结)或IIIC(阳性淋巴结)疾病的患者进行比较。根据TCGA数据,作者确定了289名EEC患者,这些患者具有全面的淋巴结状态,数据中包括了基因组表达和临床数据。在这289名患者中,有256名为LN [–],33名为LN [+] (表2)。由表可知患有LNM的TCGA患者可能接受过开放手术,患有高度肿瘤或深肌层浸润。

接着作者进行了RNA序列数据处理和差异表达分析,使用Bioconductor软件包计算表达水平,在对原始数据进行预处理并将其标准化为RPL19参考基因后,即可确定有无LNM的患者之间的DEG。

表2. TCGA中子宫体子宫内膜癌患者的基本特征(n = 289)
2. CGH和TCGA中EEC阳性节点和阴性节点的DEG

作者对CGH数据集中的24位患者进行了RNA测序,使用FastQC评估读取的质量,发现所有读取的Phred得分均高于30,即错误率较低。并发现LN[+]和LN[–]癌组织之间有779个DEG。

作者还对TCGA数据集中的数据进行了RNA测序,包括33个LN[+]和256个 LN[–]EEC组织。在这些组织之间,发现了41个DEG。

        其中,有16个DEG在CGH和TCGA中都被识别出(表4)。

表4. CGH和TCGA数据集中的LN[+]与LN[–]的DEG
3. 基于序列的模型构建和特征选择

对于前文的16个DEG,CGH数据集中这16个DEG的热图如图2所示,其中P01-P06表示LN [+],N01-N18表示LN [-];黄色代表高表达,橙色代表低表达。

表4. CGH和TCGA数据集中的LN[+]与LN[–]的DEG
3. 基于序列的模型构建和特征选择

对于前文的16个DEG,CGH数据集中这16个DEG的热图如图2所示,其中P01-P06表示LN [+],N01-N18表示LN [-];黄色代表高表达,橙色代表低表达。

表5. TCGA和CGH基于序列的预测模型之间的一致性级别的列联表
4. PCR验证和基于PCR的预测模型构建

作者使用72个患有早期EEC的患者的独立队列,用于8个已鉴定的DEG(ASRGL1,ESR1,EYA2,MSX1,RHEX,SCGB2A1,SOX17和STX18)的qRT-PCR验证。另外17例未行盆腔和主动脉旁淋巴结清扫术的患者被排除在外。表3列出了该队列(n = 72)的临床特征。

所有72例患有临床T1肿瘤(局限于子宫)中63例为LN[–],9例为LN[+]。与TCGA数据相似,这些LNM患者更有可能患有高度肿瘤和深层肌层浸润,LN[+]患者的LVSI比例也更高。

表3. 验证队列的基本特征(n = 72)

8个DEG的相对表达在图3A中示出。其中,LN[+]和LN[–]组之间观察到5个DEG。LN[+]中发现ASRGL1,RHEX,SCGBA1,SOX17和STX18的相对表达显着降低。其中数据表示(相应基因的阈值周期-RPL19的阈值周期),ΔCT阳性表示表达水平低于参考基因RPL19,使用Mann-Whitney U检验确定的5个基因(ASRGL1,RHEX,SCGB2A1,SOX17和STX18)存在显着差异。

图3A. 验证队列中8种基因的相对表达水平数据

这5个基因表达后和一临床参数(肌层浸润深度)结合,确定了各种机器学习模型的性能,如表6所示。随机森林模型具有最高的敏感性和特异性。其中多种机器学习方法(包括SMO和顺序最小优化)。

表6. 基于PCR的模型的预测性能使用多种机器学习方法的五基因面板
5. mRNA标记的构建和风险评分表述

为了评估这些mRNA标记在EEC中预测LNM的性能,作者进行了ROC分析(图3B,C)。其中图B表示ROC曲线的5个单表达mRNA,可以看出5个mRNA的AUC范围为0.705至0.829,表明这5个标记可以区分LN[+]患者和LN[–]患者;图C表达量结合的5种mRNA表达的ROC曲线。

图3B,C. 单mRNA / 5mRNA表达的ROC分析

表7列出了每种mRNA标记的AUC,敏感性和特异性。在研究的五种mRNA中,SCGB2A1被认为是识别LN[+]患者的最佳标记,因为它具有最高的敏感性和特异性。

为了使这些mRNA标记能够在临床实践中应用并提高mRNA预测功效,对于验证队列中的每位患者,根据5种mRNA组合计算风险评分。根据最佳风险评分截止值-1.77,在验证队列中将72例EEC患者分类为高风险(n = 18;风险评分> -1.77)或低风险(n = 54;风险评分<-1.77)。可知LN[+]组的风险评分明显高于LN[–]组。此外,5种mRNA的组合组显着高于任何单个mRNA标记,并且具有出色的AUC,灵敏度,特异性和准确性,PPV为44.4%,NPV为98.1%(图3C和表7)。

表7. mRNA表达标志物预测EEC淋巴结状态的性能

本文作者通过全面分析,鉴定出5个基因(ASRGL1,RHEX,SCGB2A1,SOX17和STX18)作为预测性生物标记,代表了进一步机制研究的新靶标,这种5种基因表达谱的模型可作为预测早期EEC患者LNM的有用工具。预测模型应进行前瞻性测试,并与当前的临床评估结合使用,以优化首次治疗前EEC患者的个体治疗计划。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多