分享

NGS免疫治疗指标分析丨MSI

 生物_医药_科研 2019-06-12

微卫星是一种短的串联重复序列被称短串连重复(Short Tandem Repeats, STRs)或简单重复序列(Simple Sequence Repeat, SSRs), 每单元长度在1~6bp之间由重复单元的构成。

微卫星不稳定性MSI(Microsatellite Instability)是指与正常组织相比,在肿瘤中某一微卫星由于重复单位的插入或缺失而造成的微卫星长度的改变而出现新的微卫星等位基因现象。MSI在结肠直肠癌中已被广泛证实,其发生机制主要是由于DNA错配修复系统的缺失导致。在其他类型的癌症中也检测到MSI,包括胃癌,子宫内膜癌,卵巢癌和肝癌。

癌症中检测开发MSI的不同方法需要考虑两个关键因素:首先,仔细选择所使用的微卫星分子标志物,以确保它们对MSI检测具有高度敏感性和特异性。其次,所使用的分析方法应该能明确鉴定MSI和突变等位基因的基因型。

01

癌症中MSI检测和鉴定技术的演变

▲图1. 癌症中MSI检测不同方法的概况

▲注:(A)聚丙烯酰胺凝胶电泳(PAGE),(B)毛细管电泳片段分析(FA),(C)变性高效液相色谱分析(DHPLC),(D)高分辨率熔解分析(HRM),(E)新一代测序(NGS)

在电泳后用聚丙烯酰胺凝胶进行银或溴化乙锭染色而不是放射自显影(图1A)。这种方法费力、耗时,并且具有较低的精度,已被新的方法所取代,将PCR与荧光引物和毛细管电泳相结合,通过使用 DNA测序仪,可以在单碱基分辨率下进行片段分析(图1B), 此工艺已改进,通过多重PCR扩增2-5个微卫星分子标志物,并自动识别等位基因的大小。这种方法至今仍是MSI检测的金标准。

变性高效液相色谱法(DHPLC)是一项在单链构象多态性 (SSCP)和变性梯度凝胶电泳 (DGGE)基础上发展起来的新的杂合双链突变检测技术,可自动检测单碱基替代及小片段核苷酸的插入或缺失(图1C)。

将工作温度 (柱温 )升高使DNA片段开始变性,部分变性的DNA可被较低浓度的乙腈洗脱下来。由于异源双链 (错配的 ) DNA与同源双链DNA的解链特征不同,在相同的部分变性条件下,异源双链因有错配区的存在而更易变性,被色谱柱保留时间短于同源双链,故先被洗脱下来,从而在色谱图中表现为双峰或多峰的洗脱曲线。

相比之下,高分辨率熔解分析HRM(图1D)是一种操作简单又经济,仅通过PCR之后的熔解曲线分析,就能检测PCR片段的微小序列差异,从而应用在突变扫描、序列配对和基因分型等多个方面,缺点是检测但是不能鉴定MSI。

最近,大规模并行的新一代测序技术NGS(图1E)已用于检测癌症中的MSI。NGS的一大优势是可以检测大量的MSI,范围从5到几十万个MSI不等,具体数量这取决于文库的制备过程。

02

MSI在肿瘤中的分布

已发现MSI存在于大部分癌症中,其频率从<1%到30%不等。

TCGA数据库18种癌症外显子数据的MSI-H分布

癌症中,MSI-H病例比例高的癌症有:子宫内膜癌 (30%)、结肠癌 (19%) 、胃癌 (19%)和直肠癌(3%)。

据报道,虽然在 MSI-H 肿瘤中, 微卫星发生不稳定事件的频率和微卫星等位基因突变的数量显著升高, 但同一位点在 MSS 病例中,它们发生不稳定的频率却很低。

在同一种肿瘤或跨肿瘤间,MSI-H和恶性MSS样本的MSI频率存在相关性,表明恶性肿瘤内部和跨肿瘤间的微卫星不稳定模式存在相关性。 一个典型的例子是相邻基因 ACVR2A和 ORC4。

03

微卫星Panel

为了使世界上不同实验室用于癌症MSI检测的微卫星panel标准化,国家癌症研究所(NCI)研讨会提出了一个panel,该panel由两个单核苷酸重复(BAT-25和BAT-26)和三个双核苷酸重复的微卫星组成(D2S123,D5S346和D17S250),用于检测结肠直肠癌中的MSI,其中呈现两种或更多不稳定标记物(如:检测更多的标志物且≥30-40%)定义为MSI / MSI-H。如果没有标志物或仅有一种标志物不稳定,则在其他肿瘤中被分为MSS(微卫星稳定)或MSI-L(如:检测更多的标志物且 <30-40%)。尽管仍然存在争议,但在临床上,MSS和MSI-L肿瘤属于同一组。

研究人员认为,MSI检测中单核苷酸重复的微卫星是最合适的标记物,因为它们更敏感,几乎都是单态,只需要较少的正常匹配样本。最近,一组五个长单核苷酸重复微卫星(BAT-52,BAT-55,BAT-56,BAT-57和BAT-59),用于早期结肠直肠病变的MSI检测,显示出更高的灵敏度。

自NGS的发展以来,现在可以分析更多数量的微卫星以及基因组中可能的所有微卫星的MSI检测,这一进展可以进一步改善癌症中MSI的检测。有两项研究都表明:一些不稳定的微卫星是肿瘤内和/或肿瘤间的特异性,且发现在所有MSI-H癌症中最常见的不稳定微卫星。

近期发表的三个panel用于检测癌症中的MSI,分别是(1). MSIplus :该panel评估3种致癌基因(KRAS,BRAF和NRAS)的突变和17种微卫星。(2).ColonCore:该panel同时检测MSI和36个CRC-相关基因的突变。(3).pan-cancer:该panel包含111个高信息度的微小卫星位点。 

04

癌症中MSI检测的计算方法

▲癌症中基于NGS数据的不同MSI计算方法概况

▲注:(A)基于微卫星重复序列的长度分布比较的方法,包括MSIsensor,mSINGs,MANTIS,Cortes-Ciriano方法和MSI-ColonCore;(B)基于所有序列的总突变负荷和/或微卫星的INDEL负荷方法,包括MSIseq Index,MSIseq /NGS分类器和Nowak方法。

第一项基于结肠直肠癌和子宫内膜癌的研究,所使用的数据来自于TCGA的WES和WGS数据,进行MSI的检测方法。使用1~4个核苷酸重复的微卫星,通过使用Kolmogorov-Smirnov统计方法比较肿瘤与匹配的正常样本之间的长度分布来检测微卫星不稳定,但未使用MSI / MSS肿瘤分类器。

随后,开发了用于癌症中的MSI检测的不同方法,通过所有等位基因的read 计数,对所选择的微卫星的长度分布进行比较(见图A)。

4.1 MSIsensor

例如:MSIsensor,是用C++程序编写的,自动检测体细胞微卫星变化的程序。它通过配对的 肿瘤和正常样本中测序深度均大于等于20的微卫星位点,建立每个微卫星重复序列的预期(正常)和观察(肿瘤)长度的分布,并使用Pearson的Chi-Squared进行检验, 若显著不同, 则认为该微卫星位点不稳定; 最后统计不稳定位点的比例, 若该比例超过阈值, 则判定为MSI-H, 其中, 阈值是根据该指标在一组样本上(包括MSI-H和MSS的样本)的累积分布确定。

在242例子宫内膜肿瘤-正常配对样本中,MSIsensor计算的分值与临床度量密切相关。如果一个样本5和7个分子标志物都是阳性,则认为是该样本是MSI,否则是MSS。在71个MSI样本中,70个样本的MSI分值>3.5。另外,168个MMS样本中,有165个样本的分值<3.5。

由于很多情况下,没有配对的正常样本,或者没有相关正常组数据来构建正常对照,所以,发布了0.3版本的MSIsensor,该版本能对仅有肿瘤样本的数据进行分析,通过使用信息熵理论,计算每个微卫星分布的信息熵值。

通过测试结果表明,其性能与配对肿瘤和正常序列数据输入相当(如上图所示)。并且建议,根据不同的肿瘤类型设置不同的MSI 阈值(例如:TCGA UCEC,MSI high:MSI得分> = 13%)。

4.2 mSINGs

mSINGs首先判断每个微卫星位点的稳定性, 根据不稳定的微卫星位点的比例来判断样本的MSI状态。 对于每个微卫星位点, mSINGs试图找到一个指标来量化其稳定程度, 并基于一组MSS样本建立各微卫星位点该指标的参考值, 对于给定样本的某个微卫星位点, 若该指标取值超出参考范围, 则认为该微卫星位点不稳定。通过这种方式, mSINGs解决了仅有肿瘤样本情况下MSI的判定问题。

从上述mSINGS的方法介绍可以看出, 各微卫星位点稳定性指标的参考值是影响mSINGS准确性的重要因素, 而参考值的计算依赖于合理地选择一组MSS样本。为了保证判别的准确率, 用于参考的MSS样本与待检测的样本应该具有较好的一致性, 如测序、癌种方面的一致性。在实际使用中,常常需要自行建立参考值。

▲在Exome, ColoSeq,UW-OncoPlex数据集中不稳定微卫星位点的分值

▲分值的累积分布曲线

每个试验根据微卫星不稳定基因座的高、低分数分成2组,根据累积分布曲线,MSI阳性结果的阈值时0.2(20%)。

4.3 MANTIS

MANTIS是计算肿瘤-正常配对样本中每个微卫星位点的等位基因分布差异,最后将所有不同的分值取平均作为肿瘤-正常配对样本的MSI分值。

上述基于一般统计模型的MSI检测方法通过设计一个MSI判定指标, 在一组样本上, 使用累积分布等方式, 确定该指标的阈值, 实现对MSI状态的检测. MANTIS一文从MSI判定的准确性及计算资源使用两个方面对mSINGS、MSIsensor以及MANTIS三种方法进行了评估, 阈值、用于分析的微卫星位点的数量以及癌种都会影响软件的准确性. 尽管在敏感度和特异度方面有细微差异, 三个软件工具均可以准确的检测样本的MSI状态. 然而, 不同于mSINGS和MANTIS, MSIsensor没有对等位基因分布中的支持reads数进行规范化以及质控, 在配对的肿瘤-正常样本测序深度不同的情况下, 可能出现假阳性的结果.

4.4 mSINGS,MANTIS和MSIsensor比较

mSINGS、Misensor 和 MANTIS的默认阈值(MANTIS 0.4, mSINGS 0.2, and MSISensor 3.5%) 。在一定的阈值范围内, 用mSINGS、Misensor 和 MANTIS进行数据测试,对于每个工具都有一个性能好的阈值。MANTIS 的精度为 97.1%,阈值为 0.4。mSINGs 的精度达到 96%, 阈值为 0.1, MSISensor 峰值为 95.4%, 阈值为3.5%。

每个工具用测试数据的最多位点列表进行计算:显然,对于最多的基因座位数是40来说,mSINGS比MSISensor和 MANTIS 更准确(分别是98.2%, 91.8% 和 97.4%)。总体来说,mSINGS 在位点数量较少的情况下,准确性更好, MSISensor在位点数量更多的情况下准确性更好, MANTIS 在更广泛的位点上表现良好。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多