分享

NGS二代测序技术与转化医学研究

 刘得光3p6n6zqq 2021-05-21

 NGS肿瘤体细胞突变检测


样本类型:组织样本(新鲜组织+石蜡切片)以及cfDNA样本

     可查阅2017年 FDA批准的FoundationOne CDx™MSK-IMPACT两个组织样本大Panel以及2018年CFDA批准的国内几个小Panel的相关产品说明。另外对于cfDNA血浆样本,目前除EGFR基因外,尚未有相关产品获批

接下来从样本类型入手,对这两种类型样本相关NGS产品的主要注意事项进行说明:

一. 肿瘤组织样本WGS/WES/靶向 Panel测序产品:        

Part1----测序前:该产品/公司能否提供以下十一项内容或说明?


(1.1)该产品是否包含肿瘤纯度评估内容:

        肿瘤组织是不同亚型的肿瘤细胞和正常细胞的混合物,原始送检样本中肿瘤细胞比例直接决定着最终检测结果,尤其是因肿瘤细胞比例过低(<10%,MSK-IMPACT)时带来的假阴性结果。所以不管是WES/WGS还是Panel靶向测序,在交付测序分析结果的同时也应提供肿瘤纯度评估结果;

(1.2)该产品是否为Tumor/Normal配对检测:

      Tumor only型产品虽然报价低,但大部分公司下游生信分析方法尚不成熟,除了Foundation Medicine的Tumor only分析方法获FDA批准认可外,其它相关公司更多是出于控制成本和占领市场而非检测结果准确性的角度考虑。

(1.3)该Panel设计的内含子区域及建库测序方法 (见图1):

      Panel产品中内含子区域的有无以及内含子位置和数目决定了能不能进行DNA层面的融合基因检测以及融合基因检测结果的可靠性;

      建库测序方法---扩增子建库or杂交捕获建库:基于杂交捕获法得到的NGS测序数据相较于扩增子测序数据往往具有较好的均一性,有利于下游生信分析,尤其是拷贝数变异和融合基因的检测;同时扩增子Panel增加或删减个别基因都会影响到全局的引物扩增效率,对于临时增加或减少扩增子Panel中基因数目的操作需要慎重对待;

(1.4)该产品的测序深度与突变检测下限:

      Panel组织样本的测序深度:(质控后clean data)在500X~1000X之间即可,随着测序深度增加,引入PCR重复序列的比例也随之升高,无效数据大幅增加,对于体细胞突变检测意义不大;

      突变检测下限:不管是1%,还是5‰,请对方同时提供该检测下限的突变reads支持数目;

(1.5)该产品转产前的验证报告

      根据该产品转产前用于验证的标准品基因数目、突变位点数目,QC,数据覆盖度均一性,人员操作的精密度以及验证结果的PPV,NPV等情况对该产品性能有基本了解。

(1.6) 该产品检测内容:

        一个设计良好的组织样本NGS产品可以对点突变(SNV)、插入缺失          (insert/deletion)、拷贝数变异(CNV),基因融合,微卫星不稳定(MSI)五部分内容进行检测,而且每部分都应有对应的检测下限;

       此外,对于具有家族病史的肿瘤患者,还应将其体细胞突变和配对的Normal样本中的germline突变结合起来进行分析,去年癌症癌症图谱计划发表的两篇文章进一步显示癌症患者中存在germline致病突变的比例(~8%)不容忽视:见 cell1,cell2,进一步回应了经典的肿瘤二次打击学说,这就是经典学说的魅力吧!

(1.7)  该产品变异检测的其它备选方法(见图2):

      目前不同主流体细胞突变检测软件的突变检出一致率并不高,非主流突变检测软件更难称得上靠谱,所以重要项目同时用两套以上分析方法进行分析还是有必要的。

(1.8)  技术人员资质及用药数据库建设及更新情况

      避免自己成为----专业背景不对口、缺乏相关工作经验的后台技术人员推出的这个新产品的小白鼠;

(1.9) 建库前的捕获测序以及样本特性(FFPE石蜡切片)等引入的假阳性突变

       高深度的靶向捕获测序探针覆盖的均一性、捕获过程中的DNA损伤以及FFPE样本(比如2年以上)的处理和储存过程引起的核酸损伤和降解,导致的生信分析结果中出现大量的GA/CT假阳性突变,以及与测序平台相关的背景噪音--大量样本中普遍存在的低丰度突变,如何解决?

(1.10)有没有定期的质量验证和纠正措施

        基因测序公司的人员流动性普遍比较大,即便以上内容全都做的很到位,还需要有良好的规章制度,比如定期的自行验证报告,以保证不同人员批次产品结果的稳定;

(1.11) X10测序平台的同line污染如何应对

     大部分小公司都会把测序业务外包给具有 illumina X10测序平台的大公司,但X10平台建库过程中样本预混合时间相对其它测序平台较长,同一条line的不同样本在预混合过程中barcode脱落引起的样本间的相互污染( 但不确定后来illumina很快推出的Novoseq平台是否已经解决该问题),如何应对?

图1:不同建库方式对肿瘤体细胞突变检测的影响:来源:https://max.book118.com/html/2017/0703/120032109.shtm
图2:不同体细胞突变分析软件gDNA检出结果一致性比较:来源:https://www./articles/srep36540

Part2---测序后:样本质控信息及突变注释数据库版本


(2.1)组织样本测序数据质控信息应包括

        a. 插入片段长度的均值/中位数;b. GC比例及均一性分布图;c. 样本间交叉污染评估(防止错配及其它样本污染);d. bam文件靶区域覆盖度的均值/中位数;e. 其它Q30等指标

(2.2) 用于突变注释的数据库版本

        COSMIC/ClinVar等重要数据库每年都会更新多版,这些数据库直接影响着突变致病性的解读,需要及时更新,另外也需要及时引入其它数据库对常规数据库中未收录的非同义突变的致病性进行预测。

 二. cfDNA样本Panel产品

 Part1----测序前:该cfDNA产品是否能提供以下十项检测内容或说明:


2.1. 获得CAP/CFDA认证资格的公司与其产品靠谱的相关性有多大?

     一方面用于CAP/CFDA认证考试的标准品位点的突变频率相对较高;另一方面任何一家公司都会不计成本地投入人力、物力做好标准品以拿到这些证书;最后标准品跟实际样本往往区别很大,所以拿到这些证就像考研过了国家线,与其实际科研解决问题的能力不存在必然联系;

2.2. 采血比采组织样本方便,直接用血液样本的NGS结果代替组织样本?

      发文章可以,做biomarker筛选最好不要这样干,2018年的相关文献报道的cfDNA和组织样本体TMB/bTMB的一致性也仅在0.64左右,其突变位点检出的一致性更低,建议有组织样本就尽量用组织样本。2017年对国外主流ctDNA公司检测结果的比较的研究报道以及2018年ASCO发布的ctDNA相关的临床建议,都显示当前业内对肿瘤ctDNA的临床应用价值还存在不少争议。

2.3.   样本融血影响大不大?

     轻度溶血需标记备注,中度以及重度融血影响检测结果,须重新送样,此外血样处理时间,采样管材质等众多因素都会影响到ctDNA的检测结果。

2.4. 是否需要血浆/白细胞配对检测?

     当前那些声称可以对cfDNA血浆样本进行非配对检测的都是耍流氓;

2.5. cfDNA样本的WGS/WES产品是否靠谱?

       某些癌种在科研上有对cfDNA进行WGS/WES测序分析的例子,但实际生产中必然存在较大范围漏点(捕获不到,测不到)的情形;

2.6. cfDNA/组织样本体细胞突变检测是否同时应设置检测上限 [见图3]?

       由于肿瘤组织的异质性,携带特定体细胞突变的肿瘤细胞在组织中的占比介于0%-100%之间,因此不管是cfDNA还是组织样本,从保证结果特异性的角度出发对体细胞突变设置检测下限是有必要的,但是设置检测上限是没有根据的,其背后可能反映着生信分析流程的bug以及后台技术人员的不专业;

2.7. cfDNA Panel建库测序的UMI分子标签及测序深度

       cfDNA必须加UMI建库测序(组织则样本没必要),以减少低频突变假阳性位点的干扰,另外UMI深度及支持数目应体现在下游质控分析和变异检测结果中;

       根据2016年的文献及业内主流公司产品,cfDNA样本测序深度应在20,000X以上;

2.8.  请对方同时提供cfDNA产品转产前验证报告及ctDNA与组织样本突变检测一致性报告

       GIAB官网提供的标准品中的已知位点毕竟有限,有一定样本积累公司会对ctDNA与组织样本突变检出一致率进行比较,从整体层面对自己cfDNA产品做一个评估;

2.9.  请对方提供白细胞克隆造血等特殊情况的解决方案

        约5%~10%的老年人会发生克隆性造血---血液中存在低丰度的克隆性造血相关基因突变,这些突变往往难以与肿瘤特有突变进行区分;

2.10. 请对方提供检测内容及各项检测内容的检测下限

       目前无法从cfDNA层面检测微卫星不稳定(MSI),在拷贝数变异(CNV)检测方面也无法通过评估cfDNA中ctDNA比例来估计肿瘤细胞占比;其它基因融合及insert/deletion检测也往往没有组织样本准确;


图3:肿瘤组织异质性:来源:网络

 Part2: 测序后:数据质控及突变检测结果IGV验证


数据质控:除reads测序深度外,必须同时提供UMI深度信息,其它质控条件同组织样本;

突变检测结果IGV验证:cfDNA突变检测难度较大,结果容易出现假阳性突变,因此对于最终检测结果的可靠性,需同时索要用于变异检测的bam及索引文件,在windows本地安装的IGV基因组浏览器上对SNV/INDEL以及融合基因进行验证,最后突变注释相关注意事项同组织样本。

三. 实际项目中的一些常见疑问


Q1: 同一个病人不同时间点上的体细胞突变检测,配对Normal样本是否需要多次采样测序?

        对于具备较好技术积累和运营透明度的测序公司,Normal样本的germline突变在不同批次建库测序分析中不会有大的起伏,配对Normal样本只测一次即可;

Q2:同一个病人在不同时间点上cfDNA样本的体细胞突变检测结果无交集?

      同一个cfDNA样本不同文库的测序分析结果是会存在差异,但是如果入组的多个个体都在不同时间点上的体细胞突变都没有交集,则需考虑质控以及该产品是否存在bug,可换一家公司对原始数据重新分析;

Q3: 结题报告中的结果与实验设计及预想结果出入较大:

      不用急着否定自己的实验设计,先把原始数据换一家公司重新分析一遍,着重比较数据质控和突变检测两部分内容;

Q4:Panel大小与TMB及突变检出数目的相关性?(见图4)

        如图4所示:外显子总长度在1Mb以上(基因数目约300个以上)的Panel,其TMB值与WES数据有较好的一致率。同时大Panel在肿瘤纯度、染色体倍性评估以及相关的拷贝数变异分析上也会有较准确的结果;

Q5: 关于合同上经常出现的数据量及测序深度:

      一味吹嘘测序数据量大、测序深度高的的产品往往水分比较大--这是实在拿不出其它硬性技术指标的节奏;另外对于测序深度,最好分清楚是raw data、clean data、重后的bam文件还是UMI深度这四个中的哪一个;

Q6: 肿瘤驱动突变免疫组库技术肿瘤疫苗ctDNA甲基化早筛等前沿技术产品?

       及时跟进,暂不做评价

图4:Panel大小与TMB相关性:来源文献:https://www./articles/s41591-018-0134-3

      NGS肿瘤体细胞突变检测部分的注意事项暂且写到这里,相关内容会持续更新,RNA-seq溶瘤病毒denovo组装部分内容见后续章节。希望能对药企/转化医学中涉及NGS的相关研究有所帮助。同时也欢迎大家交流执指正!

 写于 2019年3月12日夜


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多