分享

测序会取代芯片检测CNV吗?且看这篇研究

 绵绵细雨下不停 2017-11-12

Introduction

DNA 拷贝数变异(CNV)在正常个体中占据高达300Mb的变异数据,拷贝数变异的长度可达上百万的碱基对 。这表明不同个体间基因组的多样性。目前已知一些CNV变异与人体疾病相关,如常见的DiGeorge 综合征 (OMIM 88400),Angelman 综合征 (OMIM 105830),以及神经发育缺陷疾病如ATR综合征。


染色体微阵列分析chromosomal microarray analysis 即CMA(包括比较基因组杂交array-CGH和单核苷酸多态性芯片SNP-array)一直是检测致病性CNV的金标准。与CMA相比,二代测序技术(NGS)则是一种可供选择的检测遗传变异的高新技术,但其检测分辨率未知。近来,一些回顾性研究支持了NGS在检测CNV上的可行性,但这些研究的样本量均有一定限制。为研究全基因组低深度测序在检测染色体数目及结构异常的诊断效率和可行性,我们应用了内部的CNV检测方法对570例多中心患者进行了染色体分析。共有198例流产,37例死产,149例产前和186例产后样本进行了检测分析。

Materials and methods

分别收集早孕期流产的样本及死产的胎儿组织,产前标本的绒毛膜组织,羊水及脐带血,产后患者的外周血样本。YH(炎黄,第一个重头组装测序的亚洲人基因组)淋巴细胞白血病细胞系也被用于方法学评估。所有样本都经过质控。  

CNV分析

1.质控和依据滑动窗口的假定CNV的筛选:对比序列依据比对基因组的位置分类进入长约50Kb且有5kb增度的可调整的滑动窗口。每个窗口的覆盖度依据read数量进行计算并经过两个步骤纠正偏倚(GC 校正及人群标准化校正)。对于质控,我们先去除了窗口中的染色体数目变异,接着计算了窗口拷贝比的基因组范围内的标准差(GWSD)。经过两部校正,如果样本的GWSD<>

2.边界确认及调整非重叠窗口的增益比:为了更准确的确定CNV的边界,对其序列也被分类成了非重叠窗口。之后,对于任何特别调整的非重叠窗口(5kb),都计算出增益比,即为增益差除以覆盖度。为了检测最准确的CNV区域边界,我们用circular peak-through筛查。同时还考虑重新决定片段或区域的平均拷贝数。

3.个体CNV注释:当CNV的平均拷贝数比率小于0.9时,即定义为拷贝数缺失(嵌合体缺失突变:0.6-0.9);当其平均拷贝数比率大于1.1时,则定义为拷贝数重复(嵌合体突变:1.1-1.4)

CNV分类方法基于ACMG(AmericanCollege of Medical Genetics and Genomics guidelines)变异指南,具体如下:

a. 致病性或可能致病性拷贝数变异(pCNV):包含有GeneReviews定义的常染色体显性致病基因;覆盖于DECIPHER中已知综合征的重要基因区域的50%;覆盖有ClinvarCNV收录的致病性CNV的全部区域或者包含有OMIM及HGMD同时收录的基因;

b. 致病意义不明确的拷贝数变异(VOUS):覆盖ClinvarCNV中作为VOUS(致病意义不明确)变异的全部区域;或为缺失性突变且仅在OMIM/HGMD的任一数据库有收录;或包含有某些基因,但该基因是否存在于基于CMA数据库(ClinvarCNV,DECHIPHER,及Baylor医学院和中国香港大学的内部数据库)收录的计量敏感区域仍旧未知。  

Result

为了评估全基因组低深度测序检测CNV的有效性,我们通过与已知的CMA芯片检测结果进行比较。68例包含不同CNV的DNA样本(51例产前样本,17例产后样本)以及3例嵌合体致病性的CNV产前样本被用于进行NGS检测。NGS检测结果及与CMA比较的结果如表1.

除了确认许多异常的CNV,我们的测序方法还在产前样本中确认了42个长度范围在1.3~69.1Mb的pCNV,这与CMA的检测结果100%一致。在产后组中,我们的方法确认了9个长度在1.6~20.6Mb的pCNV,同样与CMA的检测结果一致。由此可见,NGS检测pCNV的敏感性及特异性均为100%


NGS还检测到了6个嵌合体突变,其中4个为pCNV,与CMA方法检测到的3个嵌合体pCNV样本结果一致。在样本HK12c637中,发现了一个2.9Mb的嵌合体拷贝数增加(约为40%的变异水平),该变异位于17p13.3(698057-3593612),靠近一个拷贝数缺失(167kb)及拷贝数重复(517.5kb)的结合位点。在样本HK12C0310中,我们的方法确认了一个位于5p15.33(684118–855103) 的约171kb的嵌合体缺失以及一个长度约为34.8Mb的嵌合体三倍体拷贝数变异,其位置在12p11.1p13.33(60105-34836577) ,两种变异都在约50%的水平。第三个样本HK12C0669,发现了一个位于染色体1q25.2q44( 179647508-249171049) 的终末端的嵌合体重复,而另一个终端嵌合体拷贝数的缺失则位于染色体4q34.3q35.2( 177543828-190910498) , 两种变异都在大约50%的水平。整体来讲,NGS在染色体数目变异及pCNV的检测上和CMA方法有着一致性,从结果看,NGS方法的敏感性,特异性均为100%

在评估了NGS的分子核型分析技术检测pCNV的敏感性和特异性后,我们在自己的常规分子诊断实验室应用此技术进一步评估它的实效。随后,我们获得了2013年1月到2015年3月间来自中国及香港的四个三级转诊中心地的570例样本。这些样本包括198例流产儿,37例死产儿,149例产前样本及186例产后样本。

测序分析在549例(96.3%)样本中成功进行。在测序失败的样本中(21/570),10例为早孕期的流产儿,3例为死产儿,余下8例是由于超声检测异常而终止妊娠的样本。这些样本的DNA质量都很低,很有可能是因为胎儿死亡造成的。总的来讲,我们在549例样本中确认了2411个CNV(790个拷贝数缺失,1621个拷贝数增加)。119例样本确认有非整倍体变异,还有82例样本检测出共计104个pCNV(74个拷贝数缺失,29个拷贝数增加),整体诊断率为36.6%(详见表2)。


在这些样本中,NGS分子核型技术确定出11例患者有非整倍体的嵌合体突变,其中绝大多是早期流产儿(10/11),所有病例均通过荧光定量PCR排除了母系细胞污染的情况。


在549例NGS检测成功的样本中,我们从仍有足够DNA样本的368例样本中随机选取了25例进行CMA验证。选取的样本中包含有探针覆盖范围内的5个非整倍体变异(其中3例为嵌合体突变),13个pCNV。验证提示,NGS的检测结果与CMA的结果100%一致,这证明了NGS测序平台的高度一致性和可实施性


Discussion

此研究用于探究NGS相比于CMA是否是一种更有效的检测方法。在验证组中,NGS的方法与CMA在检测结构及嵌合体突变上的检测结果完全一致。更重要的是,因全基因组测序的广泛检测及我们的算法的较好分辨率(50kb),我们还发现了CMA检测未能发现的其他32个致病意义未明确的拷贝数变异

在临床检测组中,NGS方法达到了36.6%的诊断率,提示了在遗传诊断中约有1/2.7个人存在染色体数目异常或者结构异常。这种较高的拷贝数变异发现率可能主要是由于其在自然流产组中有较高的诊断率。然而,自然流产组别是染色体微缺失或者微重复分析在临床诊断中得到较好应用的代表。对于死产的样本组,由于样本量较小(34例),相较其他先前的研究,样本偏倚可能会造成本研究中观察到的较高诊断率。不过不管怎样,我们当前的数据都真实的显示了一个较高的诊断率。对于产前和产后样本组,NGS方法则有比传统的三级转诊中心的核型分析技术更好的诊断率。除了非整倍体变异检测,pCNV的检出率在早期流产组,死产组,产前样本组及产后样本组的诊断率分别为6.4%,5.9%,13.5%,26.3%。与CMA相较,我们的方法在不同组别的诊断率均与其一致。

 

 

对于进行非侵入性检测的产前样本,从接受样本到获取诊断报告的周期为10天。基于HiSeq 2000的测序平台,一次可有多达96个样本进行评估检测(每次运行两个),这将会降低患者的花费。通过DNA提取,建库,及1500万单向HiSeq 2000平台测序,每个样本的花费大约为120美金。假设每个员工的薪金为每小时50美金,每次完成测序流程运行需要16个工时,则每例样本的实验员薪金应为67美金;所以,每个样本的检测花费约为187美金,与传统的核型分析花费相比,这是绝对有优势的。此外,对于不同样本,NGS还能有更广泛的染色体数目及pCNV的检测,特别是在产前诊断中更有价值。

 

与CMA方法一样,NGS检测CNV的限制之一是对DNA有高质量的要求。因此,此方法可能不能完全应用于从死亡胎儿样本中提取的DNA(6.4%,21/328样本未能通过质控检测);更重要的是,不管是aCGH还是基于测序深度检测CNV的低深度的全基因组测序都不能检测三倍体变异。在本研究中,样本ID 14S0026197通过SNP芯片技术确诊为三倍体个体,但是我们的方法却没有检测到此变异。而且,三倍体胎儿常常发生自热流产,样本通常无法检测。排除以上限制后,我们提供了一种高通量的可信的通过全基因组测序发现染色体数目异常及CNV(特别是pCNV)的方法。

 

总之,NGS技术可以有效的用来诊断染色体疾病及微缺失和微重复综合征。我们的研究证明NGS在产前和产后患者的检测中,是一种能发现染色体数目异常及致病性CNV的高精准方法。更重要的是,我们的研究强调了NGS在产前或者产后样本中确认传统核型分析或者CMA分析未能发现的变异的潜在价值。

译者介绍:

张倩倩,首都医科大学附属北京天坛医院,北京市神经外科研究所在读研究生,神经外科学,脑血管病方向;热衷于NGS,目前从事NGS解读变异与疾病诊断的相关研究


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多