分享

文献解读 | 饱和式基因编辑-揭秘乳腺癌,卵巢癌BRCA1的致病变异

 生物_医药_科研 2018-12-15

文章题目:Accurate classification of BRCA1 variants with saturation genome editing

研究人员:华盛顿大学基因组科学系和霍华德休斯医学研究所 I布罗特曼·贝蒂精密医学研究所

发表时间:2018. 09

期刊名称:Nature

影响因子:41.577


研究亮点

意义未明的变异严重的限制了遗传学信息知识的临床使用,其面临的挑战在BRCA1基因上显现出来了。BRCA1基因作为肿瘤抑制因子,发生在该基因上的胚系功能缺失型突变能导致妇女患上乳腺癌,卵巢癌。虽然许多妇女都进行了BRCA1基因的测序,但是许多新发现的变异的致病风险无法评估。本文使用了饱和基因编辑(SGE)的方法,从BRCA1基因编码关键功能结构区域的13个外显子中的所有可能的SNV中选择了96.5%进行了处理。近4000个SNV的功能效果呈现双峰分布,这和已有的致病性评价几乎一致。超过400个非功能性(针对细胞存活的意义而言,有害变异导致BRCA1基因不能发挥抑癌作用,使得细胞更易凋亡,是为非功能)错义突变被鉴定出来,300个SNV扰乱了基因表达,作者认为这些实验结果很快会对BRCA1的临床应用产生用途,也可延伸用于其他基因的类似意义未明变异问题。


研究背景

众所周知,目前医学上预测人类基因组上的任意遗传突变导致的表型结果能力还是较差的,这个问题在遇到大量的意义未明变异时表现得更明显。因此,发生在某个基因上确定意义的致病突变在临床管理上意义巨大。比如,发生在BRCA1基因上的杂合突变显著增加了乳腺癌早期和卵巢癌早期的患病风险 ,但是这一突变明显又是可控的,因为多次数的筛查或者预防药物治疗有利于改善结果。但是至今为止的许多BRCA1基因的SNV都被定义为意义未明,所以进一步解释这些变异是迫切的。

常见的解决意义未明变异(VUS)的两条主要途径是:数据共享,这是由于许多复发变异在多个个体都有检出,便可以借鉴检出突变个体的癌症发展情况来分析该变异情况,但是存在BRCA1基因大多数变异都是罕见变异和BRCA1基因的不完全外显的情况。因为BRCA1基因的同源DNA修复(HDR)是基因发挥肿瘤抑制功能的关键,所以BRCA1基因变异是否恢复它的同源DNA整合能力是一个常见的检测标准。还有其他的检测比如评价胚胎干细胞生存能力,转录激活能力,药物敏感性,蛋白互作用等。但是功能实验评价BRCA1变异也存在一些限制。比如功能实验验证落后于VUS的发现;用于表达变异的cDNA转基因体脱离了基因组环境,不能检测剪接效果或转录本稳定性,有人工表达体过表达的风险。而借助基因编辑技术,可以克服这些挑战。而且目前这一技术还没运用于像BRCA1基因等和癌症易感相关的基因。有鉴于此,本文对BRCA1基因关键的13个外显子涉及的3893个SNV(约占96.5%)进行了饱和基因编辑,以分析BRCA1基因的变异的功能结果并用于后续基因检测。


研究成果

BRCA1基因的饱和基因编辑

在人类单倍体细胞系HAP1中,参与同源DNA修复(HDR)的许多基因像BRCA1,BRCA2等是非常重要的(图1a),作者用Cas9和gRNAs靶定位这些基因做了一个质粒共表达实验,然后转染HAP1细胞,验证了这些基因发生变异会导致HAP1细胞存活力下降并最终大量死亡的现象,确定了参与HDR途径的基因成分在HAP1细胞中的重要性,图1a中标红色的基因就是实验中证明在HAP1细胞系中地位重要的基因(也即HAP1必须基因),并且在图中进行了放大展示。接下来是构建和优化用于SGEs的文库(图1b),这是用于在细胞系中引入BRCA1基因13个外显子的所有可能的SNVs(RING结构区,外显子2-5,BRCT结构区,外显子15-23)。使用芯片合成的寡核苷酸库(囊括13个外显子和外显子外面内含子10bp),寡核苷酸库里的变异都经由同源臂克隆到质粒上。当然,每一个寡核苷酸在Cas9靶位都设计了用于在HDR成功后减少重复剪切的同义甲氨基取代。一个SGEs实验对应一个外显子。共计2千万个在HAP1细胞day0(作者自定义,开始转染的当天)进行SNV文库,Cas9/gRNA质粒转染,在day5和day11收集编辑过得外显子靶向gDNA和 RNA测序用于后续量化变异频率。为了获得更多详细的数据。作者用单克隆LIG4-敲除HAP1细胞系和对1n倍数HAP1细胞排序来优化SGE流程。除此之外,作者还使用靶向RNA测序来决定大量发生在BRCA1基因mRNA的SNV。

 

图1


对BRCA1基因的3893个SNV进行功能性打分

为了计算每个SNV的功能打分,首先计算day11(day11是从相对于进行SNV文库,Cas9/gRNA质粒和HAP1细胞共转染实验的当天为day0来计算的,下同)的SNV的频率比上该SNV在质粒文库的频率,然后计算log2 值;其次,使用day5的SNV频率构建了编辑速率的位置偏好性模型。再其次,为了不同外显子能进行比较,对功能打分进行了归一化。最后,一小部分分数可信度较低的被过滤掉。

功能打分呈双峰分布(图2d),无义突变位于-1.25分以下,98.7%的同义SNV距离剪接连接处3bp以上距离的打分都在-1.25分以上,作者借助二元高斯混合模型把所有的SNV分类为功能性,非功能性,中间型,最终72.5的SNV,定义为功能性,21.1%定义为非功能性,6.4%定义为中间型。非功能性分布定义为跨越所有外显子的无义突变,功能性分布定义为外显子区间的同义突变,且不是位于剪接连接区域的3bp以内,RNA分值在中位数同义SNV的1个SD以内。

 

图2

然而SNVs扰乱了经典剪接位点却大多数都是非功能性(89.5%)或中间型(5.5%)。SNVs位于外显子内部1-3bp或内含子3-8bp效果不一样,其中22.9%是非功能性的,SNVs位于深度内含子区域或5`UTR区域功能结果与非剪接区域同义SNVs类似,不大可能是非功能变异(包括:内含子,1.8%;5`UTR,0.0%;同义,1.3%)

 

功能性打分准确预测致病性

作者调查了功能性分值与Clinvar的一致性问题。在169个SNV中,162个被定义为非功能性,2个被定义为功能性,剩下的被定义为中间型。相反,Clinvar中22个良性SNV,20个被定义为功能性,1个被定义为非功能性,1个定义为中间型(图3a)ROC曲线显示在处理Clinvar注释的致病和良性变异时,特异性为98.2%,敏感性为96.7%(图3b)。对25% (64 out of 256)VUS和49.2% (60 out of 122)解释矛盾的SNV进行打分(图3c),Clinvar注释的错义VUS比Clinvar里缺失的错义SNV更大可能打分为非功能,3140个Clinvar里缺失的SNV中498个打分为非功能。对比人群数据库,在302个与gnomAD重叠的SNV中,更高的等位基因频率意味着更高的功能得分(补充材料8a)。类似地,在39个与FLOSSIES数据库(1万个岁数大于70岁,无罹患乳腺癌或卵巢癌)交叉的SNV中,只有一个打分为非功能性。总之,这都表明BRCA1 SNV有着高频率的话更可能打分为功能性。生物软件矩阵CADD, phyloP 和Align-GVGD的评价结果比起SGE功能打分则逊色多了(图3d)。

图3

 

 

BRCA1缺失性功能机制

对day5的细胞进行BRCA1转录本的RNA测序,发现89%的非功能性错义SNV大体上在RNA水平没有减少,表明它们可能是通过调节蛋白水平发挥作用(图5a)。许多基团对不影响RNA水平的错义SNV敏感,而它们都位于掩埋的疏水基团或RING域折叠所需的锌配位环(图5b,c)。作者也对许多影响表达的SNV采用SGE进行了研究,所有的SNV扰乱翻译起始密码子的都是非功能的,一些位于-3,+4,+5位置的SNV预测出减少了翻译起始效率则也打分为中间型或非功能性。此外,11%的非功能错义突变导致了RNA水平至少75%的减少,许多都位于非结构区域(图5b,5c)。表明缺失性功能导致的是减少mRNA水平而不是扰乱蛋白水平。

图4

图5

导致RNA缺失的变异可能影响RNA编辑。因为靠近剪接位点处的非功能外显子SNV明显比例过高,包括外显子末端G核苷酸的SNV打分较低(图4)。mRNA水平较低的非功能性外显子SNV创造了了新的受体或供体位点(图5d),也存在一个人6-8bp区域里面的许多SNV对mRNA水平有较大的影响,暗示了这可能是外显子剪接增强子。有些外显子倾向产生较低RNA打分的非功能性SNV,比如外显子16里面的46/244个SNV(排除无义突变)都是非功能性的。大多数的都是减少了2倍以上的RNA水平,15个减少了4倍以上。相反,19外显子中,55/234个SNV排除无义突变)也是非功能性的,但是没有一个降低了2倍以上的表达,而且外显子19的侧翼内含子区域完全没有非功能性SNV,暗示它可能可以粗糙的剪接。


文章总结

SGE方法对于确定SNV的致病性有很高的特异性和敏感性,而且较之生物软件矩阵预测有着更高的准确性,比ClinVar判定结果精确度要高,有利于处理证据冲突的变异。同时也能为non-Clinvar变异,人群数据库缺失的变异,和缺少遗传学证据的变异进行解释。未来可以用SGE研究,PALB2, BARD1等与人体易患肿瘤相关的基因,在一定范围缩小SGE范围也便于理解基因组编码的生物功能多样性。最后,作者希望功能打分能为数以百计的BRCA1模糊的变异以及新发现的变异提供有用的解释。本文也许可以作为对有潜在意义的SNV在临床上的应用需要的综合功能分析的蓝图。


小编评论

因为本研究使用的HAP1细胞系进行的研究,以后如果更合适的情况下可以把基因编辑的产物转移入哺乳动物体内研究,这样的研究结果更可靠(当然对于大批量的基因编辑实验不太合适)。文章主要是使用Clinvar数据库,人群数据库,生物软件预测进行了对比,建议可以再加上人工二次校对后的HGMD数据库。而且文章的研究对象主要局限于SNV,加上indel,CNV等也是很有前景的研究方向。另外就是希望SGE技术可以尽快使用到包括遗传性肿瘤等孟德尔病等领域,造福临床治疗。当然,或许对于体细胞变异危害性的研究也有一定借鉴意义。


参考文献

[1] Lea M. Starita, Jay Shendure et al. Accurate classification of BRCA1 variants with saturation genome editing. Nature, 2018,562: 217222.

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多