分享

单基因遗传病中变异的效应与疾病的机制

 生物_医药_科研 2018-12-20

前言

从核酸改变角度,变异可以分为很多类型,包括错义变异、同义变异、无义变异、移码变异、起始密码子变异、延长变异、剪接位点变异、氨基酸缺失/插入、非编码区变异、外显子缺失/重复、基因缺失/重复、融合基因等。从对蛋白影响的角度,这些变异最终可以归为影响蛋白的结构,或者影响蛋白的剂量,造成蛋白功能的丧失、改变或者获得,或者蛋白表达时空的改变,从而造成疾病。了解单基因病的致病机制,是疾病检测和遗传数据分析的前提。只有明确疾病的致病机理,在此基础上选择合适检测方法和并在分析关注合适的变异,才能有效找出导致疾病的遗传原因。

 

丧失功能——最常见的致病机制

丧失功能 (loss of function, LOF) 最常见致病机制,绝大多数单基因遗传病都是因为基因 LOF 造成的。LOF 可以是变异造成蛋白结构破坏,也可以是变异造成蛋白剂量减少,归根到底,二者都是造成正常的蛋白减少。起始密码子变异、无义变异、移码变异、剪接位点变异、外显子缺失、基因缺失常常导致蛋白 LOF(ACMG 标准 PVS1,其限制性见 ACMG 详细说明),其他形式的变异(延长变异、错义变异、氨基酸框内插入缺失)也有可能导致蛋白 LOF。值得一提的是,一些变异从核酸改变角度看造成蛋白结构改变,可能因为一些细胞内的生物机制而实际造成了蛋白剂量的减少。比如,无义变异介导的 mRNA 剪接 (nonsense-mediated mRNA decay, NMD) ,延长变异造成的 mRNA 降解 (non-stopdecay),其他变异也能因影响 mRNA 或蛋白的稳定性而造成蛋白剂量的减少。有些基因需要两个正常等位基因表达才能维持功能,一个等位基因 LOF 便会造成疾病,这种情况被称为单倍性不足 (haploinsufficiency),造成的疾病为显性 (dominant) 遗传。有些基因只要有一个正常等位基因表达便足以维持功能,只有两个等位基因都 LOF 才导致疾病,这种情况被称为单倍型充足 (haplosufficiency),导致的疾病为隐性 (recessive)遗传


显性抑制 

显性抑制 (dominant negative, DN) 可以归为特殊的功能丧失,也可以被单独作为一种变异效应,指变异不仅导致蛋白自己功能丧失,还干扰正常蛋白的功能。因此,ND 的效应要严重于单个等位基因 LOF,并且此类变异造成的疾病多为显性遗传。举个例子,GH1 基因 LOF 的变异导致常染色隐性遗传 (AR) 的孤立性生长激素缺乏症1A型,即需要两个等位基因发生 LOF 变异才表现症状;而 GH1 基因的 DN 的变异导致常染色显性遗传 (AD) 的孤立性生长激素缺乏症 2 型,一个等位基因发生此类变异即表现症状。再如,AD 遗传的 Emery-Dreifuss 型肌营养不良 型是由 LMNA 基因突变造成,该基因的 LOF 变异造成晚发型的疾病,而该基因的 DN 变异造成了更严重的早发型疾病。


获得功能

目前已知有一百多个单基因遗传病是由于基因获得功能 (gain of function, GOF) 的变异造成的,GOF 可以是蛋白结构改变而发生蛋白功能激活,也可以是影响蛋白的表达或者降解而造成蛋白剂量升高。对于因基因 GOF 造成的疾病,LOF 不能作为变异致病的依据,且致病变异常常集中表现为一种变异类型,或者集中于特定位点,容易形成热点突变,此类疾病多为显性遗传。下面分别对各种变异类型造成蛋白 GOF 而导致疾病一一进行举例说明

 

获得功能——调控区域变异导致蛋白的剂量升高

ANKRD26 基因突变导致 AD 遗传的血小板减少症 2 型,目前已知的几个致病变异都位于该基因的 5’UTR 的保守位点,研究表明这几个变异造成 ANKRD26 表达升高,从而造成疾病。

 

获得功能——错义变异影响蛋白修饰导致蛋白剂量升高

AFF4 基因编码一个转录延伸因子,调节基因的转录,该基因突变造成 AD 遗传的 CHOPS 综合征。研究发现,目前已知的三个致病变异(T254S, T254A, R258W),均导致蛋白泛素化降解障碍,造成蛋白剂量升高,进而造成其转录调控的下游基因表达升高,导致疾病。

 

获得功能——基因重复导致蛋白的剂量升高

Lubs 型 X 连锁智力低下,是由 MECP2 基因重复造成的,为 X 染色体连锁隐性遗传,该病占不明原因的男婴智力低下的1%。该病的致病机制为 MECP2 基因重复造成蛋白剂量升高。值得一提的是,MECP2 基因编码的蛋白在细胞中的功能对其剂量高度敏感。在女性中,MECP2 杂合 LOF 造成 Rett 综合征,患者症状因 X 染色体失活偏移 (Skewed X-inactivation) 造成 MECP2 蛋白表达差异而症状严重程度不同,而男性 MECP2 半合子 LOF 因没有正常 MECP2 蛋白表达而造成胚胎致死。男性 MECP2 基因重复导致 Lubs 型 X 连锁智力低下。

 

获得功能——错义变异影响蛋白活性

错义变异改变蛋白活性,也是蛋白获得功能获的一种方式,多见于酶、离子通道、信号通路蛋白中。很多免疫系统疾病是由于基因的激活变异造成。以 NLRC4 基因突变导致的自身炎症伴婴儿小肠结肠炎为例,NLRC4 基因编码的蛋白介导炎症反应,野生型的 NLRC4 蛋白在正常状态下处于自抑制状态,可以被细菌的鞭毛蛋白激活而启动下游的炎症反应,但是变异 T337S 或 V341A 造成 NLRC4 蛋白结构改变为组成型激活状态,持续激活下游的炎症反应,从而造成 AD 遗传的自身炎症伴婴儿小肠结肠炎。

 

获得功能——融合基因

融合基因也是造成蛋白获得功能一个原因,融合基因可以产生于染色体间的易位 (translocation)、染色体内部的缺失 (deletion) 或者染色体内部的倒位 (inversion)。这种变异形式常见于肿瘤和血液肿瘤中,例如图中 FIP1L1-PDGRA 融合形成一个组成型激活的酪氨酸激酶,而造成特发性嗜曙红细胞过多综合征。融合基因造成获得功能的效应在单基因遗传病中很少见,小编未找到例子。

 

新功能/蛋白毒性 —— 碱基重复

蛋白毒性,也是单基因遗传病的一个重要机制。一部分碱基重复造成的疾病的机制为重复的氨基酸造成了具有细胞毒性的蛋白。比如 Huntington 病是由 HTT 基因编码框内 CAG 重复造成的。重复造成连续的谷氨酰胺  (Gln) 残基,正常人中 CAG 重复次数小于 27 次,当 CAG 的重复次数大于 35 次,便会造成 Huntingtin 病。细胞机制研究表明,野生型 huntingtin 蛋白在细胞发育中发挥重要的作用,被认为参与脑源性神经营养因子的转录调控,阻止 procaspase 9 的降解,并且参与膜泡的运输和释放。而达到致病级别的 huntingtin 蛋白被蛋白酶切割后会造成一系列毒性作用,滞留正常的蛋白(包括正常的 huntingtin 的蛋白),引起线粒体功能异常和氧胁迫压力,改变神经递质的释放和受体的功能,激活caspases 启动凋亡级联反应、与核因子相互作用导致转录失调,从而造成 Huntington 病的症状。


异位表达 

异位表达常常出现在肿瘤中,在单基因遗传病中并不多见,但也存在这样的例子。糖皮质激素可治疗的醛固酮增多症是由 CYP11B1/CYP11B2 基因融合造成。CYP11B1CYP11B2 位于8号染色体上,二者呈串联排列,序列上有95%的相似度,因姐妹染色体间的非平衡交叉而产生 CYP11B1/CYP11B2 融合基因,融合的基因具有 CYP11B1 的 5' 端 和 CYP11B2 的编码区正常的 CYP11B2 基因的转录受血管紧张素激活,表达于肾上腺球状带,融合基因的对促肾上腺皮质激素敏感,表达于肾上腺束状带,导致醛固酮合成增多。



基因变异导致疾病的多效性

由于基因变异的不同的效应,因此,同一个基因不同效应的变异可以导致不同的疾病,这种情况叫等位基因病 (allelic diseases)。根据 omim 网站的统计,目前已有1000多个基因对应两种或以上个疾病表型。例如 FGFR1 基因在脑、颅面骨、四肢骨的发育和生长、促性腺释放激素神经元细胞的形成、存活和迁移以及嗅觉神经元中发挥重要的作用,该基因不同类型的 GOF 变异导致脑颅皮肤脂肪过多症、Pfeiffer 综合征,DN 变异导致Hartsfield 综合征,LOF 变异导致促性腺激素分泌不足的性腺功能低下症,伴或不伴嗅觉丧失2型。


结语

基于大规模平行测序(massively parallel signature sequencing, MPSS)的 NGS 技术在遗传病领域的广泛应用,让我们可以同时检测很多基因,甚至所有基因或者整个基因组上的变异。相比过去的 Sanger 测序,检测的效力得到了极大的提高,但同时分析的挑战也相应地提高了。一次 WES 检测可以得到个几万个变异,就算过滤掉通常不致病的变异,仍然有数十、上百个变异需要分析,患者症状的复杂性和非特异性又会增加分析中干扰。比如,ANKRD26 基因 LOF 是可以容忍的,但是该基因 5'UTR 突变引起的基因表达量上调导致 AD 遗传的血小板减少症 2 型,如果不清楚或未注意这个机制,遇到一个有相似症状的患者刚好携带 ANKRD26 的 LOF 突变,就有可能错把这个突变当成致病突变,而忽略了真正的致病突变,或者为非遗传病患者做出了假阳性的诊断。 因此,深入的理解检测所涵盖基因的致病机制,知道检测的局限性和需要重点关注的变异是提高分析的准确性和灵敏度的关键环节。


对基因的注释,不仅要包括基因与疾病对应关系的注释,还应包括基因突变导致疾病的机制的注释,比如 LOF, GOF, DN,或者其他机制。比如,针对碱基序列重复导致的疾病,目前的基于 MPSS 的 NGS 技术不能很好的检测寡碱基重复次数,这不仅意味着如果怀疑这类机制导致的疾病,需要使用其他检测手段来弥补,还意味着在分析 NGS 的变异数据时,可以暂不考虑这些基因上的变异。再如,对于 GOF 导致的疾病,相比关注通常的 LOF 变异,更该关注可能导致 GOF 的变异,或者根据过去已报道的致病变异的规律推测所关注变异致病的可能性。DN 效应的变异通常也不是 LOF 的变异类型,此外,DN 效应可以帮助解释不符合常见的遗传方式情况,比如通常隐性遗传的疾病,却只发现了一个致病变异,但并不是所有 DN 的情况都被 omim 记录,有时需要参考文献来确定一个变异是否导致 DN 效应。


对以上机制做详细的注释可以帮助提高分析的准确性和灵敏度,避免假阳性或假阴性。然而,对所有的基因突变致病机制都做注释不是一蹴而就的工作,还需要日常的积累和维护,甚至很多基因致病的机制还不清楚。decipher 数据库 (https://decipher./ddd#ddgenes) 收录了部分基因的致病机制,可供参考。如果还未对所有分析基因的致病机制做充分的注释,至少在每份变异数据时,对怀疑阳性的基因变异和疾病,需要查阅数据库和文献、参考该基因已知的致病变异,确定致病的机制是否符合。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多