分享

探针资本_行业研究:基因组重复序列

 Azure_Sun 2022-11-30 发布于广东

目录

基因组重复序列

目录

一、 重复DNA概述

1.1重复DNA的概念

1.2重复DNA的生理学功能 

1.3重复DNA与疾病概述 

二、重复DNA相关疗法 

2.1 重复DNA的检测:从短读长测序到长读长测序 

2.2靶向寡核苷酸(AON)治疗 

三、重复DNA领域市场分析 

3.1 重复DNA市场空间测算 

3.2 市场发展动力与潜在机会 

四、重复DNA相关公司:ROME Therapeutics

五、小结 

一、重复DNA概述

1.1 重复DNA的概念

目前基因组学的革命对于人类生产生活的影响正在迅速扩大,这得益于人类对其自身基因组之结构和功能的理解的扩大。在人类组中,大约一半的组分,称为重复组,由重复的DNA序列组成。重复组包括超过一百万个串联重复序列(DNA片段),其中序列被串联多次复制,其生物学在很大程度上仍未被探索。据估计,其中大量位于基因及其调控区域内,此外,由于可以转录和翻译相当大比例的重复序列,重复组可以产生通过转录和翻译过程在mRNA和蛋白质水平上造成差异。已知有50多种疾病是由单个基因中串联重复序列的扩增引起的;其中包括亨廷顿舞蹈症和脆性X染色体综合征。但目前,此类串联重复在多基因疾病中的作用仍未被完全解读,此类疾病具有更复杂的遗传基础。

在成因上,这些重复的DNA可归因于自我繁殖的基因序列的活动。在人类中,这种现象由逆转录转座子主导,这些转座子首先被转录为RNA中间体,然后反向转录为最终整合到基因组中的cDNA来制造自己的新拷贝。总的来说,近一半的人类核基因组是转座子衍生的-记录了数千年来各种类型的逆转录转座子的活性。这些序列中的绝大多数是不完整的或突变的,不再具有在基因组上移动和复制的潜力;但是,也有例外:LINE-1的亚家族保留了编码蛋白质的能力,这些蛋白质产生LINE-1和其他非编码重复的新基因组拷贝 - 即Alu短穿插元素(SINE)和复合正弦可变数串联重复(VNTR)-Alu(SVA)元素。其他功能可以驻留在现在作为插入诱变剂处于非活动状态的可转置元素中。例如,许多ERV[长末端重复(LTR)序列]含有可以作用于附近基因的强启动子或增强子。在不同程度上,这些元素也保留了残留的蛋白质编码能力。

LINE-1序列通过产生从内部RNA聚合酶II启动子转录的6千碱基(kb)的RNA中间体来制作自身的副本。其第一个开放阅读框(ORF)编码ORF1p,其形成RNA结合同源三聚体。第二个ORF编码ORF2p,它包括内切酶和逆转录酶结构域,它们负责制造LINE-1 RNA的cDNA拷贝并将其插入基因组中。ORF2p功能也可以通过非编码Alu和SVA元件来选择,以反向转录并将其序列整合到基因组中,而不是蛋白质编码LINE-1 RNA。总的来说,LINE-1,Alu和SVA插入是不常见但反复发生的基因突变原因,导致各种体质性遗传疾病。在几乎每种情况下,转座元件插入基因的关键部分并导致功能等位基因丧失。

致病插入可以发生在种系中或通过种系传播,从而在人群中建立等位基因频率。种系传播的另一个影响是,每个个体都继承了不同的活性转座子(2)。因此,移动元素的表达和逆向转移的负担可能因人而异,并且对可容忍的内容是否存在限制尚不清楚。在发育期间和成人中,转位可能导致各种组织中的遗传异质性(体细胞嵌合体),但很难知道这在多大程度上以及是否致病。基线活动可能是生理性的。据推测,体细胞逆向转移是正常神经元发育中功能性遗传多样性的来源。然而,单细胞测序实验表明,神经元中体质获得性插入的水平非常低,使得这些插入在正常发育中所需的作用似乎不太可能。

图片

图1. 重复DNA的分类

资料来源:文献

1.2 重复DNA的生理学功能

基因表达一样,重复DNA表达模式是细胞类型特异性的,并且在患病状态下可能偏离正常。例如,LINE-1启动子低甲基化和LINE-1过表达是许多癌症的标志,ORF1p积聚在几种最常见和通常致命的人类恶性肿瘤中,与TP53肿瘤抑制基因的丧失有关。其他类型的逆转录元件在癌症中也显示出表达的改变。这引发了实际问题,例如这些是否可以用作疾病的生物标志物,以及更基本的问题,例如哪些调节机制负责转座元素的表达,以及转座元素的表达是表观现象还是引起恶性肿瘤。

转座元件编码的调节序列可以改变染色质状态并影响附近的基因表达。因此,转座子激活可能是促进转化的基因表达变化的基础或与之协调,尽管对此的证明是有限的。独立于这些调节作用的转座子激活呢?有一些轶事案例表明,个体遗传了LINE-1位点,该位点通过启动子甲基化逃脱了沉默,并继续通过插入诱变“驱动”肿瘤发展,破坏结肠上皮中腺瘤性息肉病(APC)肿瘤抑制基因的表达并导致结肠癌。然而,诸如此类的明显癌症驱动突变是罕见的。

体细胞获得的LINE-1插入物似乎是癌症基因组中的“乘客”(非驾驶员改变)。如果单个插入在功能上不重要,它们是否共同代表有意义的突变特征?最近的研究表明,LINE-1插入中间体可引起染色体重排并对DNA复制构成障碍。这些数据表明,在转位过程中诱导的DNA损伤在塑造癌症基因组中的作用可能被低估,并且获得对LINE-1活性的耐受性可能是肿瘤发生的先决条件。

鉴于LINE-1在癌症中的广泛表达,转座元素激活促进恶性生长可能是一种直观的假设。然而,矛盾的是,在实验系统中强加转座子表达通常是细胞毒性的。LINE-1、Alu和ERV元素的表达可以诱导先天免疫反应,触发核酸传感模式识别受体和干扰素信号传导,就像外源性病毒感染一样。根据转座子的类型和细胞环境,这些先天免疫反应可能由DNA损伤、逆转录转座子编码逆转录酶的活性或自杂交双链RNA(dsRNA)的存在介导。由此产生的所谓“病毒模拟”可以通过细胞自主机制(诱导细胞周期停滞或限制蛋白质翻译)或通过促使免疫系统清除细胞来抑制肿瘤生长。因此,在转化的早期阶段,转座子的表观遗传激活可以预防或抑制肿瘤的发展。在完全发展的癌症中,转座子活性可以促进基因组进化和具有特定特征的肿瘤细胞克隆的出现。此外,恶性肿瘤可能处于“临界点”,在这个临界点上,增强转位是不可持续的,或者限制肿瘤在特定条件下的生长。例如,增强转座子表达的表观遗传学试剂可以增强对免疫疗法的反应或产生分子依赖性。在某种程度上,转座子可以利用来煽动DNA损伤,这种策略可能会使癌症对基因毒性药物或DNA修复抑制剂敏感。

当位点编码区域启动子或增强子(顶部)时,转座元件(TE)激活可以直接调节基因表达。TE失调也可能产生细胞效应(底部);例如,先天免疫模式识别受体(PRRs)可以被DNA损伤或逆转录蛋白产生的cDNA激活,也可以通过自杂交双链RNA(dsRNA)激活。

图片

图2. 重复DNA的分子生物学和细胞生物学机制

资料来源:文献

除癌症外,重复DNA诱导的先天免疫信号或DNA损伤与衰老和各种疾病有关。在衰老过程中,3′外切酶TREX1(三质修复外切酶1)的表达减少和LINE-1 ORF2p的上调活性共同可能促进细胞质cDNA的积累,诱导衰老相关的干扰素信号传导。在艾卡迪-古铁埃综合征(AGS)中损害TREX1的突变可能与促成病理性干扰素信号传导和脑病的转座子具有相似的相互作用。这一假设导致了AGS中逆转录酶抑制剂的持续临床试验。逆转录酶是由“非编码”基因组编码的几种蛋白质类型之一,其他可能与疾病有关。例如,ERV表达与神经退行性疾病肌萎缩性侧索硬化症有关,ERV编码的env蛋白在小鼠中的表达通过未知机制引起DNA损伤和运动神经元变性。

对于重复DNA的深入研究需要新的技术的支持。穿插的重复序列是可变的,并且以高拷贝数存在于基因组中,并且它们普遍掺入前mRNA和长非编码RNA(lncRNA)中。因此,在测序数据集中寻找DNA插入变异或差异表达位点具有挑战性。需要参考基因组和基因分型工具来捕获活性转座子中的可遗传变异。需要单细胞测序方法来指示从头插入和相关的基因组重排,揭示特定转座子位点的表达,并分析含有重复的cDNA和dsRNA物种。在患病组织和临床标本中研究这种生物学的试剂也很重要。大多数针对重复序列设计的核酸探针和引物将不加选择地与整个基因组中存在的意外靶标杂交。如果转座子的过表达在技术上很容易在实验模型中重新创建并且足以引起疾病,则需要工具来确定它是否是必要的元素。从疾病模型中删除逆转录元素具有挑战性,特别是因为它们通常是物种特异性的,并且存在于许多高度同源的序列中。功能研究需要使用人体组织、位点特异性遗传方法和精确靶向逆向的药物的模型,并为从实验室到临床奠定基础。

1.3 重复DNA与疾病概述

重复DNA与人类疾病相关的分子和细胞功能障碍有关。例如,20多年来,我们已经知道特定的串联重复扩增可引起亨廷顿病,脊髓小脑共济失调,弗里德赖希共济失调(FRDA),脆性X综合征(FXS),肌强直性营养不良和其他疾病;这些疾病中的大多数是神经系统疾病,此外,串联重复扩增最近被证明是额颞叶痴呆(FTD)和肌萎缩性侧索硬化症(ALS)的主要遗传因素,后者是最常见的运动神经元疾病形式。新兴的遗传数据还表明串联重复多态性(TRP)在与各种多基因疾病相关的基因产物的调控控制中的作用。

根据UCSC对使用串联重复查找器的简单重复的注释,人类基因组中存在大约100万个串联重复序列。重复单元的长度从几个碱基到数千个碱基不等。高度相似的序列容易重排,这可能导致结构变化。串联重复的突变率远高于非重复序列。已知的串联重复变化导致30多种人类遗传疾病,其中一些影响大量人群。两种常见类型的肌肉萎缩症,即肌强直性营养不良症和面肩肱肌营养不良症(FSHD),是由串联重复变化引起的。据估计,这些疾病的患病率为1/12,000,使其成为遗传性肌病的第二常见形式。肌强直性营养不良是由DMPK基因3′UTR中的CTG重复扩增引起的。致病性重复扩增的范围从几百到数千个拷贝不等。FSHD是由chr4上3.4 kb的亚端粒串联重复收缩引起的,这导致侧翼区域的表观遗传改变和侧翼基因的错误表达。southern印迹分析和长读聚合酶链反应(PCR)用于这些疾病的诊断,但研究表明,纳米孔测序可能适用于这些大的重复扩增。卡明等人使用PacBio测序仪分析了DMPK重复结构。Mitsuhashi等人表明,包含整个致病性4q35 D4Z4重复等位基因的纳米孢子超长读数可以与chr10上的良性等位基因区分开来。

1.3.1 重复DNA和癌症

目前对导致肿瘤进化和耐药性的机制的了解几乎完全来自对代表非重复蛋白质编码区域的2%的人类基因组的评估。围绕这些基因组区域的广泛测序工作已经鉴定出许多有助于肿瘤发生,治疗反应和耐药性的遗传改变。然而,基因组的巨大重复区域在肿瘤发展和耐药性的背景下仍然没有得到充分的探索。最初被认为是“垃圾”,重复元素的生物学作用是由芭芭拉·麦克林托克在大约一个世纪前首次提出的。她具有里程碑意义的研究确定了能够改变其在基因组中的位置并影响生物状态的移动序列。随后几十年的调查揭示了这些元素在进化,发展,疾病进展和对波动环境的适应(包括药物治疗)中的重要作用。测序技术和生物信息学分析的最新改进使人们能够迅速了解基因组重复生物学。转座元件(TE)的激活可导致基因组改变(突变和染色体重新排列),基因组三维组织的修饰,转录变化以及可能由先天免疫传感机制检测到的核酸物种(NAS)的产生。尽管TE整合和在整个基因组中繁殖具有潜在的生理益处,但TE激活的后果也可能是有害的;因此,许多“反平衡”机制与 TE 集成共同发展,以控制这些潜在的负面影响。

病毒或其他微生物在癌症发展中发挥作用的概念已经被研究了一个多世纪。在佩顿·劳斯(Peyton Rous)发现鲁斯肉瘤病毒(RSV)可引起鸡的肿瘤之后,癌症一度被认为是一种病毒性疾病。随后的研究表明,其他病毒,包括爱泼斯坦巴尔病毒(EBV)和人瘤病毒(HPV),可以帮助人类癌症发展。最近,也有人提出,人类基因组中含有内源性病毒的重复部分的去调节在肿瘤进化和癌症治疗耐药性中起作用。人类肿瘤细胞已被证明可以重新插入TE,其中大多数可能被视为无效事件,但有些也可能促进致癌基因的表达。除了这些插入事件之外,癌细胞改变引起的TE的去调节,包括重复区域的DNA低甲基化,可以通过影响肿瘤的适应性和免疫原性来抑制肿瘤。因此,肿瘤进化可能涉及多种机制,这些机制产生TE“变阻器”,可以促进肿瘤存活,让人联想到细菌中的毒素/抗毒素系统和其他抗生素抗性机制。

一些研究表明,在重复区域中DNA甲基化丧失后,补偿性表观遗传转换可能发生在癌症进化中。例如,AML的研究表明,通过介导H3K9甲基化的配合物抑制LINE-1元素对于AML进展很重要,因此,癌症中表现出低表达LINE-1元素的患者预后较差。最近的一份报告同样表明,基因组重复的去调节表达可以在小鼠和盲鼹鼠的肿瘤化学诱导后产生肿瘤抑制作用。未来的研究将需要确定TE变阻器在肿瘤进化中的重要性。

除了这种平衡行为在肿瘤进化中的潜在作用外,最近的报告还表明,TE的去调节可能有助于抗癌药物反应(先天性或获得性耐药性)。在IO的背景下,Nir Hacohen和其他人进行的一项研究首先表明,携带外源性病毒(如EBV和HPV)或显示内源性病毒表达增加的肿瘤显示出浸润免疫细胞的增加,这表明这种肿瘤可能对IO治疗的反应更好, 这些观察结果之后有报告显示,内源性病毒表达的增加可以在肿瘤细胞的细胞质中产生NAS,并引发肿瘤固有的IFN反应并激活先天免疫,这会影响肿瘤细胞的适应性和免疫原性。最近的研究还表明,去调节的TE表达可以增加新抗原呈递,从而增强肿瘤细胞的免疫原性。病毒模拟的最初报告描述了使用DNA低甲基化剂进一步抑制肿瘤细胞中的TE,但随后的许多研究都涉及其他表观转录因子在肿瘤中TE的代偿抑制和IFN反应,这种机制已被描述为表观遗传转换。如上所述,与TE激活相关的肿瘤细胞适应性的内在降低和/或免疫原性的增加也可以由无数其他因素调节。例如,病毒传感信号通路的突变或改变可以补偿TE去调节,有趣的是,在IO治疗中复发的患者通常在这些通路中携带突变。虽然病毒模拟的原始研究集中在dsRNA物种作为引发者,但后来的研究也暗示其他NAS是肿瘤中先天免疫反应的诱导剂。这些物种包括由逆转录酶产生或来自R环的RNA / DNA杂交种,可能导致微核形成的受损DNA或线粒体DNA的泄漏。

对结直肠肿瘤细胞的研究也表明,DNA低甲基化剂对其肿瘤重新启动潜力产生负面影响- 一种与“癌症干细胞”范式相关的表型。在这种情况下,我们注意到,与其他白血病细胞相比,观察到的白血病干细胞对药物的敏感性降低,因此可能作为复发的储库,表现出TE和IFN诱导途径的转录抑制。暴露于抗癌药物也可以诱导TE表达,并且已经表明,显示一些干细胞特征的DTP的存活取决于TE抑制。表观遗传学治疗后观察到的DTP数量的减少可能是由于基因组不稳定性增加和TEs在这种治疗抵抗性细胞亚群中由TE去调节引起的病毒模拟的诱导。这些研究表明,除了DNA低甲基化剂和HDAC抑制剂外,未用于成人体细胞的肿瘤特异性TE抑制机制(可能从发育生物学中“借用”),可以用于未来的药物开发,旨在增强现有疗法,包括化疗和靶向药物。

1.3.2 重复DNA和神经系统相关疾病

一类主要的TRD是由三核苷酸CAG重复扩增引起的,这些扩增编码各种蛋白质中的聚谷氨酰胺束最常见的聚谷氨酰胺疾病,也是最早发现的由CAG重复扩增引起的疾病之一,是亨廷顿病。这种疾病是一种致命的常染色体显性遗传性神经退行性疾病,由编码亨廷顿蛋白中延伸的聚谷氨酰胺束的CAG重复扩增引起CAG重复的长度与发病年龄成反比,尽管遗传和环境修饰因素也会影响发病年龄遗传修饰因子,即修饰亨廷顿病发病的其他基因及其各自的等位基因,也得到了积极的追求。有趣的是,亨廷顿病的主要遗传修饰因子之一调节DNA修复,因此它可能调节CAG重复的体细胞变异性。目前尚不清楚这种修饰基因中的特定多态性是增加还是减少CAG重复的体细胞变异性。亨廷顿基因中的CAG扩增导致蛋白质中的谷氨酰胺扩增,导致分子和细胞发病机制的复杂级联,导致精神,认知和运动症状。

除亨廷顿病外,至少还有八种其他聚谷氨酰胺疾病,包括六种类型的脊髓小脑共济失调(SCA1,SCA2,SCA3,SCA6,SCA7和SCA17;SCA3也被称为马查多- 约瑟夫病),脊髓球肌萎缩(SBMA,也称为肯尼迪病)和齿状芽肿 - 苍白细胞萎缩(DRPLA)12.SBMA是这些疾病中的第一个被发现是由CAG和谷氨酰胺重复扩增引起的疾病18.不同基因中的CAG重复扩增以及导致这些其他聚谷氨酰胺疾病的相关聚谷氨酰胺扩增蛋白已经过详细综述。这里将不作广泛讨论。有趣的是,还发现一些涉及CAG·CTG重复扩增仅被提出涉及毒性同肽扩增,当CAG重复序列可以从其各自基因的反义链转录而来时,包括引起亨廷顿病样的HDL2和 SCA8。在过去几年中,发现有毒肽的重复相关非ATG翻译(RAN翻译)可能有助于SCA8的发病机制,以及亨廷顿病,肌强直性营养不良1(DM1),FXS,C9ORF72相关的ALS和C9ORF72相关的FTD,已经产生了很大的兴奋。

虽然聚谷氨酰胺扩张性疾病被认为涉及具有毒性功能获得突变的蛋白质,但证据也表明,功能改善的天然聚谷氨酰胺(即尚未扩增的聚谷氨酰胺)也有助于发病机制。因此,聚谷氨酰胺扩张性疾病可被认为涉及具有功能改变突变的蛋白质。证明聚谷氨酰胺在天然野生型亨廷顿蛋白中的重要性的关键研究包括进化和比较基因组学、影像遗传学和功能基因组学,例如,突变小鼠中CAG重复序列的缺失,尽管它们在每种蛋白质中的精确功能尚未阐明。有趣的是,HTT(编码亨廷顿蛋白的基因)中的TRP与正常范围内的CAG重复长度有关,并且不完全渗透的CAG重复长度与抑郁症有关。一项涉及两个队列的新研究发现,在HTT基因的正常范围内,相对较短和相对较长的CAG重复长度都与抑郁症风险增加有关。这引发了关于CAG重复序列对亨廷顿病患者和健康个体抑郁症的遗传贡献的有趣问题。此外,长度在正常范围内的CAG重复序列与与聚谷氨酰胺疾病相关的另外两个基因TBP(编码TATA盒结合蛋白的基因)和ATXN7(编码ataxin 7的基因)的抑郁症有关。增加了在正常范围内串联重复有助于数量性状的证据。然而,大多数证据表明,扩增的聚谷氨酰胺束在CAG重复扩增神经退行性疾病中具有神经毒性,并且似乎每种疾病基因的时空表达模式,以及疾病蛋白的细胞内定位及其在特定人类细胞群内修饰转录组和蛋白质组的能力,可能有助于聚谷氨酰胺疾病的独特和重叠属性。聚谷氨酰胺疾病中疾病特异性和共享的发病机制已被广泛调查和审查并且不会成为本次审查的重点。

虽然聚谷氨酰胺疾病是TRDs的最大亚组,但各种其他疾病是由病理性重复扩张引起的。聚丙氨酸疾病主要影响胚胎发生和发育的其他方面,在生物化学上与聚谷氨酰胺疾病最相似,一般来说,聚丙氨酸紊乱似乎不是进行性的或神经退行性的,它们似乎破坏了各自蛋白质中正常聚丙氨酸束的功能;正常的聚丙氨酸束最常调节转录。

脆性 X 相关性和其他神经系统串联重复性疾病。一些非编码串联重复扩增与其他神经退行性疾病有关,包括FRDA,FRDA是一种常染色体隐性共济失调,由GAA三核苷酸重复扩增在FXN的内源性区域引起,FXN是编码线粒体蛋白frataxin的基因在 FRDA 患者中,FXN 因 GAA 束的存在而受到抑制,导致 frataxin 水平不足.FRDA和其他涉及非编码串联重复扩增的神经退行性疾病的发病机制,例如SCA10(由ATXN10中的内源性ATTCT戊核苷酸扩增引起,该基因编码ataxin 10)因此似乎与聚谷氨酰胺疾病的发病机制不同。

FXS是最早被证明由串联重复扩增突变引起的疾病之一。.FXS是由CGG重复扩增的高甲基化导致FMR1基因沉默引起的,它似乎主要是一种神经元和突触障碍,其特征是智力迟钝,自闭症样特征和其他发育异常。在发现FXS病因后,FMR1中约55-200次重复的突变前CGG重复多态性被发现与脆性X型震颤共济失调综合征有关(FXTAS),卵巢衰竭和其他疾病47.RAN翻译可以由FMR1中的三核苷酸重复发生,在没有规范ATG起始密码子的情况下,这一发现除了脆性 X 相关疾病外,还与 TRD 相关疾病相关最后,一种更罕见的神经发育障碍,脆性XE综合征,是由FMR2(也称为AFF2)中的CCG重复扩增引起的。)

DM1也是由串联重复膨胀引起的。具体而言,DM1是由编码DM1蛋白激酶的基因DMPK中的CTG三核苷酸重复扩增引起的,这种扩增似乎会产生一种有毒的RNA物种,破坏RNA剪接,然而,这种扩增如何破坏DMPK的其他潜在分子机制,包括RAN翻译,已被牵连。有趣的是,DM2是由CNBP(也称为ZNF9)中的CCTG四核苷酸重复扩增引起的,其编码CCHC型锌指核酸结合蛋白(CNBP);从中胚层颗粒中同时产生低聚糖和四肽蛋白的RAN翻译CAGG重复序列也与DM2的发病机制有关。

肌萎缩性侧索硬化症和额颞叶痴呆:近年来,各种类型的TRD及其相关的发病机制一直是深入研究的主题。最近,发现两种主要神经退行性疾病ALS和FTD的很大一部分病例是由串联重复扩增引起的。

ALS是运动神经元疾病最常见的形式,它在患者中进展迅速,导致过早死亡。ATXN2 中 CAG 重复束中的特异性多态性(在 ataxin 2 中编码中等大小的聚谷氨酰胺束)与 ALS 风险增加有关,这些CAG重复道通常比引起SCA2的重复(>32次重复)短(约29-32次重复);然而,少数ALS患者的ATXN2在SCA2中的大小范围内具有扩展,支持ALS和SCA2之间的遗传联系。此外,ATXN2 中的中等大小 CAG 重复序列可与另一个基因 C9ORF72 中的六核苷酸重复扩增结合使用,从而引起 C9ORF72 相关 ALS,从而引起 C9ORF72 相关 ALS。

C9ORF72中的六核苷酸GGGGCC重复扩增是ALS和另一种神经退行性疾病FTD的主要遗传因素,尽管 C9ORF72 中的 GGGGCC 重复扩增与约 40% 的家族性 ALS 病例相关,但它们也与散发性 ALS 病例有关。。C9ORF72六核苷酸扩增在ALS和FTD中的作用正在进行深入研究,有证据表明这种扩增与其他神经退行性疾病有关,包括阿尔茨海默病。然而,由于六核苷酸扩增与其他神经退行性疾病的关联可能反映了某些神经退行性疾病的临床异质性和诊断模糊性,因此需要系统性大规模研究以解决C9ORF72六核苷酸扩增的全部致病性影响。C9ORF72中的这种串联重复扩增可能有助于神经退行性疾病的发病机制,因为它被转录为疾病相关C9ORF72 RNA的一部分,该RNA可能参与多个RNA介导的致病途径和/或由于二肽重复序列的RAN翻译,导致蛋白毒性62.最近讨论了这些机制的细节。尽管六核苷酸重复扩增和其他TRD的发病机制有许多关键方面需要阐明。

串联重复不稳定与其他疾病有关,例如SCA,肌阵挛性癫痫(也称为EPM1或温弗里希特 - 伦德堡病)等。

二、重复DNA相关疗法

如上所述,重复DNA在多种疾病的发病过程中起到重要作用

图片

图3. 长读长测序识别重复序列

资料来源:文献

2.1 重复DNA的检测:从短读长测序到长读长测序

自30年前人类遗传性疾病中致病基因的发现和克隆以来,破译单基因突变与遗传性疾病之间的因果关系为生物化学,分子生物学和医学遗传学(如遗传咨询)领域以及治疗策略的发展提供了重要信息。在罕见的遗传疾病中,致病变异从包括单核苷酸取代或少数核苷酸插入/缺失在内的小突变到大的变化,包括串联重复增殖、大缺失、易位、倒置、转座元素(TE)插入或复杂重排。因此,需要能够识别不同类型突变的多种检测策略。

短读测序平台已被广泛用于小突变的诊断。迄今为止,大多数已知的致病变异都在编码区域。这可能是由于解释偏倚,因为很难解释编码区域以外的变异的致病性。然而,全外显子组测序(WES)仍然是一种强大且具有成本效益的工具,它甚至被广泛用于小型实验室和医院。在诊断环境中,当患者的表型对某些致病基因突变具有特异性时,也使用了候选基因组合的靶标测序。使用这些方法,已经在已知基因中鉴定出许多新的突变。在WES阴性病例中,考虑使用短读测序仪使用全基因组测序(WGS)。然而,鉴于高成本和分析负担,并且WES的突变检出率与WGS相当,WES可能是许多诊断实验室的首选。对于拷贝数变异(即大量缺失或重复),微阵列技术和短读测序已被用于成功检测明显的致病性变异。

尽管做出了这些密集的努力,但致病基因和突变已被短读测序仪在大约三分之一的罕见遗传疾病中鉴定出来。一个可能的原因是致病性突变存在于使用常规技术“无法访问”的基因组部分(例如,重复区域或富含GC的区域)。最近,在遗传性疾病的诊断环境中引入了长读测序仪[PacBio和牛津纳米孔技术测序仪,以下简称纳米孔],希望能够识别使用传统技术尚未发现的致病突变。最近的几份报告表明,长读测序可以识别已知或新型致病基因中的致病性突变。

在遗传疾病的基因识别中,串联重复疾病是长读测序仪的良好靶标。使用短读测序仪分析全基因组串联重复序列是很困难的。从历史上看,大多数串联重复疾病都是在具有多个受影响成员的家庭中通过连锁分析发现的。如果串联重复突变导致严重的先天性疾病,它们可能会被忽视,因为没有合适的大家庭进行此类分析。有趣的是,这些串联重复性疾病中的大多数会引起神经系统症状。先天性神经系统疾病可能是使用长读数进行重复扩增的全基因组研究的良好候选靶点,因为它们通常很难在单个患者中找到。使用人类基因突变数据库(HGMD)(http://www.hgmd./)进行的调查表明,在UTR和内含子中,扩增长度的范围往往很长,纳米孔测序或PacBio长读取长度可以主要覆盖已知的致病性扩展这一观察结果表明,在这个重复扩展范围内未被发现的重复疾病将由长读测序仪发现。

一些研究集中在这种难以测序的重复序列的长读测序上。这些研究表明,PacBio测序仪成功地对FMR1重复序列进行了测序,并确定了重复长度和重复结构,最终证实了重复序列结构(即AGG的中断)与临床表型之间的关联。Ishiura等人使用Nanopore测序来确定良性成人家族性肌阵挛性癫痫(BAFME)患者扩大戊糖核苷酸重复序列的结构,这是一种新型的重复扩张性疾病。低分子纤维瘤是由 SAMD12 中的内源性重复扩增引起的。Zeng等人和泉口等人还分别使用纳米孔和PacBio测序仪鉴定出BAFME患者的SAMD12重复扩增。这些示例清楚地表明,长读测序对于分析串联重复扩增很有用。长读是检测重复变化的一种简单方法,因为足够长的读数可以包含整个扩展的重复以及侧翼的独特序列。

Mitsuhashi和Frith等人从长读串联基因型中开发了一种重复拷贝数预测工具。该工具使用基于概率的精确比对方法,并在整个基因组中可靠地检测注释串联重复的变化。该方法用于在多个神经元核内包涵体病(NIID)患者中发现新的致病性GGC重复扩增,使用PacBio和高通量纳米孔测序仪PromethION。该位点不仅富含GC,而且还存在于片段基因组复制中,并且先前的短读测序仪研究无法识别NIID患者的致病重复变化。对于使用短读数测序仪进行评估时未发现因果突变的孟德尔病,应考虑使用长读数进行串联重复检查。

有几种方法可以富集基因组的某些区域,并使用长读测序仪进行靶标测序,主要的目标是串联重复疾病。在一些重复扩增疾病中,重复结构本身决定了疾病的表型或严重程度。因此,重要的是要知道完整的重复结构,而不仅仅是其位点或重复大小,以完全了解由此产生的致病性。例如,致病性TGGAA戊核苷酸在BEAN1基因内含子中的扩张引起神经退行性疾病,即脊髓小脑共济失调31型(SCA31);然而,在该位点也存在的TAAAA扩增是良性的[36]。此外,长串联重复序列很难通过桑格测序进行分析。

靶向长读测序的早期方法使用PCR扩增产物或BAC克隆。McFarland等人使用PacBio测序仪对ATXN10中PCR扩增的ATTCT重复扩增进行测序,这导致脊髓小脑共济失调10型(SCA10),并表明扩增中存在中断的重复结构。Wenzel等人在MUC1基因的PCR扩增片段中进行了PacBio测序,该基因负责常染色体显性遗传性肾小管间质性肾病。他们成功地在高度富含GC的编码串联重复区域中鉴定了因果突变。石浦等人使用PacBio对一名患者的BAC克隆的BAFME病灶进行了测序。然而,他们怀疑在BAC克隆过程中发生了重复序列的意外收缩。鉴于这些方法可能遭受PCR错误或克隆的这种偏倚,作者试图对患者的天然基因组DNA进行测序。为此,一些研究人员正在使用PacBio的无扩增(无放大器)靶向测序方法。无放大器使用簇状的有规律间隔的短回文重复序列(CRISPR)/ Cas9来富集整个基因组DNA的靶向区域。CRISPR/Cas9可以使用与靶DNA序列互补的引导RNA切割特定的靶位点。将切割的DNA文库连接到捕获的适配器上并应用于靶标测序。无放大器技术使用循环共识序列 (CCS) 读取。CCS从嘈杂的单个子读取中多次通过单个模板分子创建准确的共识序列[40]。使用PacBio的无放大器靶向测序,Höijer等人在11例亨廷顿舞蹈症患者中对亨廷顿舞蹈症致病的HTT基因中的CAG重复序列进行了测序。他们发现这种方法是准确的,他们的CAG重复计数与通过PCR片段分析获得的CAG重复计数一致。使用相同的No-Amp方法,Ebbert等人在C9orf72 GGGGCC重复位点处获得了800×CCS读数的覆盖率,这是肌萎缩性侧索硬化症和额颞叶痴呆的原因[42]。他们可以估计重复拷贝数,并将结果与南方印迹分析的结果进行比较。南方印迹结果显示重复次数较大,这是可以预料到的,因为由于甲基化或高GC含量,这种重复扩增通过南方印迹人为地运行高。Hafford-Tear等人还使用No-Amp对TCF4基因中的三重态重复序列进行测序,TCF4基因与富克斯内皮角膜营养不良有关。他们从11个样本中平均获得了327次读数(每个样本),并且可以确定重复大小,重复不稳定性与重复长度相关。他们还观察到一个个体CTG内的GTG重复中断。Schüle等人在临床帕金森病患者中发现了ATXN10重复扩增,并使用No-Amp PacBio靶向测序研究了重复结构。有趣的是,与其他SCA10患者不同,该患者没有中断重复。

纳米孔也在开发CRISPR/Cas9介导的靶标测序。Sone等人在新发现的重复疾病基因NOTCH2NLC中使用Cas9介导的富集方法成功地进行了重复扩增的靶向测序。使用MinION测序仪,Cas9富集的靶向测序产生了100-1795×覆盖读数在重复位点使用5μg的DNA。作者使用最后训练将MAFFT多重比对和参数估计相结合,并构建了NIID患者重复的共识序列。有趣的是,重复结构与NIID表型一致。纯GGC重复显示痴呆显性表型,而含有GGA的重复扩增除除痴呆外还显示弱表型。

在数据分析方面,首先经由测序得到序列读长,分析管道中的后续步骤通常是序列,即将读长映射到参考基因组序列。迄今为止,已经开发了>80个比对软件。比对后,下一步是从比对中识别变体。与大量可用的读取比对方法相比,只有三种工具专门设计用于检测HTS数据中的STR变异,即lobSTR,RepeatSeq 和 STRViper。由于STR变异是惰性损伤的一种特例,因此通用的工具(如丁德尔、SAMtools mpileup 和 GATK)可用于分析 STR 变异。

从高通测序数据中检测插入式的方法通常使用三个特征码之一,即覆盖深度,拆分读取和配对端映射。基于覆盖的方法的深度(例如CNV-seq和BIC-seq)假设整个基因组的读取均匀覆盖,并期望在某个位置进行删除(或插入)导致映射到该位置的读取次数减少(或增加)。这些方法受到当前基于PCR技术的测序偏倚引起的过度采样或采样不足的不利影响。覆盖特征的深度仅针对大插入量(大小为 ≥50 bp),这超出了中等 STR 变化。在重复区域中,相同的读数有时可以对齐到多个位置,这进一步使覆盖范围的计算复杂化。由于上述灵敏度权衡,覆盖深度特征不适合STR变异检测。

拆分读长信息用于SAMtools , Dindel, lobSTR  and RepeatSeq 。这些方法直接从读取序列和参考序列之间的差异中识别变异。因此,它们对检测新的插入量很敏感,但仅限于短的可疑序列,因为它们需要比所讨论的可疑序列更长的读数。此外,这些方法依赖于包含 indels 的读取的映射,这在重复区域中通常是不可靠的。较长的配对端读取可能在同一片段中重叠,并可用于将有效读取长度几乎加倍。一旦技术和支持软件得到改进,这可能会为拆分读取签名带来显著的优势。

使用双端测序比对的方法包括 MoDIL, BreakDancer and STRViper。它们从跨越重复的片段大小的偏差中识别插入点。这些方法的主要优点是它们不需要读取时间长于重复,并且从片段的两端读取不一定是重复的,因此可以更可靠地比对。然而,这些方法通常需要高覆盖率测序(≥40倍)和片段大小的紧密分布,以便对短插入片段做出可靠的预测

2.2 靶向寡核苷酸(AON)治疗

寡核苷酸可用于靶向转录本或双链DNA,并且在隐性遗传寡核苷酸的疾病中可用于改变抑制性DNA或RNA构象。目前的大多数治疗策略旨在改变转录本水平,但针对DNA的疗法也正在出现。

显性遗传NRD的治疗目标是通过降低细胞mRNA含量来降低毒性,并因此降低蛋白质水平。如图4所示,有四种主要方法,所有这些方法都引起了科学界的兴趣:1)单链AONs(ssAONs),通常以间隙子的形式存在,其利用RN酶H来降解靶向RNA;2)非催化性链烷,阻断mRNA向蛋白质的翻译;3)微RNA介导的沉默和4)主要用于siRNA介导的下调的双链AON(dsAONs)。间隙含有ssDNA的中心“间隙”,其与RNA杂交后允许内源性RNase H酶降解RNA。间隙在两侧被一小段修饰的核苷酸包围,这些核苷酸通常耐降解并表现出很强的结合力。Gapmer ssAONs是目前治疗显性遗传性疾病的流行方法,其中HD是NRD中研究最广泛的疾病。

由于个体串联重复疾病涉及特定的转录后和翻译后发病机制,因此突变RNA和蛋白质产物可以靶向治疗。这可能在药物水平上具有优势,因为来自扩展串联重复序列的RNA转录本和蛋白质可能具有独特的二级或三级结构,可以使用传统的结构生物学和药物化学方法靶向。

由于在常染色体显性遗传疾病中存在一个突变和一个健康等位基因,因此可能仅将治疗定向到受影响的等位基因。但是当靶向单核苷酸多态性(SNP)时,这通常是以牺牲更个性化和昂贵的治疗为代价的。例如,在HTT基因中已经鉴定出合适的候选SNP。在非人灵长类中,在整个皮层和边缘结构中观察到HTT的抑制,并且通过合理设计,可以获得对HTT疾病等位基因具有高度选择性的AONs。有趣的是,通过靶向转录本中的重复序列,已经有可能在SCA3和HD中获得等位基因选择性。在这些培养细胞的研究中,单链AONs中使用了几种不同的核酸化学物质,包括使用LNA或PNA进行取代。对携带不同长度重复序列的mRNA二级结构的预测表明,通过使用非多晶型低聚物可以实现等位基因选择性靶向。除了产生选择性的二级结构外,疾病等位基因本身重复序列长度的增加也会增强靶向性,因为额外的同源序列可用于杂交。除了使用等位基因选择性间隙体AONs外,还应用等位基因选择性siRNA。据报道,HTT基因中的大多数SNP是内源性的;然而,siRNA仅在细胞质中具有活性,即在内含子从前mRNA中除去后。相反,间隙子在细胞核和细胞质中都起作用,从而为靶向SNPs提供了更多选择。在一份报告中,证明神经元细胞中约一半的HTT mRNA位于细胞核中。这进一步支持有效靶向核常驻核核酸的治疗策略。迄今为止,大多数基于RNAi的研究都是基于RNAi构建体的病毒转移,但也有人试图为此目的开发化学修饰的ON。

治疗HD的一种新方法基于靶向HTT mRNA的3′末端,这是内源性微RNA调控中经常使用的区域。通过开发编码人工微RNA的腺相关病毒,已经有可能利用细胞机制在大鼠和小猪中降解HTT mRNA。美国食品和药物管理局于2017年授予亨廷顿舞蹈症的这种名为AMT-130的疗法的孤儿药称号,2018年1月,AMT-130获得了欧洲药品管理局针对相同适应症的孤儿药产品名称(OMPD)。虽然这种发展是基于治疗性病毒的,但同样的方法可以通过使用基于ON的微RNA模拟物来应用。这些尝试已经完成并进入肿瘤治疗领域的临床试验,其中被认为具有转化活性的RNA物种已被靶向,正如Smith和Zain[6]中所回顾的那样。

重复扩增可以以几种不同的方式干扰基因转录的调节,包括双向和反义转录,RNA-DNA杂交种的形成和非B-DNA结构。在重复扩增导致mRNA和蛋白质表达减少的情况下,同RNA的“经典”AON靶向(如上一节所述)显然不是一个问题。在FRDA中,GAA·TTC重复序列的扩增与转录下调直接相关,导致frataxin mRNA和蛋白水平降低。FRDA 中 Pol II 的抑制也与抑制性染色质修饰相关,并且已经描述了 FRDA 的基因沉默。规避frataxin缺乏症的一种新方法是直接在体内递送相应的mRNA。最近,使用脂褐样裂样蛋白转染首次在293-T细胞中检查了人FXN mRNA的转移,并检测到成熟的功能性FXN蛋白。更重要的是,随后在成年小鼠中通过鞘内注射递送FXN mRNA的脂质包封的纳米颗粒,并在背根神经节中测量人FXN蛋白。另一种策略是将化学修饰的ON引导到FXN前mRNA的重复区域,以避免其参与形成RNA:DNA杂交种,这被认为是导致frataxin mRNA和蛋白质缺乏的几种可能机制之一。

要使用针对RNA的LON来影响功能丧失疾病中的基因表达,必须同时考虑几个方面,这与在功能获得性疾病中靶向毒性mRNA不同。例如,在弗里德赖希共济失调中,扩增的GAA·TTC重复序列位于内含子中,因此,靶向转录本重复区域的ONs应1)靶向前mRNA并在细胞核中发挥其活性,2)导致基因表达的激活而不是抑制。双链RNA(dsRNA)在弗里德赖希患者来源的共济失调成纤维细胞中激活FXN基因表达已被研究。靶向RNA中GAA·TTC重复序列的dsRNA能够增强转录,这归因于RNAi去抑制机制。在这项研究中,作者报告说,转录本的Argoonaute2(Ago2)结合是必要的,但没有参与Ago2介导的裂解。此外,在同一项研究中,基于反义LNA的ON靶向重复区域的前mRNA被证明会导致FXN基因表达的激活。尽管尚未完全检查AON的基因激活分子机制,但一种可能的情况是,ON导致DNA-RNA杂交种(有时称为R-loop)释放前体mRNA,该杂交种已被提议在GAA和CGG重复序列中形成。

脆性X相关性震颤共济失调综合征(FXTAS)是由FMR1基因的CGG重复扩增引起的。然而,如上一节所述,CGG·CCG 重复> 200 次的扩展也与脆性 X 染色体综合征有关。CGG重复序列位于5′-未翻译区域,55-200的病理重复序列产生有毒RNA。携带2'-O-Me-PS的AONs已经在模型细胞系中进行了实验,目的是侵入在FMR1基因的5'-UTR处形成的结构化RNA。然而,这种策略可能不是最佳的,因为FMR1 mRNA的失活可能会加重疾病,因为脆性X综合征是由FMRP的丧失引起的。相反,低分子量小分子已经过筛选,以确定其识别和结合结构化转录本的能力。

在二十一世纪,基因组编辑领域出现了重大发展。几十年来,这被认为是科幻小说,但越来越有效的方法的出现已经完全改变了这种情况。因此,锌指核酸酶(ZFN)、转录激活剂样效应核酸酶(TALENS)和簇状规则间隔短回文重复(CRISPR)相关蛋白质系统等工具是可用的方法。

对小鼠的研究表明,通过删除HTT重复序列进行CRISPR/Cas9介导的基因编辑可用于永久消除成年小鼠大脑中聚谷氨酰胺扩增诱导的神经元毒性。最近还报道了Cas9切口切除HTT基因切除CAG束。此外,对于其他NRD,如脆性X染色体综合征、弗里德赖希共济失调、SCA2和SCA3,基因组编辑也已经过测试。在DM1和DM2中,报告的方法基于失活编辑酶的使用,该酶在腺相关病毒载体全身递送dCas9 / gRNA后有效减少转录。编辑优先发生在分裂的细胞中,最近证实,当核小体存在时,Cas9介导的DNA裂解非常弱,而ZFN的活性受影响较小。针对缺陷RNA的工程系统也被描述用于HD,DM1和DM2 。

内切酶可能具有不同的分子量;然而,当大脑中的许多细胞需要靶向时,它们的大小仍然是吸收的障碍,但很明显,NRD的治愈性临床基因组编辑可能在未来成为可能。编辑酶的递送,与合成的化学修饰gRNA复杂,病毒介导的转移是这种疗法的可能方案。

三、重复DNA领域市场分析

3.1 重复DNA市场空间测算

重复DNA会导致包含癌症、自身免疫疾病及神经退行性疾病在内的多种疾病,疾病患者往往受累严重,且往往具有遗传性,故重复DNA识别、检测及靶向技术拥有非常巨大的应用前景,目前,上述疾病在治疗策略,治疗成本和治疗副作用上往往有不尽如人意之处,基于重复DNA的方法对于相关疾病诊断和治疗方案可能产生根本性的改变。

图片

图4. 重复DNA市场空间测算

资料来源:中商情报网

由于重复DNA在多种不同疾病的病理过程中起到重要作用,而目前重复DNA的检测和靶向治疗策略均仍在发展中,面向重复DNA的鲁棒的检测和靶向治疗策略可能会对于癌症、自身免疫疾病及多种罕见病的治疗带来根本性变革,而这些疾病,目前尚未有可靠的诊疗方案,率先实现突破的药物将有巨大潜力进入FDA与CDE的审批快速通道,并将在市场竞争中将获取巨大的先发优势,在与支付方的谈判中也可获区更多的议价权,因此重复DNA市场增长空间巨大。

3.2 市场发展动力与潜在机会

上文已述及,重复DNA在多种疾病的病理学过程中起到重要作用,可能作为多种疾病的潜在药物靶点和早期筛选标志物,现从疾病早期诊断和疾病药物靶点方面分别叙述

在早期诊断方面,如上所述,重复DNA在包括癌症、自身免疫病和多种神经系统疾病中发挥作用,通过重复DNA的表征,可以在早期评价多种遗传疾病的潜在风险,对于癌症等疾病诊疗方案的治疗效果进行预测。在技术上,重复DNA检测的主要瓶颈在于长读长测序技术的发展,重复DNA的固有属性导致其通过传统的短读长测序难以被有效识别和表征,目前,长读长测序技术是测序技术的重要发展方向,一系列商业化长读长测序技术的产生,为重复DNA检测提供了技术基础,而随之产生的一系列生物信息学方法也为重复DNA的精确识别和表征提供了分析流程。故综合来看,在早期诊断方面,重复DNA应用的上游技术已经较为成熟,重复DNA检测作为一种辅助手段可以作为医疗诊断和疗法选择过程的重要参考。

重复DNA还可以作为药物靶点,如前所述,重复DNA检测产业的技术基础已经完备,基于重复DNA检测的疾病治疗新靶点识别已经成为可能,这种技术可能为很多病因尚未明确的罕见病提供治疗思路,值得注意的是,目前在产业界尚无针对重复DNA的药物靶点识别相关公司或相应的技术平台,故此类药物靶点发现方法作为药物靶点发现的新思路拥有广阔的市场空间。另外,从目前来看,虽然直接靶向基因组重复DNA的方法还不成熟,但是,针对重复DNA转录层面影响的治疗方法已经较为成熟,基于RNA的方法在转录层面扭转重复DNA变化对应的转录变化,从而对于重复DNA相关疾病进行治疗,故靶点发现的下游,即药物设计过程也存在较为现成的技术手段和操作平台,进一步的,基因编辑技术的进一步发展可能直接对于基因组上的重复DNA进行操作,进而从根本上改变重复DNA相关治疗策略。总的来说,重复DNA是一种新兴的药物靶点识别思路,其上下游技术比较成熟,可能为生物药设计的一个潜在的增长点。

针对重复DNA的药物靶点设计在多种罕见病的治疗上都具有潜在的治疗价值,如其能够应用于罕见疾病的靶点发现和治疗过程,其在政策上显然是占优的,如:

2015年1月:《关于发布国际多中心药物临床试验指南(试行)的通告》:该文件由国家药监局于2015年1月发布并于2015年3月生效,就开展国际多中心临床试验及为涉及中国或国内的国际多中心临床试验提供数据参考提供指引。

2016年5月:《药品上市许可持有人制度试点方案》:该文件由国务院办公厅于2016年5月发布,提供了中国10个省药品MAH制度的详细试点方案。根据MAH制度,试点区内的国内药品研发机构及人员有资格成为药品上市许可持有人,而毋需成为药品生产企业。

2017年10月:《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》:由国务院发布,并于2017年10月8日起生效,该文件包含如下支持政策:在中国境内开展多中心临床试验的,经临床试验组长单位伦理审查后,其他成员单位应认可组长单位的审查结论,不再重复审查。

2018年5月22日,中国政府正式发布首批CRDL,其中收录了121种罕见病。CRDL的发布解决了中国罕见病“没有官方定义、没有具体政策支持、没有医疗保险承保”等问题。该目录的出现有助于提高社会对罕见疾病的意识,提高医务人员罕见疾病的诊疗能力,为孤儿药研发提供激励并加快行业发展,并提高孤儿药的可负担性。

2018年7月:《接受药品境外临床试验数据的技术指导原则》:该文件由国家药品监督管理局于2018年7月发布,提供了接受境外临床试验数据的基本原则。

2018年11月:《临床急需境外新药名单》:该文件由药品审评中心于2018年11月发布,并分别于2019年和2020年更新。根据国家药监局和国家卫健委就新药纳入临床急需境外新药名单事宜发布的《关于临床急需境外新药审评审批相关事宜的公告》,据此,申请人可直接递交其新药申请以及相关材料。CDE将设立特别渠道加快审评程序。就尚未确定及尚未官方宣布的药物品种,申请人可随时与CDE沟通并尽快递交新药申请。

2019年2月,卫健委发布《罕见病诊疗指南》,详细阐述了定义、病因和流行病学、临床表现以及诊断、治疗等,并且以清晰的流程图形式展现诊断流程和治疗原则。

2019年11月:《关于延长授权国务院在部分地方开展药品上市许可持有人制度试点期限的决定》:该文件由全国人民代表大会常务委员会于2018年10月26日发布。该文件将MAH制度延期至2019年11月4日。

2020年7月:《药品注册管理办法》:该办法由国家药品监督管理局发布,自2020年7月起生效。该办法旨在取代2007年发布的《药品注册管理办法》、《中华人民共和国药品管理法》以及《中华人民共和国药品管理法实施办法》。

2020年7月:《药品上市许可优先审评审批工作程序(试行)》:该文件由国家药品监督管理局于2020年7月发布,进一步明确了创新药的快速审批路径。

2020年12月:《药物研发与技术审评沟通交流管理办法》:该文件由国家药品监督管理局于2020年12月发布,旨在引导创新药物的开发者与药品审评中心根据事项的重要性进行沟通。与药品审评中心的沟通可分类为一类/二类/三类会议。I类会议为解决药物临床试验过程中遇到的重大安全性问题和突破性治疗药物研发过程中的重大技术问题而召开的会议;II类会议为药物在研发关键阶段而召开的会议,主要包括IND前会议、II期临床试验结束及III期临床试验启动前会议、递交新药上市申请前会议及风险评估和控制会议;III类会议指I类或II类会议之外的会议。

2021年,国家卫健委宣布启动第二版CRDL的编撰工作,有望纳入更多罕见病。

2021年10月11日,《罕见疾病药物临床研发技术指导原则(征求意见稿)》发布,旨在提高罕见疾病临床研发效率;11月18日,《罕见疾病药物临床研究统计学指导原则(征求意见稿)》发布,鼓励制药企业研发罕见病治疗药物,提高临床研发效率和质量。

重复DNA在罕见病治疗领域的潜在价值可以转化为政策优势,并使其研发和应用过程更加便捷和顺畅。

然而,重复DNA的临床应用也尚有潜在的风险因素,首先,重复DNA相关的科学研究尚不充分,关于重复DNA的生物学效应的研究仍不充分,因此,直接靶向重复DNA的治疗策略仍有不可控性,另外,由于转座是重复DNA的重要成因,其在个体间有着巨大的差异性,故针对于重复组DNA本身的策略可能需要对于患者个人进行全基因组测序以保证其安全性,在成本上也较高,针对于转录层面的疗法并不直接涉及基因组的改变,故其需长期治疗,在疗法上,重复DNA靶向药物也具有较大的提升空间。另外,无论是长读长测序的分析,还是RNA治疗平台的构建,均需要较强的专业背景,专业壁垒较高,长读长测序技术和对应的生物信息学分析方法的构建以及基因编辑技术的发展可能为重复DNA的药物靶标应用起到较大的正面效果,这也是今后技术发展的关键。

四、重复DNA相关公司:ROME Therapeutics

目前可查的重复DNA相关公司较少,可以查到的仅有ROME Therapeutics,公司正在通过利用重复组的力量开发针对癌症和自身免疫性疾病的新疗法。其疗法基于当人体健康时,这些重复处于休眠状态。然而,当细胞受到压力或患病时,重复被激活。一旦被激活,这些内部重复被免疫系统识别,就像外部病毒被识别一样。这触发了病毒模拟反应,提醒身体消除应激细胞并修复受损组织。这些重复序列的慢性刺激可以激活免疫反应,或在癌症过程中诱发突变和参与免疫逃逸,ROME使用内源性逆转录酶抑制剂阻断逆转录过程,在自身免疫病中减少促炎介质的产生,从而降低免疫反应;在癌症过程中阻断cDNA重新整合在基因组中,从而增加基因组稳定性,公司同时构建组学分析平台,以更好的通过重复组分析识别疾病和预测治疗效果。目前,公司现有管线如下:

图片

图5. 公司现有管线

图片

表1. 公司可查融资事件

截至目前,该公司通过两轮融资共募集资金1.27亿美元。

五、小结

在本报告中,我们调研了重复DNA相关方法和应用,目前,针对重复DNA的检测手段日渐成熟,其作为疾病标志物进行分子诊断的潜力也日渐显现,重复DNA也是多种疾病的潜在靶标,但是由于基础研究和干涉手段仍欠研究,目前,重复DNA作为疾病靶标的治疗方法仅限于通过RNA干扰等技术在转录层面对于重复DNA的病理学效应进行干涉。随着长读长测序技术的发展,重复DNA检测的成本和精确性都相应提升,其在药物靶点发现上的潜力是巨大的,但后续的治疗策略设计仍需更高效的检测手段和针对重复DNA的基因编辑技术的辅助方可完善,由于其对于多种疾病的潜在治疗潜力,重复DNA的价值应该被肯定,但是,其真正走向应用尚需一定的时间,目前,针对重复DNA的公司也仍然较少。

声明

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多