罕见病数据中心(Rare Diseases Data Center, RDDC)是由清华珠三角研究院人工智能创新中心自主开发的关于罕见病相关研究的数据中心, 其整合了全球已公布的确诊疾病的流行病学数据、药物发展概况、疾病相关基因图谱、基因突变位点、疾病相关实验大小鼠模型等数据信息。同时, RDDC在对罕见病数据信息进行搜集整理和重构的基础上;又以疾病、基因和动物模型为主线, 对相关数据信息进行了多维度的展示。此外, RDDC还充分利用现有已公开的遗传大数据资源, 布局了基于人工智能与生物信息技术的遗传疾病相关基因诊断工具, 首次公开的AI工具包括突变致病性预测 (PathoPredic)、突变剪切预测 (SpliceTool)https://rddc./search-middle?to=SplitToolModelSpliceTool是一种基于全基因组变异预测选择性剪接的工具,利用深度神经网络(DNN)的策略开发了SpliceTool。笔者以 “ATRX:c.5786+4A>G; NM_000489.6” 为例 注:本例出现两种剪接模式,该变异位点已由RT-PCR实验验证,在血液中发现该变异为第一种剪接模式,exon 24整个外显子跳跃,即该变异产生了exon 24缺失的ATRX基因的mRNA。与另一项笔者介绍的 varSEAK 对比,varSEAK呈现的结果仅显示剪接变异发生的可能性,并没有上述呈现的结果形象生动。
|