分享

​来点好消息提振下信心:一款人工智能软件几乎预测出了奥密克戎(Omicron)的诡异结构

 新用户6122K55q 2022-07-14 发布于浙江

今天的文章,翻译自Wired网站的最新报道。有一款新的AI算法,破译了Omicron复杂的氨基酸序列,从而帮助科学家尽早了解这种新冠病毒变种,以夺取药物开发的先机。

图片来自Wired网站

去年1126日,世卫组织将南非涌现的新冠病毒变种定为“值得关注的变体”,并将其命名为Omicron。第二天,哥伦比亚大学教授Sriram Subramaniam从网上下载了该变种的基因组序列,并为其实验室订购了OmicronDNA样本。

Subramaniam的研究小组计划使用电子显微镜来揭示蛋白质的三维结构,以更好地了解它们的工作原理。小组已经绘制出冠状病毒用于结合并进入人体细胞的一些早期毒株的尖峰蛋白。但奥密克戎的爆发之剧烈让描述这种变体病毒的尖峰蛋白成为迫在眉睫的任务,因为找出它的DNA的不同展现方式将可能解释为何它传播得如此迅速。和每个周末在网上购物的其他人一样,Subramaniam不得不耐心等待。只有拿到DNA样本,他才能将Omicron的蛋白质放到显微镜下去观察。

而在大陆的另一端,北卡罗来纳大学夏洛特分校的计算基因组学研究员Colby Ford也在思考Omicron的穗状蛋白。亲戚们一直在问他一个同样困扰着许多专家的问题:Omicron会不会躲过现有的疫苗?

Ford没有订购实验室用品,而是尝试走了一条最近发明的捷径。在世卫组织为Omicron命名的同一天,他使用免费的人工智能软件,试图从Omicron基因组编码的氨基酸序列中预测其结构。

不到一小时,Ford得到了他的第一个结果,并迅速将其发布到网上。12月初,他和两位同事发布了一篇更全面的论文,现在已被接受出版,其成果还包括预测出一些针对以前菌株的抗体对Omicron的效果会降低。

Subramaniam的实验室很快就收到了OmicronDNA,并在1221日发表了其对该结构的显微镜观察结果,以及真实抗体的测试结果。这也印证了Ford的两个预测结构之一:他计算出其中心原子的位置只相差大约半个埃,大约是一个氢原子的半径。

Ford说:“这些工具使人能够非常迅速地做出有根据的猜测--这在新冠疫情这样的情况下非常重要。只要有任何新的病毒(变体)出现,其他人也会复制我在这里所做的事情。”

预测的方式比对Omicron的穗状蛋白的实验室观察更快,反映了最近由人工智能带来的分子生物学领域的巨大变化。第一款能够准确预测蛋白质结构的软件在Omicron出现前几个月就已经广泛使用,这要归功于Alphabet英国人工智能实验室DeepMind和华盛顿大学的竞争性研究团队。

Ford使用了这两个软件包,但由于这两个软件包都不是为预测像Omicron那样的突变引起的小变化而设计或验证的,他的结果更多的是提示性的,而不是确定性的。因此引起一些研究人员的怀疑。但他很容易就能用强大的蛋白质预测人工智能进行实验,说明最近的突破已经在改变生物学家的工作和思考方式。

Subramaniam说,他在实验室开展这一工作时,收到了四五封电子邮件,提出了预测的Omicron尖峰结构。他说:“很多人这样做只是为了好玩。但对蛋白质结构的直接测量仍将是最终的标准。”但他预计人工智能预测将成为研究的核心--包括对未来疾病爆发的预测。他说:“这将是一场变革”。

由于蛋白质的形状决定了它的行为方式,了解它的结构可以帮助包括从进化到疾病所有种类的生物学研究。在药物研究中,弄清蛋白质结构可以帮助找到新疗法的潜在目标。

确定一个蛋白质的结构决不像我们想的那么简单。它们是复杂的分子,根据生物体基因组中的编码指令组装起来,从而成为酶、抗体或许多其他不同种类的生命机器。蛋白质是由一串氨基酸分子组成的,可以折叠成复杂的形状,以不同的方式表现出来。

传统上,破译一个蛋白质的结构需要艰苦的实验室工作。大约20万个已知的结构中的大多数都是通过一个个棘手的过程绘制的,在这个过程中,要将蛋白质转为晶体接受X射线的轰击。虽然像Subramaniam使用的电子显微镜这样的新技术可以缩短这个过程,但仍然很麻烦。

2020年底,在经历了几十年的缓慢进展之后,计算机能够从氨基酸序列中预测蛋白质结构的长期希望突然成为现实。被称为AlphaFoldDeepMind软件在一次蛋白质预测竞赛中被证明是相当准确,以至于该挑战的联合创始人、马里兰大学教授John Moult宣布该问题已经解决。Moult说:“我个人在这个问题上工作了这么久,(因此)DeepMind的成功是一个非常特别的时刻”。

这个时刻对一些科学家来说却令人沮丧。DeepMind并没有立即公布AlphaFold如何工作的细节。华盛顿大学实验室从事蛋白质结构预测工作的David Baker去年告诉WIRED:“你处于这种奇怪的境地,你的领域已经取得了重大进展,但你却无法在此基础上继续发展。”他的研究小组利用DeepMind提供的线索来指导6月份发布的名为RoseTTAFold的开源软件的设计,该软件与AlphaFold类似,但没有AlphaFold那么强大。两者都是基于机器学习算法,通过对超过10万个已知结构的集合进行训练来预测蛋白质结构。

但是第二个月,DeepMind就公布了工作细节,并宣布AlphaFold可供任何人(免费)使用。于是,突然之间,世界上就有了两种预测蛋白质结构的方法。

Baker实验室领导RoseTTAFold工作的博士后研究员Minkyung Baek说,她对蛋白质结构预测迅速成为生物学研究的标准感到惊讶。谷歌学术报告说,华盛顿大学和DeepMind关于其软件的论文在出现后的短时间内总共被1200多篇学术文章所引用。

虽然预测还没有被证明对新冠战役的工作至关重要,但她相信它们对未来疾病的应对将变得越来越重要。消灭新冠的解决方案不会从算法中完全形成,但预测的结构可以帮助科学家制定战略。

Baek说:“一个预测的结构可以帮助你把你的实验努力放在最重要的问题上。”她现在正试图让RoseTTAFold准确预测抗体和入侵蛋白结合在一起时的结构,这将使该软件对传染病项目更加有用。

尽管它们的表现令人印象深刻,但蛋白质预测器并不能揭示分子的一切。它们生成一个蛋白的单一静态结构,并没有捕捉到它与其他分子相互作用时发生的弯曲和摆动。因为这些算法是在已知结构的数据库中训练出来的,这些数据库更多反映的是那些最容易通过实验绘制的结构,而不是自然界的全部多样性。(但是)哥本哈根大学的教授Kresten Lindorff-Larsen预测,这些算法将被更频繁地使用,并将是有用的,他说:“我们也需要在这些方法失败时加以学习。”(失败也有其价值)

除了尖峰蛋白结构外,SubramaniamOmicron论文还包括人工智能尚未征服的一种结果--与它所针对的人类蛋白结合的尖峰蛋白的组合结构。这些结果表明,该变体的结构变化使其能够更牢固地结合宿主细胞,同时也更不容易受到先前菌株的抗体影响,这种组合似乎可以解释为什么Omicron甚至可以在高度接种疫苗的社区中泛滥。

“黄金标准永远是直接测量,”Subramaniam说。“如果你正在建立一个价值数十亿美元的药物项目,人们总得知道到底搞的是什么。”同时,他说他的实验工作现在经常得到AI预测的帮助。“它改变了我们的思考方式,”Subramaniam说。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多