分享

惊艳!当科学家把SARS-CoV-2棘突蛋白序列转变成音乐之后...

 PaperRSS 2020-04-11

麻省理工学院教授马库斯 · 比埃勒借助人工智能设计新的蛋白质。 他最近将新型冠状病毒(SARS-Cov-2)的棘突蛋白翻译成声音,使其振动特性可视化,如图所示,这可能有助于找到阻止病毒的方法。 

图片来源: Markus Buehler,三原色代表穗的三个蛋白质链。 

构成生物的蛋白质都能赋予音乐生命。 问问马库斯 · 比埃勒就知道了:这位音乐家和麻省理工学院的教授开发了人工智能模型来设计新的蛋白质,有时是通过将它们转换成声音。 他的目标是为可持续、无毒的应用创造新的生物材料。 在 MIT-IBM 沃森人工智能实验室的一个项目中,比埃勒正在寻找一种能延长易腐食品保质期的蛋白质。 在《极限力学快报》的一项新研究中,他和他的同事们提出了一个有前途的候选物质: 一种由蜜蜂制造用于建造蜂巢的丝蛋白。

在 APL 生物工程最近的另一项研究中,他更进一步,利用人工智能发现了一种全新的蛋白质。 随着这两项研究的发表,新型冠状病毒肺炎病毒在美国爆发,Buehler 将他的注意力转向 SARS-CoV-2的棘突蛋白,它是使这种新型冠状病毒具有传染性的附属物。 他和他的同事们正在试图通过基于分子的声谱分析它的振动特性,这可能是阻止病毒的一个关键。 比埃勒最近坐下来讨论他的工作的艺术和科学。

问: 你的工作重点是在皮肤和头发中发现的a-螺旋蛋白质。为什么这种蛋白质如此吸引人?

答: 蛋白质是组成我们的细胞、器官和身体的砖和灰浆。 a螺旋蛋白质尤其重要。 它们像弹簧一样的结构赋予了它们弹性和弹性,这就是为什么皮肤、毛发、羽毛、蹄子甚至细胞膜如此耐用的原因。 但是它们不仅仅是机械上的坚硬,它们还有内置的抗菌特性。 通过 IBM,我们正试图利用这种生物化学特性来创造一种蛋白质涂层,这种涂层可以减缓像草莓这样快速腐烂的食物的变质。

问: 你是如何利用人工智能来生产这种丝蛋白的?

答: 我们在蛋白质数据库上训练了一个深度学习模型,它包含了大约12万个蛋白质的氨基酸序列和三维形状。 然后,我们给模型输入蜜蜂丝的一段氨基酸链,并要求它逐个原子地预测蛋白质的形状。 我们首次在实验室合成了这种蛋白质,从而验证了我们的工作。这是开发一种薄的、抗菌的、结构耐用的、可用于食品的涂层的第一步。 我的同事,Benedetto Marelli,专门研究这个过程的这一部分。 我们还利用这个平台来预测自然界中尚不存在的蛋白质的结构。 这就是我们如何在 APL 生物工程研究中设计我们全新的蛋白质。

问: 你的模型如何改进其他蛋白质预测方法?

答: 我们使用端到端的预测。 该模型直接根据蛋白质的序列构建蛋白质的结构,将氨基酸模式转换成三维几何图形。 这就像把一套宜家的说明书翻译成一个内置的书架,减少了挫败感。 通过这种方法,该模型有效地学习了如何通过蛋白质自身的氨基酸语言来构建蛋白质。 值得注意的是,我们的方法不需要模板就可以精确地预测蛋白质结构。 它优于其他的折叠方法,并且明显快于基于物理的建模。 因为蛋白质数据库仅限于在自然界中发现的蛋白质,我们需要一种方法来可视化新的结构,从零开始制造新的蛋白质。

问: 这个模型如何能用来设计一个真正的蛋白质?

答: 我们可以为自然界中尚未被研究的序列逐个建立原子模型,就像我们在 APL 生物工程研究中使用的另一种方法那样。 我们可以通过分析蛋白质的稳定性和它在细胞中结合的其他蛋白质来可视化蛋白质的结构和使用其他计算方法来评估它的功能。 我们的模型可以用于药物设计或干扰传染病中蛋白质介导的生化途径。

在 MIT-IBM 沃森人工智能实验室,马库斯 · 比埃勒和他的同事们利用人工智能繁殖出蜜蜂在制造丝来建造蜂巢时产生的阿尔法螺旋蛋白质。 图片来源: Markus Buehler

问: 将蛋白质转化为声音有什么好处?

答: 我们的大脑处理声音的能力很强! 在一次扫描中,我们的耳朵能听出它所有的层次特征: 音高、音色、音量、旋律、节奏和和弦。 我们需要一台高倍显微镜来观察图像中的同等细节,但我们永远不可能一下子看到所有细节。 声音是获取存储在蛋白质中信息的一种非常优雅的方式。

一般来说,声音是由振动材料产生的,比如吉他弦,而音乐则是通过按等级模式排列声音而产生的。 通过人工智能,我们可以将这些概念结合起来,利用分子振动和神经网络来构建新的音乐形式。 我们一直致力于研究将蛋白质结构转化为声音表征的方法,并将这些表征转化为新的材料。

问: SARS-CoV-2的“棘突”蛋白的超声处理能告诉我们什么?

答: 它的蛋白质尖峰包含三条折叠成有趣图案的蛋白质链。 这些结构太小了,肉眼看不到,但是可以听到。 我们用纠缠链表示蛋白质的物理结构,将其编织成多层次的旋律。 穗蛋白的氨基酸序列、二级结构模式和复杂的三维折叠都具有特征性。 由此产生的乐曲是对位音乐的一种形式,在这种音乐中,音符是对着音符演奏的。 就像交响乐一样,音乐模式反映了蛋白质通过具体化其 DNA 编码而实现的交叉几何形状。

问: 你学到了什么?

答: 这种病毒具有不可思议的欺骗和利用宿主进行自我繁殖的能力。 它的基因组劫持了宿主细胞的蛋白质制造机制,迫使宿主细胞复制病毒的基因组,产生病毒蛋白质来制造新的病毒。 当你聆听的时候,你可能会惊讶于音乐中愉悦甚至放松的基调。 但是它欺骗我们的耳朵就像病毒欺骗我们的细胞一样。 这是一个伪装成友好访客的入侵者。 通过音乐,我们可以从一个新的角度看到 SARS-CoV-2尖峰,体会到学习蛋白质语言的迫切需要。

问: 这些地址中有没有新型冠状病毒肺炎地址,以及引起这些地址的病毒?

从长远来看,是的。 将蛋白质翻译成声音给了科学家们另一种理解和设计蛋白质的工具。 即使是微小的突变也能限制或增强 SARS-CoV-2的致病能力。 通过超声处理,我们还可以将其棘突蛋白的生化过程与以前的冠状病毒(如 SARS 或 MERS)进行比较。

在我们创造的音乐中,我们分析了感染宿主的穗蛋白的振动结构。 理解这些振动模式对于药物设计是至关重要的。 例如,振动可能随着温度的升高而改变,它们也可能告诉我们为什么 SARS-CoV-2尖峰病毒比其他病毒更容易受到人类细胞的吸引。 我们正在和我的研究生们一起探索这些问题。

我们也可以使用组合方法来设计药物来攻击病毒。 我们可以寻找一种与抗体的旋律和节奏相匹配的新蛋白质,这种抗体可以结合到棘突蛋白上,干扰其感染能力。

问: 音乐如何帮助蛋白质设计?

答: 你可以把音乐看作是结构的算法反映。 例如,巴赫的哥德堡变奏曲是对位法的杰出实现,我们在蛋白质中也发现了这一原理。 我们现在可以在大自然创造这个概念时听到这个概念,并将它与我们想象中的想法进行比较,或者使用人工智能讲述蛋白质设计的语言,并让它想象新的结构。 我们相信对声音和音乐的分析可以帮助我们更好地理解物质世界。 毕竟,艺术表达只是我们内心和周围世界的一个模型。

文献来源:

Zhao Qin et al. Artificial intelligence method to design and fold alpha-helical structural proteins from the primary amino acid sequence, Extreme Mechanics Letters (2020). DOI: 10.1016/j.eml.2020.100652

文章译文原创,转载请注明来源。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多