分享

谷歌推出人工智能工具,发力靶标发现和数据分析,加速药物发现和精准医疗

 生辉 2023-05-22 发布于甘肃

自去年底 OpenAI 推出 ChatGPT 以来,谷歌面临的压力剧增。

今年 2 月,谷歌推出聊天机器人 Bard 应战。然而,Bard 首秀翻车,对于谁拍摄了人类第一张系外行星的照片给出错误答案,致使其市值一夜暴跌超 7000 亿人民币。

上周,谷歌举办了今年的 I/O 大会,发布了最新大模型 PaLM 2,并称已集成到超过 25 种产品中,例如地图、文档、Gmail、表格和聊天机器人 Bard。拟挽回此前翻车形象,再次对标 OpenAI 的 ChatGPT。消息发布当天,母公司 Alphabet 的股价上涨了 4.3%。

本周,谷歌云继续推出最新成果,宣布推出两款新的人工智能工具,帮助生物技术和制药公司加速药物发现和推进精准医疗。一种名为 Target and Lead Identification Suite 的工具将帮助研究人员了解氨基酸的功能并作为蛋白质结构的预测引擎;另一个工具 Multiomics Suite 将帮助研究人员分析旨在开发精确治疗的大量不同的组学数据。


两个新的人工智能工具都是为了解决生物制药行业长期存在的问题:药物开发的时间以及成本问题。

据悉,两种工具都已提供给制药公司使用,包括辉瑞、Cerevel Therapeutics、Colossal Biosciences 等,具体费用将因公司而异。

三管齐下提高生物靶标发现效率

蛋白质是组成人体一切细胞、组织的重要成分,也是最常见的生物靶标。在理解蛋白质的结构和功能之后,就可以围绕蛋白质开发药物。

传统方式发现生物靶标往往需要大约 12 个月,且失败率较高。与此同时,管理大量数据需要昂贵且资源密集型的基础设施策略来获取、存储、分发和分析基因组数据,因为数据量每 7 到 12 个月翻一番。

Target and Lead Identification Suite 的目标就是简化药物开发的第一个关键步骤,即确定研究人员可以关注的生物靶点并围绕其设计治疗方法。该工具采用三管齐下的方法来提高效率。 

数据摄取:允许公司简化数据的摄取、共享和管理,包括通过公共数据集发现更多数据用于研究,以及使用谷歌云的分析中心与其他组织安全地跨组织交换数据;

目标识别:使用 AlphaFold2 和 Vertex AI 平台,可以更准确地预测蛋白质结构,最大限度地减少传统方法的高失败率。AlphaFold2 在谷歌的 Vertex AI 平台上运行,是谷歌云用于训练和部署 ML 模型和 AI 应用程序的机器学习平台,该平台允许研究人员更快地构建和部署机器学习模型。仅需几分钟,AlphaFold2 可以比传统技术更准确地预测蛋白质的 3D 结构,并达到研究人员需要的规模。

先导物识别:借助经济高效的高性能计算资源,该解决方案可加速靶标发现、先导物候选物的制备和虚拟高通量筛选,以找到最有前途的先导物候选物分子。如果一个分子改变了蛋白质的功能并最终显示出治疗疾病的能力,就可以成为新药的基础。

该技术的早期使用者包括大型制药公司辉瑞、神经科学生物技术公司 Cerevel 等。Cerevel 是在辉瑞和贝恩资本的支持下成立,目前拥有近十条管线,最快的已到临床 Ⅲ 期阶段,其适应症包括癫痫、帕金森症、精神分裂症等。


▲图 | Cerevel 药物开发管线(来源:Cerevel 官网)

Cerevel 的首席科学官 John Renger 介绍称,Cerevel 通常需要筛选一个包含 300 万种不同分子的大型分子库,以找到一种能够对疾病产生积极影响的分子,这个过程“复杂且昂贵”。

但 Renger 表示,该公司能够使用谷歌云的工具更快地确定分子。计算机将负责筛选分子并帮助 Cerevel 非常快速地得到答案。Renger 预计该工具将帮助 Cerevel 将发现新药的时间节省至少 3 年,但目前无法给出具体能够节省多少资金。

Cerevel 已经与谷歌合作了一个多月,以进一步了解该工具并确定如何使用它。Renger 希望 Cerevel 在下个月“能够取得一些成果”。

快速分析基因组数据

此前,研究人员对 DNA 进行测序的能力优于其破译和分析的能力。但随着近年来技术的进步,基因组数据开启了对与疾病相关的遗传变异等领域的新见解。 

谷歌云的总监 Shweta Maniar 表示,它最终可以帮助开发更加个性化的药物和治疗方法。根据发表在 Nature 杂志上的一篇论文,仅在 2021 年,食品药品监督管理局批准的药物中就有三分之二得到了人类遗传学研究的支持。

谷歌云的第二个工具 Multiomics Suite 目的就是帮助研究人员应对基因组数据分析的问题。 

Multiomics Suite 的与众不同之处在于它与云无关,允许组织在简化的环境中利用现有的多组学。它还通过 Vertex AI 提供完整的可追溯性,因此用户可以在其云环境中组织数百万个工件。最后,它利用 Google Research 的强大功能来转换数十万个文件、样本和记录,以将变体调用格式文件从 Google Cloud Storage 加载到 BigQuery 中进行分析。


(来源:Pixabay)

Mutiomics Suite 包括:

数据摄取和分析:允许组织简化数据的摄取、共享和管理,使用 Collibra 的数据集仪表板通过公共数据集发现更多数据用于研究,使用户能够使用 Analytics Hub 与其他组织安全地交换数据。

二次分析:使组织能够将带有全基因组关联研究 (GWAS) 管道的原始序列文件提取到 Google Cloud Storage 中,使用 Batch API 和 NVIDIA 的 Parabricks 提取变体以使用 GATK 和 Google 的 DeepVariant 等工具加速基因组分析,并使用 Compute 加速处理以可扩展、安全且经济高效的方式将原始测序 (DNA/RNA) 数据转化为可操作见解的引擎。

三次分析:允许用户识别与特定疾病或特征相关的基因,将其整合到多模态数据集中,使用 Variant Transform 和 BigQuery 处理和分析变体,使用 Vertex AI 扩展 AI 和机器学习,并使用 Looker 可视化见解。

Colossal Biosciences 是一家利用基因工程来拯救灭绝物种的生物技术公司。作为一家初创公司,Colossal 没有必要自己搭建内部基础设施来组织或破译大量基因组数据。根据美国国家人类基因组研究所的数据,仅一个人类基因组序列就需要超过 200GB 的存储空间,到 2025 年,或将需要 40EB 来存储全球基因组数据。 

Colossal 从去年底开始使用 Multiomics Suite,其首席执行官 Ben Lamm 高度赞扬,表示这是公司能够在合理时间内开展研究的原因,并表示公司目标是在 2028 年复活猛犸象。

据 Colossal 战略与计算科学副总裁 Alexander Titus 博士透露:“与开源工具相比,借助谷歌云的 Multiomics Suite,Colossal 的总成本降低了 52%,执行全基因组序列分析的时间减少了 88%,证明了整体计算效率的显著提高。”

自消息发布之日,谷歌云的两种人工智能工具均已全面推向市场。

免责声明:本文旨在传递生物医药最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多