分享

表现优于 GPT-4,ChemCrow 集成 13 种化学工具,增强大型语言模型的化学性能

 天承办公室 2023-04-17 发布于江苏

Image


Image
编辑 | 紫罗
最近,大型语言模型 (LLM) 在各种跨领域任务中表现出强大的性能,但在处理化学相关的问题上却举步维艰。此外,LLM 缺乏外部知识来源,限制了其在科学研究中的应用。
来自洛桑联邦理工学院(EPFL)和罗切斯特大学的研究人员开发了 ChemCrow,一种 LLM 化学智能体,旨在完成有机合成、药物发现和材料设计等各种任务。
通过集成 13 种专家设计的工具,ChemCrow 增强了 LLM 在化学方面的表现,并出现了新的功能。该研究通过 LLM 和专家人工评估,证明了 ChemCrow 在自动化各种化学任务方面的有效性。令人惊讶的是,作为评估器的 GPT-4 无法区分明显错误的 GPT-4 completions 和 GPT-4 + ChemCrow 性能。
该研究以「ChemCrow: Augmenting large-language models with chemistry tools」为题,于 2023 年 4 月 11 日发布在 arXiv 预印上。
Image
在过去几年中,LLM 通过自动化自然语言任务改变了各个领域。然而,LLM 往往难以完成看似简单的任务,例如基础数学和化学操作。
AI 已用于化学研究,例如反应预测、逆合成规划、分子特性预测、从头分子生成、材料设计以及最近的贝叶斯优化等。然而,与其他领域相比,化学领域实现的自动化水平仍然相对较低,这主要是由于其高度实验性和偶尔的手工性质,以及计算工具的范围和适用性有限,即使在指定领域内也是如此。
受 LLM 在其他领域成功应用的启发,研究人员提出一个 LLM 驱动的化学引擎 ChemCrow,旨在简化药物、材料设计和合成等领域中各种常见化学任务的推理过程。
ChemCrow 整合 13 种专家设计的化学工具,并通过提示 LLM(GPT-4) 提供有关任务和所需格式的具体说明来操作。
Image

图 1:ChemCrow 的工具集。(来源:论文)

使用各种与化学相关的软件包和软件,创建了一套工具。然后将这些工具和用户提示提供给 LLM。LLM 然后通过一个自动的、迭代的思维链过程,在得出最终答案之前决定它的路径、工具的选择和输入。
Image

图 2:ChemCrow 流程概述。(来源:论文)

ChemCrow 充当专家化学家的助手,同时通过提供一个简单的界面来获取准确的化学知识,从而降低非专家的进入门槛。研究人员分析了 ChemCrow 在 12 个用例上的功能,包括合成目标分子、安全控制以及搜索具有相似作用模式的分子。
结果表明,ChemCrow 大大优于普通的 LLM,尤其是在更复杂的任务上。GPT-4 未能系统地给出事实准确的信息(平均得分为 4.79,而 ChemCrow 为 9.25),示例中的大多数错误要么给出了错误的分子名称或 SMILES,要么预测了错误的反应。在完成分数上,GPT-4 的表现略好于 fact 分数 (6.87),但仍远低于 ChemCrow 的水平 (9.62),显示出 ChemCrow 在解决化学任务方面的有效性。
Image

图 3:得分结果。(来源:论文)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多