人工智能和机器学习在过去十年中呈指数级增长,那么化学领域如何随着这一新兴趋势发展? 2021年9月,CAS发布白皮书《Artificial Intelligence in Chemistry: Current Landscape and Future Opportunities》。 本文是CAS的信息科学家ZACH BAUM对白皮书的简要解读。 在过去的20年中,人工智能的进步,特别是机器学习,已经改变了我们进行科学研究的方式。从绘制基因组序列图和发现新抗生素,到模拟气候变化对地球的影响,甚至绘制银河系图以寻找其他类地行星,人工智能正在改变多个学科的研究。 化学就是这样的科学领域之一,在人工智能的采用方面取得了巨大飞跃。我们最新的白皮书《Artificial Intelligence in Chemistry: Current Landscape and Future Opportunities》探索了人工智能与化学之间的联系,使用我们自己的技术来描绘论文和专利的格局。我们发现了处于领先地位的采用人工智能技术的化学领域,以及那些尚未采用人工智能技术但具有巨大潜力的化学领域。 化学领域的人工智能在哪里发展 图1|在所有学科中的AI有关论文的最高百分比 我们探索了这些论文和专利之间的关系(从 2000 年到 2020 年间),以了解使用 AI 如何帮助研究人员解决问题(图 2)。例如,在 2000 年初到 2014 年之间,人工智能论文和专利的重点从探索人类疾病诊断转移到了遗传算法,并将其应用于药物发现和 microRNA。 图 2|2000-2020 年 AI 相关化学期刊论文中同时出现的概念的演变 毫不奇怪,我们的研究还发现,小分子是人工智能出版物和专利分析的最大焦点。这些包括药物发现、逆合成和反应优化等主题,反映了制药公司通常在哪些方面进行更多投资。 化学机器学习的机会在哪里? 图 3|在期刊论文中发表的跨学科研究的相对流行度 列表示主要研究领域,行表示次要研究领域,每个方块表示主要和次要研究领域的跨学科对。 例如,多学科论文在分析化学和生物化学中更为常见,其中机器学习算法被用于改进蛋白质、肽、脂质和核酸的分析,以及预测化学反应甚至发现新分子。人工智能也被广泛应用于材料科学和物理化学,这两个学科旨在预测功能材料、结构-性能关系和化学工艺优化。 在化学中采用人工智能的障碍 领先专家在我们的网络研讨会“化学中的人工智能:当前趋势和未来机遇”中讨论了采用 AI 的潜在障碍。他们确定了在化学中采用人工智能的三个主要障碍: 数据质量:最佳预测取决于稳健、高质量的数据集,这些数据集为训练提供正样本和负样本。如今,对许多组织而言,访问、规范化和准备数据是一项重大挑战。 技术:虽然计算能力(量子和基于云的方法)正在改进,但从用户的角度来看仍然存在局限性。然而,今天软件和用户界面的进步消除了编程要求,让更多的科学家能够在他们的研究中利用机器学习。 人才短缺:数据科学的人才短缺是有据可查的,化学家可能不了解今天的人工智能有多平易近人。增加化学与其他科学学科之间的合作可能有助于加速人工智能的整合。 机器学习在化学领域的发展机遇 人工智能和训练数据集被用于解决世界各地科学机构的问题和创新,为数据分析和药物发现提供了重要机会。 通过将人工智能纳入科学研究,可以解决一些最紧迫的问题,并在传统数据分析方面取得巨大进步。 参考资料 https://www./resources/blog/artificial-intelligence-chemistry 白皮书链接 https://www./sites/default/files/documents/ai-chemistry-landscape.pdf |
|