艾伦人工智能研究所正在开发针对科学优化的大型语言模型OLMo

天承办公室 2023-05-14 发布于江苏

展开全文

编辑 | 绿萝

最近，生成式人工智能和大型语言模型 (LLM) 的大火。

从初创公司到企业巨头，每个人都竞相尽快进入市场，以免被落在后面。

不幸的是，这引发了一些问题和担忧，很大程度上是因为这些公司使用的语言模型既不透明也不完全理解。

西雅图的艾伦人工智能研究所 (AI2) 正在努力改变这一状况。

近日，AI2 宣布正在创建一个名为 AI2 OLMo（开放语言模型）的开放生成语言模型。它将与其他最先进的 LLM 相媲美，预计将于 2024 年初首次亮相。

AI2 的目标是协作构建世界上最好的开放语言模型。OLMo 背后的理念是，通过为数百万希望更好地理解和使用语言模型的人提供访问权限，他们可以创造一个环境，让每个人都能更快、更安全地取得进步。

该计划的独特之处在于它将开发一个「由科学家，为科学家服务」的开放语言模型。

「考虑到科学界，OLMo 将专门用于推进语言模型科学，」OLMo 项目负责人兼 AI2 NLP 研究高级主管 Hannaneh Hajishirzi 说。「OLMo 将是第一个专门为科学理解和发现而设计的语言模型。」

该计划将通过提供对模型各个方面（包括其开发、实施和使用）的访问和教育，使研究界和公众受益。此外，开放模型正在与 AMD 和 CSC 合作开发，使用世界上最环保的超级计算机之一 LUMI。

「OLMo 将是一些特别的东西，」Noah Smith 说，他也是 OLMo 项目负责人和 AI2 的 NLP 研究高级总监。

Smith 补充道：「在许多人急于从生成语言模型的商业潜力中获利的情况下，AI2 具有独特的能力，可以将我们世界一流的专业知识与 AMD 和 LUMI 的世界一流硬件结合起来，为科学家和研究人员提供专门设计的产品，供他们参与、学习，并用于创造下一代安全、有效的人工智能技术。」

Hannaneh Hajishirzi (左) 和 Noah Smith（右）。(来源：AI2)

AI2 将 OLMo 视为一个平台，而不仅仅是一个模型，一个允许研究社区获取 AI2 创建的每个组件并自己使用或寻求改进的平台。Hajishirzi 说，AI2 为 OLMo 所做的一切都将公开可用，包括公共演示、训练数据集和 API，并在「适当」许可下记录「非常有限」的例外情况。

Hajishirzi 说：「我们正在构建 OLMo，以便为 AI 研究社区创造更多直接在语言模型上工作的机会。我们相信 OLMo 各方面的广泛可用性将使研究社区能够利用我们正在创造的东西并努力改进它。我们的最终目标是合作构建世界上最好的开放语言模型。」

AI2 的 NLP 研究高级主管 Noah Smith 表示，OLMo 的另一个差异化因素是专注于使模型能够更好地利用和理解教科书和学术论文，而不是代码。在这方面还有其他尝试，比如 Meta 臭名昭著的 Galactica 模型。但 Hajishirzi 认为，AI2 在学术界的工作及其为研究开发的工具，如 Semantic Scholar，将有助于使 OLMo 「特别适合」科学和学术应用。

「我们相信 OLMo 有潜力成为该领域真正特别的东西，特别是在许多人急于从对生成人工智能模型的兴趣中获利的环境中，」Smith 说。「AI2 作为第三方专家的独特能力让我们有机会不仅可以利用我们自己的世界级专业知识，还可以与业内最强大的人才合作。因此，我们认为我们严格的、有记录的方法将为构建下一代安全、有效的人工智能技术奠定基础。」

可以肯定的是，这是一种很好的情绪。但是，围绕训练和发布生成人工智能的棘手伦理和法律问题又如何呢？围绕内容所有者（以及其他受影响的利益相关者）的权利展开的激烈辩论，以及无数棘手的问题，尚未在法庭上得到解决。

为了消除担忧，OLMo 团队计划与 AI2 的法律部门和待定的外部专家合作，在模型构建过程中的「检查点」停下来重新评估隐私和知识产权问题。

「我们希望通过关于模型及其预期用途的公开和透明的对话，我们可以更好地了解如何减轻偏见、毒性，并阐明社区内突出的研究问题，最终产生最强大的可用模型之一」Smith 说。

滥用的可能性如何？对于意图传播虚假信息和生成恶意代码的不良行为者而言，模型通常是有毒且有偏见的。

Hajishirzi 表示，AI2 将结合许可、模型设计和对底层组件的选择性访问，以「最大限度地提高科学效益，同时降低有害使用的风险」。为了指导政策，OLMo 有一个道德审查委员会，由内部和外部顾问（AI2 不会说具体是谁）组成，他们将在整个模型创建过程中提供反馈。

目前，还有很多悬而未决的事情——包括该型号的大部分技术规格。（AI2 确实透露它将有大约 700 亿个参数，参数是从历史训练数据中学习的模型的一部分。）未来几个月，将在芬兰的 LUMI 超级计算机上开始训练。

参考内容：

https://www./2023/allen-institute-for-ai-creating-an-open-generative-ai-language-model-by-scientists-for-scientists/

https:///2023/05/11/ai2-is-developing-a-large-language-model-optimized-for-science/

https:///

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：天承办公室 > 《013超级科学》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

天承办公室

关注对话

TA的最新馆藏

六镇起义：老是让同一群人做贡献，苦同一群人，会把老实人逼急的
理想汽车净利环比下滑近90%，理想汽车股价大跌超13%|理想汽车
腾讯股价重回400港元大关，马化腾再夸视频号
科创债落地两周年：规模明显增长结构持续优化 500只产品累计发行规模超4100亿元
大模型独角兽月之暗面辟谣收费称“小范围测试Kimi打赏功能”
5月21日国内四大证券报纸、重要财经媒体头版头条内容精华摘要

喜欢该文的人也喜欢更多

热门阅读换一换