分享

为什么整个AI领域的趋势是: AI Agent ?

 天承办公室 2024-04-25 发布于北京

通过阅读下文能够了解:

  1. LLM,RAG,AI Agent的本质区别

  2. 为什么整个AI领域正在朝着AI Agent的方向发展?

  3. AI Agent的架构

关注公众号, 后台输入关键词获取更多相关文章  
e.g. 尝试公众号后台查询'AI Agent',  'RAG',  '知识图谱', '大模型'等

图片

AI Agent

为什么整个AI领域正在朝着AI Agent的方向发展?

当 Andrew Ng 和 Andrej Karpathy 发表了他们的主题演讲和看法的时候,我们应该详细参考。

以后的公司, 将是少数几个人带领着一堆AI Agent维持公司运作。

以下为 LLM, RAG, AI Agent的图例:

图片    

这篇文章是关于什么的?

人工智能的未来将是主动的!

在这篇文章中,我们将介绍这意味着什么。看看AI领域最优秀的大脑们在谈论什么是AI Agent

图片

这篇文章探讨了人工智能(AI)代理的概念以及它们在塑造未来方面日益重要的作用。

未来的工作正在发生变化

AI 领域正在超越狭窄、专业化的模型,转向开发高度能力的自主代理,这些代理可以真正增强和提升人类在各个领域的智能。

这种向 AI 代理的转变深刻改变我们工作、生活和与技术互动的方式,开启智能、适应性和越来越有用的新时代的 AI 系统。

阅读本文,了解为什么整个人工智能领域都在向着开发先进的人工智能代理靠拢,这可能会彻底改变我们对人工智能的应用和利用方式。

无论您是经验丰富的AI爱好者还是新手,了解走向人工智能代理的轨迹对于保持信息灵通并积极参与即将到来的变革之旅至关重要。

如果你想要了解以下内容,那么必读这篇文章

  • 理解未来的工作:AI 代理将如何重塑行业和自己的职业生涯?

  • 成为早期采用者:学习如何创建 AI 代理并利用它们。

  • 获得竞争优势:在快速发展的技术领域保持领先。    

当已经有 LLM 和 RAG
为什么我们还需要 AI 代理

LLM 和 RAG 模型推动了语言生成的可能性边界,而 AI 代理的发展代表着更智能、自主和多能力系统的一步,这些系统可以在更广泛的场景中与人类一起工作。转向代理是为了创建真正能够理解、学习和解决现实世界问题的 AI 系统。

有几个关键原因导致为什么需要 AI 代理:

  • 目标导向行为:LLMs 和 RAG 模型主要专注于根据其训练数据中的模式生成类似人类的文本。
    然而,它们缺乏以灵活、智能的方式设定和追求特定目标的能力。另一方面,AI 代理可以被设计为具有明确的目标,并planning并采取行动来实现这些目标。

  • memory和状态跟踪:大多数当前的语言模型都没有持久的内存或状态跟踪能力。每个输入都是独立处理的。
    AI Agent可以维护内部状态,随着时间累积知识,并利用该状态来指导未来的决策和行动。

  • 与环境的交互:LLM 仅在文本领域操作,没有与物理世界的直接交互。
    AI 代理可以感知并对其环境进行操作,无论是数字世界、机器人系统,甚至是通过传感器和执行器对物理世界。

  • 转移和泛化:虽然 LLM 在类似于它们的训练数据的语言任务上表现出色,但它们经常在将知识转移到全新领域或任务上遇到困难。
    具有学习、推理和规划能力的 AI 代理具有更好地转移和泛化到新情况的潜力。

  • 持续学习:大多数语言模型在训练后是静态的。
    AI Agent可以在与新环境和情况的互动中持续学习和适应他们的知识和技能。

  • 多任务能力:LLMs 通常专门用于特定的语言任务。
    AI 代理可以设计为通用的、多任务系统,能够流畅地结合各种技能,如语言、推理、感知和控制,以解决复杂的多方面问题。
        

世界会因“AI Agent”而发生哪些变化?

图片

想象一下,你需要预订一次复杂的旅行:

LLM:可以解释不同的旅游景点或提供一般的旅行建议。

RAG:可以找到有关目的地的相关博客和文章

AI 代理: 以上都可以做,而且还能:

  • 基于预算搜索航班和酒店

  • 进行预订    

  • 将所有事情添加到你的日历中

  • 发送出发前提醒及相关信息

 LLM、RAG 和 AI Agent

图片

AI Agent 和 LLM, RAG相比有以下特点:

1. 任务定向 vs. 通识知识

  • LLMs:擅长广泛的语言理解和生成。它们就像是信息的大型图书馆。

  • RAG:通过找到相关信息来改进 LLMs。然而,重点是知识和文本生成。

  • AI 代理:建立在特定目标的基础上。它们弥合了理解语言和在现实世界或数字系统中采取行动之间的差距。    

2. 多步推理

LLMs & RAG:主要处理单个输入,并基于此提供响应

AI 代理:可以将多个步骤链接在一起:例如,检索信息(如 RAG),处理信息以做出决策, 采取行动,比如:发送电子邮件, 预约一个约会, 控制智能家居设备

3. 主动性

·LLMs & RAG:通常对直接提示做出回应。

·AI 代理:可以主动。他们可以:监控数据流并提醒您关键变化, 根据您的偏好启动操作, 随着时间的推移,他们会根据对你的了解来调整他们的行为

4. 与现有系统的集成

·LLMs & RAG:倾向于在它们自己的环境中运行。

·AI 代理:设计用于与各种系统和 API 进行接口对接:例如,访问您的电子邮件或日历, 与数据库交互, 控制其他软件或设备    

AI 代理的架构包括什么?

图片

一个 AI 代理的架构包括使其能够在环境中思考、规划和行动的基本组件。这种复杂的设计通常包括:

·一个推理引擎:代理的核心,利用强大的大型语言模型(LLM)来理解自然语言,获取知识,并通过复杂问题进行推理。

·知识库:作为代理的记忆存储,存储与其任务相关的事实信息、过去经验和偏好。

·工具集成:允许代理通过 API 与各种软件应用程序和服务进行交互,扩展其操纵和控制环境的能力。

·感官输入:提供了代理人感知其周围环境的能力,从文本、图像或各种传感器中收集数据。

·(可能是)用户界面:一个桥梁,实现与人类用户的无缝沟通和协作。(**我不太确定是否有任何标准的用户体验,但我相信我们很快会需要,或者可能还不太标准)

这些元素共同构成了一个智能系统,能够自主解决问题。人工智能代理可以分析问题,制定逐步计划,并自信地执行,使其成为人工智能世界中的变革力量。    

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多