分享

LLMs之RAG:解读RAG主流的七类架构

 处女座的程序猿 2025-01-01 发布于上海

LLMs之RAG:解读RAG主流的七类架构


RAG主流的七类架构

原文地址:https:///weaviate_io/status/1866528335884325070

2024年12月11日,Weaviate(开源向量数据库)在官方社交媒体帖子,发布了七种最流行的RAG架构原理图。从图中可以看出,Retrieval-Augmented Generation(RAG)被划分为多种架构,每种架构在检索与生成的结合方式上有所不同,适用于不同的场景需求。这些RAG架构的多样性展示了技术的发展趋势,针对不同应用场景进行了优化设计。从简单的检索生成到复杂的多模态、多代理协作,每种架构都有其独特的优点和适用范围。博主进一步解读,如下表格所示:

架构名称

核心原理

优点

缺点

适应场景

Naive RAG

基于文档分块,通过检索机制获取相关内容,直接将结果输入生成模型生成答案。

>> 文本分块、检索机制、生成模型

简单易实现,计算成本低。

容易出现事实错误或语义不一致,无法处理复杂的上下文管理任务。

基础的问答任务,对精度要求不高,数据量较小的情况。

Retrieve-and-rerank

在基础RAG上新增重排序模块,对检索结果重新排序优化其相关性,确保生成模型输入更加相关的上下文信息。

>> 初步检索、重排序模型、生成模型

可以提高检索结果的准确性,减少噪声数据的影响。

计算成本相对较高,需要设计有效的重排序算法。

高精度问答,如法律文档、技术文档的精准查询和回答。

Multimodal RAG

支持多模态输入(文本、图像、视频等),利用多模态嵌入和生成模型进行检索和生成。

>> 文本与图像处理、模态融合

能够处理和理解多模态数据,适配能力强,可提高生成结果的准确性和丰富性。

实现复杂,计算成本高,需要大量的多模态数据

涉及图片、视频等多模态数据的问答,如电商推荐、图像描述生成、视频问答。

Graph RAG

文档表示为图结构(图数据库),通过图节点和边(图神经网络)的关联挖掘文档之间的语义和逻辑关系,强化上下文关系理解。

>> 图数据库、知识图谱、语义关联

可以有效地捕捉文档之间的关联关系,提高检索结果的准确性。

需要构建和维护图数据库,计算成本相对较高。

需要处理文档之间关系的任务,例如知识图谱问答、复杂关系推理(如医学或科研领域)。适用于知识推理场景。

Hybrid RAG

结合多种检索策略(例如关键词检索、语义向量检索等)进行检索和生成。

>> 图结构、传统检索、知识融合

可以提高检索结果的多样性和覆盖率。

实现复杂,需要协调多种检索方法。

需要同时考虑多种检索策略才能更好地满足需求的场景。

Agentic RAG (Router)

利用路由机制,根据查询动态选择检索源和生成模型,针对性地生成响应。

>> AI Agent、智能路由、资源选择

动态选择能力强,资源利用效率高,能够应对多变的任务需求。

路由策略设计较复杂,对任务分类准确性依赖高。

多数据源、多任务类型场景,如需要跨API、数据库和生成模型的集成应用。

Agentic RAG (Multi-Agent)

利用多个AI Agent分别负责不同的检索任务或数据源,多代理协作,每个代理专注于不同的数据源或任务(如搜索引擎、企业应用、邮件系统等,然后将结果整合到一起生成答案。

>> 多智能体、任务分配、工具协作

高度模块化,强大的并行处理多个检索任务,适应性极高,高效率。

代理之间的协调较复杂,对系统设计和通信机制要求高。

超复杂的大规模任务,需要多个代理协同完成的场景,例如多轮对话、复杂推理等。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    该文章已关闭评论功能
    类似文章