LLMs之RAG：解读RAG主流的七类架构

处女座的程序猿 2025-01-01 发布于上海

展开全文

LLMs之RAG：解读RAG主流的七类架构

RAG主流的七类架构

原文地址：https:///weaviate_io/status/1866528335884325070

2024年12月11日，Weaviate(开源向量数据库)在官方社交媒体帖子，发布了七种最流行的RAG架构原理图。从图中可以看出，Retrieval-Augmented Generation（RAG）被划分为多种架构，每种架构在检索与生成的结合方式上有所不同，适用于不同的场景需求。这些RAG架构的多样性展示了技术的发展趋势，针对不同应用场景进行了优化设计。从简单的检索生成到复杂的多模态、多代理协作，每种架构都有其独特的优点和适用范围。博主进一步解读，如下表格所示：

架构名称	核心原理	优点	缺点	适应场景
Naive RAG	基于文档分块，通过检索机制获取相关内容，直接将结果输入生成模型生成答案。 >> 文本分块、检索机制、生成模型	简单易实现，计算成本低。	容易出现事实错误或语义不一致，无法处理复杂的上下文管理任务。	基础的问答任务，对精度要求不高，数据量较小的情况。
Retrieve-and-rerank	在基础RAG上新增重排序模块，对检索结果重新排序优化其相关性，确保生成模型输入更加相关的上下文信息。 >> 初步检索、重排序模型、生成模型	可以提高检索结果的准确性，减少噪声数据的影响。	计算成本相对较高，需要设计有效的重排序算法。	高精度问答，如法律文档、技术文档的精准查询和回答。
Multimodal RAG	支持多模态输入（文本、图像、视频等），利用多模态嵌入和生成模型进行检索和生成。 >> 文本与图像处理、模态融合	能够处理和理解多模态数据，适配能力强，可提高生成结果的准确性和丰富性。	实现复杂，计算成本高，需要大量的多模态数据。	涉及图片、视频等多模态数据的问答，如电商推荐、图像描述生成、视频问答。
Graph RAG	将文档表示为图结构(图数据库)，通过图节点和边(图神经网络)的关联挖掘文档之间的语义和逻辑关系，强化上下文关系理解。 >> 图数据库、知识图谱、语义关联	可以有效地捕捉文档之间的关联关系，提高检索结果的准确性。	需要构建和维护图数据库，计算成本相对较高。	需要处理文档之间关系的任务，例如知识图谱问答、复杂关系推理（如医学或科研领域）。适用于知识推理场景。
Hybrid RAG	结合多种检索策略（例如关键词检索、语义向量检索等）进行检索和生成。 >> 图结构、传统检索、知识融合	可以提高检索结果的多样性和覆盖率。	实现复杂，需要协调多种检索方法。	需要同时考虑多种检索策略才能更好地满足需求的场景。
Agentic RAG (Router)	利用路由机制，根据查询动态选择检索源和生成模型，针对性地生成响应。 >> AI Agent、智能路由、资源选择	动态选择能力强，资源利用效率高，能够应对多变的任务需求。	路由策略设计较复杂，对任务分类准确性依赖高。	多数据源、多任务类型场景，如需要跨API、数据库和生成模型的集成应用。
Agentic RAG (Multi-Agent)	利用多个AI Agent分别负责不同的检索任务或数据源，多代理协作，每个代理专注于不同的数据源或任务（如搜索引擎、企业应用、邮件系统等，然后将结果整合到一起生成答案。 >> 多智能体、任务分配、工具协作	高度模块化，强大的并行处理多个检索任务，适应性极高，高效率。	代理之间的协调较复杂，对系统设计和通信机制要求高。	超复杂的大规模任务，需要多个代理协同完成的场景，例如多轮对话、复杂推理等。