分享

告别熬夜整理!你的AI知识库该学会自己”觅食”了:关键词自动检索+资料归档+整理汇报

 创业大学 2025-04-23 发布于天津

在信息爆炸的时代,整理和管理知识成为了一项艰巨的任务。本文将介绍如何利用AI技术,让知识库能够自动“觅食”,实现关键词自动检索、资料归档和整理汇报。

之前分享过产品经理怎么用AI搭建你的专属知识库?(保姆级教程) 的文章,当时搭建Agent比较“呆”,需要我叫一下,才动一下。用职场黑话形容这个“AI员工不够自驱”。所以有了这篇2.0版本的教程,怎么让你的“AI小秘书”自动干活。

引入:实用效果

先来看下最终实现的效果,我把这个Agent部署在了我个人飞书账户中,它每天早上9点都会帮我在人人都是产品经理的网站上,检索收集“AI”相关的最热门优质的文章,帮我整理进我的飞书知识库中。当我给它发送文章的链接时,它也会帮我分析链接内容,整理进知识库。每次整理好,它都会自动汇报,整理了哪些文章,文章大概是什么内容。

上述截图是我实际使用的效果截图,不是为了流量的或者变现的噱头,是非常实用性的攻略。如果感兴趣,也想自己复刻一个同类Agent,请有一些耐心阅读下去吧。下面我将从方案的设计到具体的落地实操,最后也会有我的总结经验,原创内容不易,请不要吝啬你的点赞、转发、评论~

一、方案的设计

这里我是从我自己平常的习惯,以交互为起点,梳理的脑图,来理清楚Agent的工作任务。

梳理完脑图,会很直观地感受到,看似是三个任务,实际上很多步骤是相同的,如归类整理、写入知识库、整理汇报。为了避免重复工作,所以在脑图的基础上,重新整理了下图的工作流的主要节点:

二、详细设计步骤

步骤1:创建知识库表单

在飞书云文档中,选择新建多维表格。

表格可以参考我的设置,这里需要注意每一列的类型要设置正确。标题、文章概述列可以设置文本类型;关键词列可以选择单选或者多选类型;阅读状态列可选择单选类型;收集时间列,可以设置为时间类型,并且勾选“新纪录自动填写创建时间”。

步骤2:创建链接解析工作流

首先我们需要建一条解析文章链接,进行内容整理的工作流。先看一下这条工作流的全貌。

第一个节点,需要添加一个[插件]节点,在插件库中检索“链接读取”等关键词,找到符合使用场景的插件。将插件与开始节点链接,然后输入变量直接引用开始菜单的输入参数。

可以看到节点1的插件会提炼输出很多的字段信息,这里是无法直接使用的,需要进行内容的整理,整理成符合我们要求的格式,所以添加[大模型]节点,因为这个节点主要是文案的整理归纳,所以选择豆包和KIMI的大模型就可以满足使用。

链接大模型节点与上一链接解析的插件节点,将大模型的输入变量,引用为上一节点插件输出date这个字段合集。

然后写上大模型的提示词(可以参考下面截图中我的提示词)。这里提示词没有唯一答案,要结合你实际的使用需求。但是需要一定写明要大模型整理哪些字段的信息,要它提炼文案的规则。这里输出的内容需要对应我们一开始创建的知识库表单中对应写入的字段。

然后这里大模型输出的字段需要注意输出的格式,对应字段的类型一定不能选错,通常都是string,但是如果标签之类的有多个的,需要选择Array-string的格式。

资料大模型已经整理好了,接下来需要写入飞书文档,这里要添加飞书文档的插件,并且按照插件要求的传输格式把字段传入。这里我不会代码,所以我用大模型帮我进行整理。

飞书插件输入的参数,app_token栏输入文档的链接,records直接引用大模型整理好输出的参数即可。

这里链接好之后,可以试运行一下,如果msg显示success代表传输成功,如果其他的代码,可以对照飞书开放平台中的操作文档,进行对应的检查。

因为这里我需要传输成功之后,需要给我汇报工作完成情况,所以我又添加了一个[大模型]节点,让它专门负责工作汇报。

工作流配置完成后,点击试运行,测试成功之后,点击右上角发布工作流即可。

步骤3:创建关键词检索工作流

完成步骤2,就完成了下列图片中标绿的节点。

接下来需要再重新创建一条根据关键词检索的工作流,照例先看下最后配置好的全貌。

节点1这里我配置了一个从人人都是产品经理的网站获取推荐文章的插件。插件库里面也有从CSDN获取热门文章的插件,这里依照实际习惯和需求,添加即可。

通过插件获取的推荐文章有很多,所以这里需要添加大模型节点对于内容进行筛选和整理。

1.选择大模型批处理模式;

2.批处理的变量引用为上一节点中插件输出的date字段;

3.大模型输入的变量,添加插件的date的字段和开始节点中输入的字段;

系统提示词这部分也是没有唯一的答案,这里也可以参考截图中的。主要写明了让大模型筛选文章的逻辑,让它筛选完成之后,直接整理出满足条件的文章url;

这里我还考虑到有时候不一定会匹配到符合检索关键词的文章,所以我额外新增了[选择器]节点,如果检索不到符合要求的直接输出“抱歉,检索不到符合条件的文章”,如果有符合的url则执行后续的工作流。

大模型整理出的文章链接很多,接下来,需要把这些链接按照步骤2同样的格式进行读取——整理——写入,所以这里我添加了一个[循环]的节点。(注意这里一定要选择循环体,而不是批处理。可以理解这个原理是需要文章链接都去执行步骤2的工作流,但是每一次我传输给工作流的url都是不同的,需要它循环处理这个动作)

选中[循环]-中的[循环体]选框,然后再添加[工作流]节点,选择步骤2中的工作流。然后需要再添加[变量]节点,把每一篇的大模型筛选出来的url设为变量。具体的配置步骤详见下图。

设置好循环体之后,我还需要大模型进行工作报告,针对如果检索不到文章或者有多篇文章链接整理写入了库,给我做一个汇报。所以我又添加了一个[大模型]节点,专门整理汇报。

都完成之后,点击试运行,测试结果正常,即可点击右上角发布

步骤4:创建智能体

完成上述步骤2和步骤3的操作,即对应完成了下图中标绿的部分。

接下来我们要完成剩余蓝色的任务,这里返回工作空间,再创建一个智能体,完成所有工作流的串联,还有定时任务。

1.在技能栏中添加获取当前时间的插件;

2.在工作流中添加步骤2、步骤3中的工作流;

3.在触发器中新建一个时间触发任务,设定时间触发工作流(对应步骤3中的工作流);

4.在最左侧的人设与恢复逻辑中,写明什么情况下调用对应的工作流;

5.完成全部配置后,再右侧进行测试;

6.确认无误后点击右上角发布;

三、经验笔记

1.资料来源有局限性

如微信公众号生态的文章池,目前好像并没有可以实现自动化获取目标公众号(这里指的是非自己的)的内容。手动输入公众号链接时,实际应用过程有概率链接解析会失败。(估计是微信做的一些限制)

2.Token消耗量较大

因为涉及到了从网站爬取热门文章,目前扣子插件库中的插件,如文中我引用的都会爬下好几十条(这个是现成插件写死的,不支持调整),这里消耗Token就会比较大了,所以在操作时候要注意。特别是免费版,很可能测试阶段资源就已经耗尽了。

3.人并不能完全偷懒

即使AI可以自动检索录入资料,但这不意味着人可以完全不主动检索内容学习记录了,如果你不去学习,那AI整理的资料只是躺在那里吃灰,并不会转化为对你有用的价值。同时,即使你可以写好检索筛选查录的规则,但是AI不能完全判断筛选出哪些是对你有用的。不要自己给给自己自建信息茧房。

如果每天设置了资料检索写入,可能一段时间后表格的内容就会很多了,这时候调用知识库的耗时就会比较多了。所以还是得人工及时阅读,并且定期对于一些内容再做归纳整理(当然这里再重新设计工作流处理也是可以)。

本文由 @笛仁杰 原创发布于人人都是产品经理。

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多