DeepSeek接入这个智能体后，能够吞下整本书了

pharl 2025-05-02

展开全文

你好，我是郭震

最近收到读者后台留言，他上传了一本几百页的电子书，问DeepSeek，但是显示只能处理前30% ，问我如何解决，截图如下所示：

今天这篇文章来探讨大家普遍遇到的这个问题，经过我至少二十次的实验，终于摸索出了一个不错的解决方法，本文提供完整复现教程，感兴趣的可以看看。

此解决方法，具有如下三个特点：

1）本地运行

2）完全免费，不用花一分钱

3）不需要自己写一行代码，对不会编程的朋友也很友好。

接下来分享这个智能体，大家能直接在自己电脑上也能用上，更好的帮助大家提升工作和学习效率。

1 效果展示

基于DeepSeek-R1，下面是做的这个智能体，起名为：吞书智能体，如下所示：

使用Sutton编写的《强化学习》这本书，作为测试，如下所示：

全书 338页：

导入吞书智能体后，处理过程，如下GIF图所示，受限于公众号GIF图帧数限制，一个GIF只能展示几帧：

第二个GIF展示了，吞书智能体理解了第一章后，自动开始处理第二章：

吞书智能体前后处理大概10分钟，便能精细化的理解全书15个章节，自动生成如下总结html网页，如下是前几章的章节摘要总结GIF展示：

「吞书智能体」会自动生成十五个章节总结txt文件，如下所示：

接下来跟大家介绍「吞书智能体」详细制作步骤，大家根据我的步骤就可以在自己的电脑，完整复现出这个智能体。

2 吞书智能体-制作步骤

在制作吞书智能体时，我尝试过Vscode, Claude, Trae, 发现Trae是对MCP智能体支持最好、且对智能体编排做了深度优化，字节开发的，免费使用：

第一步，获取软件并安装在本地，安装步骤很简单，都是下一步，不再赘述。

内置模型，如Doubao-1.5-pro, DeepSeek-R1等，可以免费使用：

第二步，本地电脑新建一个文件夹，直接使用Trae打开此文件夹，然后右下角选择DeepSeek-R1，再点击@智能体：

点击后再点击「创建智能体」：

弹出下面界面，依次按照1,2,3顺序，前两项如下填写，其中2是最关键的一项，这些提示词是智能体执行编排流程，直接关系到智能体是否精准工作：

完整提示词我放在下面文本框里，这个提示词我迭代了不下20次，现在分享给大家:

# PDF章节提取与总结自动化处理## 初始设置1. 使用PDF阅读器工具读取目标PDF文件的目录索引（通常位于前10页）## 目录索引处理2. 使用文件系统工具创建book_index.txt文件3. 将每章的【起始页码,终止页码】信息提取并按格式写入book_index.txt - 格式示例：第1章,10,25## 章节处理循环4. 从第1章开始，执行以下步骤直到所有章节处理完毕： a. 读取book_index.txt获取当前章节[i]的起始页码和终止页码 b. 使用PDF阅读器工具，传入页码范围参数读取章节[i]的完整内容 c. 分析章节[i]内容，提取关键要点并按条目列出（确保不遗漏重要信息） d. 使用文件系统工具创建chapter[i]_summary.txt文件 e. 将章节[i]的要点总结写入chapter[i]_summary.txt f. 明确输出处理进度：'已完成第[i]章处理，准备处理第[i+1]章'## 汇总与展示5. 检查是否所有章节均已处理完毕6. 按章节顺序读取并合并所有chapter[i]_summary.txt文件内容7. 将合并内容写入summary_results.txt8. 将summary_results.txt内容转换为响应式HTML网页 - 实现精美布局与样式 - 添加目录导航功能 - 确保在移动设备上有良好显示效果

本次主要用到pdf-reader，点击如下图所示的「添加」按钮：这进入下面界面，点击「手动配置」：

弹出下面界面，大家把下面JSON串直接复制过来就行：

JSON串文字版：

{  'mcpServers': {    'pdf-reader': {      'command': '/Users/zhenguo/anaconda3/envs/mcp/bin/python',      'args': [        '/Users/zhenguo/Documents/code/mcp-pdf-reader/pdf_server.py'      ]    }  }}