搜索

分享

QQ空间 QQ好友新浪微博微信

DeepSeek接入个人知识库，最新软件安装包发布！

今生再约 2025-05-06

展开全文

你好，我是郭震

咱们每个人电脑上都有很多文件，随着AI大模型技术发展，高效检索个人知识库，然后叫大模型帮我们分析，是一个高效提升工作效率的方法。

在过去二个月，我和一位小伙伴，一起攻坚克难，实现了上面的大模型接入个人知识库功能，又被称为RAG（Retrieval-Augmented Generation）。

为了好记忆，我们把软件命名为：DeepSeekMine.

这篇文章我将解答大家在使用DeepSeekMine-V6过程中普遍关心的一些问题，并且深入介绍软件背后的算法内核和技术原理，对这些感兴趣的可以看看。

1 DeepSeekMine使用技巧一

个人知识文档是有分类的，比如生活类，工作类，理财类，体育类，新闻，娱乐类等等。基于这个特点，我们在开发DeepSeekMine时，算法就考虑了此维度，加速大模型回答速度同时，还提升RAG精度。

在界面中表现如下，大家可以分门别类，创建多个分类卡片，如下一共创建了4类：

所以大家在使用DeepSeekMine时，非常建议大家新建这样多个卡片，分门别类上传自己的个人文件，这是第一个使用技巧。

2 DeepSeekMine使用技巧二

本地跑大模型还是比较消耗机器，再加上RAG功能，就会更加消耗电脑资源，其他知识库，如cherry, anythingllm等，回答延时就会比较长，我用过，有时一次回答延时竟有2分钟，所以我们设计DeepSeekMine时，就想解决此问题，到V6版本，配置DeepSeek-R1:1.5b回答，能做到1秒钟回复。

通过下面的GIF动画，大家可以验证下回复速度是不是这样，GIF无任何加速，全部保持原始速度。我的测试机器是m1-pro, 16G内存，没有GPU显卡。限于公众号内帧数限制，只能截取前几帧：

如何做到在本地算力下秒级回复的，DeepSeekMine算法是混合RAG算法，利用关键词检索和语义向量结合，高效做到RAG响应。设计的混合RAG算法，从业务角度看，算法主线有两条，文档上传处理，用户查询处理。

文档上传处理的算法流程如下图所示，包括用户上传单个或多个文件 → 知识库文件智能分类 → 后台多线程并发处理 → 线程1/线程2/线程3/线程N → 智能文档切片 → 中文文档进行分词 → 去除停用词 → 微服务异步计算嵌入向量 → 写入Meilisearch：

用户查询处理的算法流程如下所示，包括用户输入查询问题 → 中文查询进行分词 → 计算查询嵌入向量 → 领域语义匹配 → 关键词两轮筛选+BM25算法 → 查询与向量关系矩阵优化算法 → 定制rerank算法：

所以基于以上算法设计，大家在使用DeepSeekMine时，提问的问题中尽量包括一些准确的关键词，然后组合起来提问它，这是第二个使用技巧。

举个例子，比如这样提问：Janus-Pro能做什么事情，Janus-Pro就是最重要的一个关键词，大家看看下面的回复，哪怕使用1.5b这样的小模型，回答总结的都很精准，如果配置更好的模型，那就彻底起飞了：

3 DeepSeekMine使用技巧三

一次会话包括多轮用户和助手的来回交流，DeepSeekMine会把历史交流和命中的知识库文档一起注入到大模型，然后让大模型学习和总结，这里利用了大模型的few-shots learner特性。

但是很多大模型应用这样设计都会有一个问题，如果某次或某些会话它回答的不够精准，就会干扰接下来的回答质量。

基于此，一旦中间回答出现漂移问题，可以点击「清空历史」按键，重新开始提问，这是第三个使用技巧：

为了大幅减少漂移问题，DeepSeekMine软件也提供了不同大模型配置功能，这也是大家普遍关心的一个问题，在这里详细介绍下。

比如ollama本地安装的不同大模型，只需要1.5b改为8b，自动将会启用8b做回答：

此外还支持云端API配置，如下所示配置也比较方便：

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：今生再约 > 《办公》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

今生再约

关注对话

TA的最新馆藏

一个主机如何接两个显示器？双屏分屏设置全攻略
用AI写作，一定要自己写初稿！耶稣来了也不改我说的！
DeepSeek接入个人知识库，最新软件安装包发布！
18-30岁，须培养的5个成长底层能力
DeepSeek分段式写材料五步法（笔杆子专用）
篆书《峄山碑》控笔训练分析图

喜欢该文的人也喜欢更多

热门阅读换一换