这阵子在整理各种数据文件,发现这些年写的文字材料还真不少,统计出来各种乱七八糟的文章合集 3700 多篇。突然就有了个大胆的想法:是否可以基于当前火热的各种大模型,结合这些文字材料构建本地知识库? 各种搜索后发现,还真有不少此类应用。就目前个人了解,此类技术主要有两个方向:
前两天开源的 LLAMA 2 虽然评价比较高,不过当前对中文的支持极差。Chat-GLM 2 的中文支持较好,不过个人感觉模型能力稍弱(可能是 ChatGPT 用的多,和 ChatGPT 比起来比较弱),不过前期可以搭一个框架,后期慢慢训练。 之前利用 langchain+ChatGLM-6 B,利用部分自己翻译的 Fluent 文档搭建了个极小型的个人知识库,感觉还是蛮好玩儿的,虽然模型性能表现差了些(额,有时候会胡言乱语)。 过阵子写篇训练过程总结文章,有兴趣的道友可以一起玩儿。 (完) |
|