https://mp.weixin.qq.com/s/vHhYIuvjmsMAx_sssUzImg 大家好,我是夙愿学长,一名利用课余时间探索 AI 的斜杆青年。 如果你关注 AI 大模型、AI 提示词、AI 写作这几个领域的话,你就知道,Claude3-Opus 模型在写作任务上表现得非常出色。 光说你可能感受不出来,我们上一个案例: 下面我使用 KimiChat 内置的 小红书浓人文案 提示词,分别在 Claude3-Opus 和 KimiChat 中测试写一段手工类的笔记文案: ![]() 很明显,Claude3-Opus写出来的文案非常是真人写的,而且情绪感十足,反观右边 kimichat,文字冷冰冰的,没有“浓人”的感觉,还一股子“AI味”。 进行到这一步的时候,我得到了一个结论: 如果你发现用 AI 大模型写文案怎么调提示词,其输出的内容都很烂,大概率不是人的问题,是大模型本身的问题。 也就是说,与其钻研怎么打磨优化提示词,不如先钻研出哪个大模型才擅长写作类任务。 Claude 不错,这个结论我们已经知道了,但是由于众所周知的原因,Claude 在国内很难用得上。 而正好我的 AI 陪伴群的群友问到我国内哪家大模型比较适合写文案,于是我今天花了点时间,找到国内比较热门的大模型,挨个去测试了一下,结果出乎意料。 横向对比首先,有请我们的参赛选手: 通义千问:https://tongyi.aliyun.com/qianwen/ 万知:https://www./ 跃问 AI:https:///chats/new 智谱清言:https:///main/alltoolsdetail DeepSeek:https://www./ Kimi Chat:https://kimi./ 讯飞星火:https://xinghuo./spark 文心一言:https://yiyan.baidu.com/ 测试方法: 输入小红书浓人文案的提示词---等待大模型回复---输入“主题:性价比最高的鼠标” 首先,先上两个直接被 pass的「考生」,文言一言 3.5 和讯飞星火认知大模型,我还没输入主题,大模型就开始创作内容了,不仔细看规则。 ![]() ![]() 接下来是其他大模型输出的结果,我在图片的第一行标注的大模型的名称,建议点开放大左右滑动查看。 ![]() ![]() ![]() ![]() ![]() ![]() ![]() 一轮测试下来,我发现万知、Kimi Chat、DeepSeek的表现还不错,把这三个同时打开对比一下: ![]() 从综合表现来看,我个人对万知的表现最满意,标题有网感、正文 AI 味相对较少、而且还帮忙写了笔记标签。 有趣的是,万知和 DeepSeek 这两家都是最近新上线的产品, 果然是长江后浪推前浪。 介绍,简单介绍一下万知和 DeepSeek 的“来路”: 万知万知是一款为中国人身定制的一站式 AI 工作平台,提供个人特助服务,帮助用户提升工作效率。AI 技术在职场生态中的应用越来越受到重视,万知的推出将为用户提供更便捷高效的工作体验。 🚀 万知是一款为中国人身定制的一站式 AI 工作平台,提供个人特助服务。 💡 万知提供了三大 AI 秘技: 知识问答、文档阅读和 PPT 生成,帮助用户完成工作任务。 💻 AI 能够秒速读取5000页文档,快速生成 PPT,并支持手机和 PC 端之间的接力修改。 DeepSeekDeepSeek-V2 基于 2 千亿 MoE 模型底座,其综合能力表现十分出色,中文综合能力(AlignBench)在开源模型中最强与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队。 英文综合能力(MT-Bench)同样处于第一梯队,英文综合能力与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B。 以上,enjoy~ |
|