DeepSeek和豆包根本不是一个维度产品

東泰山人 2025-01-30

展开全文

DeepSeek肯定是优秀的，在大语言模型领域在全球是极其优秀的，但是DeepSeek和豆包在模型结构、算力需求、推理效率等参数方面都是不同的，DeepSeek属于大语言模型，豆包属于多模态大模型，在大语言模型基础上，融合了图片、音频、视频等多种模态。

DeepSeek V3暂无多模态生成能力。“算法优化—成本下降—渗透率提升—强化训推投入”正向反馈持续。算法优化后，相同的训练算力投入，能进行更多模型开发尝试，加速模型能力的提升，带动应用爆发，推理算力爆发，模型厂商的ROI提升，会维持算力投入强度。

算力需求方面，DeepSeek v3为例，通过减少激活参数、降低精度（从16位变为8位）等优化手段减少算力消耗；而R1版本在v3基础上投入大量算力增强推理能力。豆包：涉及多模态训练和应用，对算力底座要求更高，不仅要支持大规模训练任务，还要确保端侧应用的实时性和高效性。

DeepSeek V3 671B，使用2048块H800训练2个月。2048块H800并非全部训练算力投入，这里不包括DeepSeek R1模型（对标OpenAI o1）生成的高质量数据消耗的算力，不包括模型架构的探索调试阶段消耗的算力。

推理效率方面，DeepSeek-R1通过强化学习飞轮效应，显著提升了推理效率。豆包采用稀疏MoE架构，实现了训练和推理效率的双重优化。

使用成本方面，DeepSeek：DeepSeek-R1的API使用成本为100万tokens输出需16元。豆包1.5Pro处理100万tokens仅需0.8元，使用成本极低。

开源特性方面，DeepSeek-R1开源了大量模型和训练细节，为开发者提供了更多创新空间。豆包未明确开源，但自主数据生产体系和高效模型结构获得广泛认可。

如果二级市场看，DeepSeek应该是周末爆炸吹类型题材，而且DeepSeek周末的小表格很多都是瞎关联的，这个公司都没融资过，哪来的参股受益公司。而且他也是囤卡跑出来的模型，其他的国内公司都没两张卡，跑啥跑啊。

其实两者根本没有对比性，周末太热了，所以讲讲。周末吹的太降智了，周末吹的DeepSeek感觉都问鼎全球的，感觉吹的全球其他的AI路径都是不如他。

这里依然看好豆包是年度级别题材，依然看好春节期间豆包热度最好。

短期从跨春节角度，豆包依然是最优解啊。不知道大家如何，反正一月拥抱豆包持股还是很舒服的。

讲讲年后吧，历年春节一到两个月在A股都是好时光。积极看多，持仓50% 过年。明天春节前最后一个交易日，再干一天。

【声明】本文所有内容均不构成任何投资建议。文章内容仅是个人笔记和观点，不具任任何指导作用，据此操作，风险自负。