分享

DeepSeek和豆包根本不是一个维度产品

 東泰山人 2025-01-30

DeepSeek肯定是优秀的,在大语言模型领域在全球是极其优秀的,但是DeepSeek和豆包在模型结构、算力需求、推理效率等参数方面都是不同的,DeepSeek属于大语言模型,豆包属于多模态大模型,在大语言模型基础上,融合了图片、音频、视频等多种模态。

DeepSeek V3暂无多模态生成能力。“算法优化—成本下降—渗透率提升—强化训推投入”正向反馈持续。算法优化后,相同的训练算力投入,能进行更多模型开发尝试,加速模型能力的提升,带动应用爆发,推理算力爆发,模型厂商的ROI提升,会维持算力投入强度。


算力需求方面,DeepSeek v3为例,通过减少激活参数、降低精度(从16位变为8位)等优化手段减少算力消耗;而R1版本在v3基础上投入大量算力增强推理能力。豆包:涉及多模态训练和应用,对算力底座要求更高,不仅要支持大规模训练任务,还要确保端侧应用的实时性和高效性。

DeepSeek V3 671B,使用2048块H800训练2个月。2048块H800并非全部训练算力投入,这里不包括DeepSeek R1模型(对标OpenAI o1)生成的高质量数据消耗的算力,不包括模型架构的探索调试阶段消耗的算力。


推理效率方面,DeepSeek-R1通过强化学习飞轮效应,显著提升了推理效率。豆包采用稀疏MoE架构,实现了训练和推理效率的双重优化。

使用成本方面,DeepSeek:DeepSeek-R1的API使用成本为100万tokens输出需16元。豆包1.5Pro处理100万tokens仅需0.8元,使用成本极低。

开源特性方面,DeepSeek-R1开源了大量模型和训练细节,为开发者提供了更多创新空间。豆包未明确开源,但自主数据生产体系和高效模型结构获得广泛认可。

如果二级市场看,DeepSeek应该是周末爆炸吹类型题材,而且DeepSeek周末的小表格很多都是瞎关联的,这个公司都没融资过,哪来的参股受益公司。而且他也是囤卡跑出来的模型,其他的国内公司都没两张卡,跑啥跑啊。

其实两者根本没有对比性,周末太热了,所以讲讲。周末吹的太降智了,周末吹的DeepSeek感觉都问鼎全球的,感觉吹的全球其他的AI路径都是不如他。

这里依然看好豆包是年度级别题材,依然看好春节期间豆包热度最好。

短期从跨春节角度,豆包依然是最优解啊。不知道大家如何,反正一月拥抱豆包持股还是很舒服的。

讲讲年后吧,历年春节一到两个月在A股都是好时光。积极看多,持仓50% 过年。明天春节前最后一个交易日,再干一天。

【声明】本文所有内容均不构成任何投资建议。文章内容仅是个人笔记和观点,不具任任  何指导作用,据此操作,风险自负。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多