DeepSeek肯定是优秀的,在大语言模型领域在全球是极其优秀的,但是DeepSeek和豆包在模型结构、算力需求、推理效率等参数方面都是不同的,DeepSeek属于大语言模型,豆包属于多模态大模型,在大语言模型基础上,融合了图片、音频、视频等多种模态。 DeepSeek V3暂无多模态生成能力。“算法优化—成本下降—渗透率提升—强化训推投入”正向反馈持续。算法优化后,相同的训练算力投入,能进行更多模型开发尝试,加速模型能力的提升,带动应用爆发,推理算力爆发,模型厂商的ROI提升,会维持算力投入强度。 DeepSeek V3 671B,使用2048块H800训练2个月。2048块H800并非全部训练算力投入,这里不包括DeepSeek R1模型(对标OpenAI o1)生成的高质量数据消耗的算力,不包括模型架构的探索调试阶段消耗的算力。 如果二级市场看,DeepSeek应该是周末爆炸吹类型题材,而且DeepSeek周末的小表格很多都是瞎关联的,这个公司都没融资过,哪来的参股受益公司。而且他也是囤卡跑出来的模型,其他的国内公司都没两张卡,跑啥跑啊。 其实两者根本没有对比性,周末太热了,所以讲讲。周末吹的太降智了,周末吹的DeepSeek感觉都问鼎全球的,感觉吹的全球其他的AI路径都是不如他。 这里依然看好豆包是年度级别题材,依然看好春节期间豆包热度最好。 短期从跨春节角度,豆包依然是最优解啊。不知道大家如何,反正一月拥抱豆包持股还是很舒服的。 讲讲年后吧,历年春节一到两个月在A股都是好时光。积极看多,持仓50% 过年。明天春节前最后一个交易日,再干一天。 |
|