分享

Deepseek V3到底颠覆了什么

 若悟369 2025-01-05 发布于安徽

Deepseek V3的发布为什么震动业界,他到底颠覆了什么呢,你说他完全超越了openAI?那到没有?

另外别的大模型发布,一般都会伴随着相关概念股的大涨,比如算力股,那为什么Deepseek V3发布,概念股跌了呢?

Deepseek V3算是巅峰了我们对大模型与算力的关系的传统认知,在他发布之前,我们一般会认为,越厉害的大模型,其训练过程所需要的算力是约大的,所以一直以来大家都在比拼算力,比谁的卡多。

Deepseek V3到底颠覆了什么

但是,Deepseek颠覆了这一传统认知,比如,Meta的Llama-3.1的训练投资可能超过了5亿美元,但是训练DeepseekV3只用了不到600万美元,但是DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与世界顶尖的闭源模型GPT-4o以及Anthropic的Claude-3.5-Sonnet不相上下

Deepseek V3到底颠覆了什么

所以对于大模型而言,算力可能并非是绝对瓶颈了。

而且Deepseek V3这么一个比肩闭源的模型,居然开源了。

同时Deepseek V3的API价格也是便宜的离谱,就连大模型也开始卷价格了。不过这也不用奇怪,幻方量化是干嘛的啊?人家是:使用 AI 进行投资的对冲基金。股市才是提款机,大模型只是从股市提款的工具而已。

后续我再分享部署体验的效果。

Deepseek V3到底颠覆了什么

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多