Deepseek V3的发布为什么震动业界,他到底颠覆了什么呢,你说他完全超越了openAI?那到没有? 另外别的大模型发布,一般都会伴随着相关概念股的大涨,比如算力股,那为什么Deepseek V3发布,概念股跌了呢? Deepseek V3算是巅峰了我们对大模型与算力的关系的传统认知,在他发布之前,我们一般会认为,越厉害的大模型,其训练过程所需要的算力是约大的,所以一直以来大家都在比拼算力,比谁的卡多。 ![]() 但是,Deepseek颠覆了这一传统认知,比如,Meta的Llama-3.1的训练投资可能超过了5亿美元,但是训练DeepseekV3只用了不到600万美元,但是DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与世界顶尖的闭源模型GPT-4o以及Anthropic的Claude-3.5-Sonnet不相上下。 ![]() 所以对于大模型而言,算力可能并非是绝对瓶颈了。 而且Deepseek V3这么一个比肩闭源的模型,居然开源了。 同时Deepseek V3的API价格也是便宜的离谱,就连大模型也开始卷价格了。不过这也不用奇怪,幻方量化是干嘛的啊?人家是:使用 AI 进行投资的对冲基金。股市才是提款机,大模型只是从股市提款的工具而已。 后续我再分享部署体验的效果。 ![]() |
|