分享

何所思 | 大模型下半场的3大趋势

 liuaqbb 2025-03-08

202412月中到元旦前后,我几次公开演讲,以及内部年度“风向”报告会,都认为大模型的上半场即将结束。

20253月初,完全可以肯定,以预训练大语言模型为典型标志的大模型上半场竞赛已经结束,现在已经进入了大模型的下半场,进入了大模型2.0的新时期和新赛道。

  • 时间轴看,始于2018年的“大炼模型”、“百模大战”和无用论等,已经差不多7年了,需要有也该明确的说法了。我多年前发明的“7年之痒”的理论,再次得到验证。

  • 空间轴看,一方面大模型的价值已经得到证实,另一方面大模型的主流技术路线(预训练大语言模型)遇到天花板了:大投入不再大产出。到2025年的现在,全球头部AI企业的大训练投入,几乎也都未取得预期的能力提升。

之前AI界奉为圭臬的Scaling law信仰,仅仅坚持了4-5年时间,就至少在预训练大语言模型的主赛道上,遇到障碍了。

    以开源方式出现的低成本的DeepSeek是个里程碑,打消了2025年之前,业界对大模型可持续性和可普及性等的几大担忧。

    1. 成本高昂,商业上难以持续;

    2. 资源集中,科技寡头垄断了高端算力市场;

    3. 闭源主导,技术门槛过高,模型不透明、不可控和不安全。

    DeepSeek之前,AI有可能会发展成为小众的高端市场,富人的游戏,寡头的控制。DeepSeek之后,AI属于全人类!

    大模型的上半场以预训练大语言模型为标志,下半场要换的新赛场可能有三大方向:

    一是边界赛道,继续探索大模型的能力边界,比如推理、世界模型、多模态学习、持续学习与自适应、新型架构与算法、个性化与定制化等。

    二是优化赛道,转向追求实用性、优化和普惠,比如模型优化与压缩、小模型、可解释性与透明度、伦理与安全、开源与协作、工程化等。

    三是场景赛道,重点是场景化的应用,比如AI+Agent、具身等。

      本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
      转藏 分享 献花(0

      0条评论

      发表

      请遵守用户 评论公约

      类似文章 更多