|
在2024年12月中到元旦前后,我几次公开演讲,以及内部年度“风向”报告会,都认为大模型的上半场即将结束。 到2025年3月初,完全可以肯定,以预训练大语言模型为典型标志的大模型上半场竞赛已经结束,现在已经进入了大模型的下半场,进入了大模型2.0的新时期和新赛道。
之前AI界奉为圭臬的Scaling law信仰,仅仅坚持了4-5年时间,就至少在预训练大语言模型的主赛道上,遇到障碍了。 以开源方式出现的低成本的DeepSeek是个里程碑,打消了2025年之前,业界对大模型可持续性和可普及性等的几大担忧。
DeepSeek之前,AI有可能会发展成为小众的高端市场,富人的游戏,寡头的控制。DeepSeek之后,AI属于全人类! 大模型的上半场以预训练大语言模型为标志,下半场要换的新赛场可能有三大方向: 一是边界赛道,继续探索大模型的能力边界,比如推理、世界模型、多模态学习、持续学习与自适应、新型架构与算法、个性化与定制化等。 二是优化赛道,转向追求实用性、优化和普惠,比如模型优化与压缩、小模型、可解释性与透明度、伦理与安全、开源与协作、工程化等。 三是场景赛道,重点是场景化的应用,比如AI+、Agent、具身等。 |
|
|