分享

智源黄铁军:大模型智能涌现令人兴奋,没有绝对壁垒,成败关键在生态

 liuaqbb 2023-06-01 发布于北京

中国经济周刊-经济网讯 (记者 孙冰) 5月28日,在2023中关村论坛·人工智能大模型发展论坛上,科技部新一代人工智能发展研究中心正式发布了《中国人工智能大模型地图研究报告》。

文章图片1

黄铁军出席2023中关村论坛(主办方供图)

报告显示,中国研发的大模型数量排名全球第二,仅次于美国,目前中国10亿参数规模以上的大模型已发布79个。而从大模型区域分布来看,中国已有14个省市/地区在开展大模型研发,其中,北京、广东、浙江、上海处于第一梯队,数量最多的北京有38个大模型,第二位的广东有20个。

实际上,在整个2023中关村论坛上,对人工智能讨论和应用都是最受关注的焦点之一,而大模型更是堪称“科技顶流”。因此,我们采访北京智源人工智能研究院院长黄铁军教授,请他解读一下大模型技术和中国大模型的发展。

“智能涌现”令人兴奋,AI能力开始不可预测

黄铁军在接受《中国经济周刊》采访时表示,这一波人工智能浪潮的核心任务就是训练模型,所谓模型,在人工智能领域的意思很明确,就是一个神经网络,而神经网络也没有什么特别的地方,我们人脑就是个神经网络。

“但人脑是一个很庞大的神经网络,大约有800多亿个神经元通过100万亿个神经突触进行连接,所以人脑的能力非常强。对比一下,最接近人类的猩猩,其脑部神经元的数量和连接的数量差不多是人脑的1/3,猴子是人类的1/10,而一条虫子大概有300多个神经元,但其实也可以有很多生命活动了。”黄铁军解释说。

当然,目前人工智能模型的神经网络比人脑要简单很多。但是,随着数据规模的增长和算力的增加,模型的参数量也在不断增加,能力也就不断随之提高,于是就有了“大模型”,即参数量巨大的神经网络,当然其智能程度就更高。

“大模型之所以现在如此受关注,是因为当人工智能的参数量达到了百亿级别之后,出现了拐点或者说突变,人工智能的能力开始不可预测了,就是所谓的'智能涌现’现象,人工智能一些没有被预期到的能力开始出现,这种不可预知让大家都很兴奋。”黄铁军表示。

文章图片2

黄铁军接受采访(孙冰摄)

至于大模型何时会影响到普通人的生活?黄铁军表示,其实已经在发生了。比如现在人工智能已经在替代人类的某些工作,尤其是不具备原创性的部分。

以绘画为例,黄铁军认为,像毕加索、齐白石这种开创性的创作,人工智能还无法替代,但如果只是模仿和组合之前的创作,那人工智能肯定是效率更高的。再比如像爱因斯坦、牛顿这种原创性的理论创新,人工智能也无法做到,但是如果是常规编程和做数学题,那人工智能确实可以做得更好。

但黄铁军强调,AI和人类之间并不是简单替代,而是需要合作,“比如,一个企业原来需要1000名程序员,但接入了AI大模型能力之后,可能只需要几十个就够了,通过人和AI的合作来获得更高的效率和产生更好的效果。”

而且黄铁军认为,这种影响力会很快传递到教育领域。

“现在很多学生有疑问,不是先问老师,而是先问AI,因为AI掌握的知识和信息可能更全面、更丰富,然后自己根据AI给出的资料就可以学习了。这个会是非常大的冲击,未来教师在学生的成长过程中到底发挥什么作用?扮演什么角色? AI在不停学习,人自然也是要不停学习,教育肯定是会长期存在下去的,只不过我们教育的目的是什么?教育的方式是什么?都需要重新思考。”黄铁军说。

更为“可怕”的是,我们常说:读书破万卷,下笔如有神。“一个人一生能读完一万本书已经非常厉害了,但AI一天就能读100万本书,而全人类共有书籍约1亿部,AI再读3年左右就全读完了,那AI的能力提升速度可想而知,和人类完全不在一个尺度上。”黄铁军说。

中国大模型“狂飙”,未来比拼成本和效率,竞争应用和生态

聚焦到中国,黄铁军对中国在大模型领域的发展充满信心。他表示,大模型最终会成为未来社会的一种新型基础设施,其提供“智力”能力,输送给千行百业和千家万户。因此,人工智能进入大模型时代之后,会形成一个体系化的产业生态。简单来说,就像电力时代的电网一样,千行百业、千家万户都在用电,但并不是自己发电,而是有专门的发电厂,发电方式也是多种多样的,如煤电、火电、风电、核电……也有企业去生产各种各样的电器。

“有了大模型就像人类学会发电了,目前可能是一种技术路径走通了,但后续一定还会有各种各样'发电手段’不断演进迭代,不断降本增效。这意味着,就像不会有国家或企业垄断了发电一样,大模型也没有绝对壁垒和门槛,大家比拼的是成本和效率,竞争的是应用和生态。”黄铁军表示。

黄铁军还表示,北京在人工智能领域的资源是非常丰富和全面的,从研发到企业,从应用到生态,北京发展人工智能产业的资源要素是独一无二和领先的。

但也有一些现象需要格外关注。大模型火了之后,还是出现了一哄而上、同质化竞争加剧的现象。“数据就是这些数据,算力也就这么多,如果大家都去训练模型,一定很多工作是重复的,这其实也消耗了大量社会资源,也不利于大模型生态的发展。”黄铁军说。

“如果类比PC互联网时代和移动互联网时代,全球范围内的大模型底层平台很有可能不会超过三个。就像移动互联网初期也曾有很多操作系统,但最后只剩下的iOS和安卓。很多企业想要成为第三个,投入巨大但最终都铩羽而归。”黄铁军说。

黄铁军认为,中国甚至全世界大模型的运营体系都会是屈指可数的,虽然还不能预判是几个,但肯定不可能是十几个或几十个,根本没有市场可能性。“更多的企业参与进来,不是运营平台,而是做应用。类似于苹果生态和安卓生态,会生发出很多应用。”他说。

因此,黄铁军建议,一方面要依靠“市场的手”,让市场的“大浪淘沙”发挥主要作用;但同时也需要“政策的手”予以引导和调节,推动、鼓励和统筹产学研进行合作,共建大模型的产业生态。

一审:郑扬波 二审:崔晓萌 三审:周琦

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多