浪潮 | 专访智源研究院院长黄铁军：AI终会取代人脑？

wps0321 2023-06-17 发布于河南

展开全文

19:32

32:36

自动播放

凤凰网科技｜出品

主持｜刘毓坤

作者｜蒋浇

编辑｜张涛

核心观点：

1.大模型“智能涌现”要有两个必备条件：一是大模型规模要越来越大；二是需要生成式的模型，生成式模型具有产生无法预测可能性的能力，这种能力是以往不被强调和关注的。

2. 将来大家是在（大模型）服务云上直接获得智力，成本很低。就像买一度电只用花2角钱，现在（大模型）生态还在形成的初期，还不是体系化的生态。

3.万亿模型已经算现在最大参数量的网络了，但万亿跟人脑比，那还是“小巫见大巫”，我们人脑是百万亿连接，最大模型也只有（人脑）1%。

4.从人工智能的发展来说，脑机接口我不认为它是将来一个重要的方面。人工智能是高速系统，它的物质基础是芯片、光电这样的技术。而人是一个基于有机化合物的慢速系统，这俩东西如果要接在一起的话，绝对是不匹配的。

浪潮 | 专访智源研究院院长黄铁军：AI终会取代人脑？

正文：

“AI黄埔军校”，圈外人九成没听过，圈内人尽皆知。

最近，2023年北京智源大会在京成功举办，这可以说是本年度国内规格最高的人工智能盛会。图灵奖得主Geoffrey Hinton、Yann LeCun（杨立昆）、Joseph Sifakis、姚期智、张钹、张宏江、郑南宁等院士共全球200多名全球顶尖人工智能专家齐聚一堂，共话AI。

而刷屏网络的OpenAI创始人Sam Altman中国首讲，让大会彻底出圈。会后几天，许多企业人士和圈外媒体四处打探，主办方北京智源人工智能研究院（以下简称“智源研究院”）是什么来头，为何拥有如此大的号召力？

尽管低调，但这家年轻的机构却是国内大模型的先行者之一。

2020年10月，智源研究院开启超大规模预训练模型“悟道”项目进行训练；2021年3月，“悟道1.0”系列发布，智源对人工智能转入“炼大模型”新阶段的研判，也让“大模型”这一概念进入公众视野；21年6月，悟道2.0发布，该系列模型最大参数达到1.75万亿，是GTP-3的十倍。

本次大会，智源研究院院长黄铁军发布了“悟道3.0”系列大模型及算法，这是目前我国市场上为数不多的可商用开源大语言模型之一。

智源研究院无疑是开源的拥趸者，黄铁军在做客凤凰网科技《浪潮》栏目时表示：“我们做技术的，更希望大家一起来构建一个生态，大家分工不同，可以相互合作。”这恰恰是智源研究院打造悟道系列大模型的愿景，即大模型将是未来AI平台的起点，成为类似“电”的基础设施。

就当前颇具争议的人工智能领域话题，黄铁军与我们畅聊了两个小时，他详细地解读了大模型技术以及国内大模型的发展。他表示，大模型“智能涌现”要有两个必备条件：一是大模型规模要越来越大；二是需要生成式的模型，生成式模型具有产生无法预测可能性的能力，这是人工智能以往不被强调和关注的。

当下，大模型比武成为大厂们争夺声量的方式。黄铁军认为，生成式AI有无限可能，不要用绝对的标准评价它，现阶段应该研究怎么去更好的“涌现”，用技术上来推动千行百业发展。

作为一名类脑人工智能权威科学家，黄铁军谈及“AI是否会替代人脑？”时称，尽管现在大模型参数已经达到万亿规模，但跟人脑比，还是“小巫见大巫”的数量，我们人脑是百万亿连接，也只有人脑的1%，模型还有很大的扩容空间，

但他也认为，“超级人工智能比人类要强、要主导这个世界”是有可能出现的。

（以下为对话实录）

01.大模型“智能涌现”要有两个必备条件

凤凰网科技《浪潮》：黄院长好，您的主要研究方向为视觉信息处理与神经形态计算，也是我国《新一代人工智能发展规划》起草工作的主要参与者之一。那您可以给观众用最简单的语言科普下什么是AI大模型吗？

黄铁军：近年来人工智能发展特别快，大模型可以说最主要、最热门的一个方向。整个人工智能的研究，核心其实就是训练一个模型，那么模型怎么理解呢？

实际上，它是一个人工神经网络。我们人脑其实是一个生物神经网络，人工神经网络是生物神经网络的一个简化。我们刻画一个神经网络的时候，最主要的参数就是它的连接数量，因为神经网络中有神经元，有神经连接的数量。那么我们做一个模型，或者是一个人工神经网络的时候，参数量是相对比较小的，比如说几万、几十万、几百万、几千万、上亿，这就算比较大的了。

但过去五年左右，（人工神经）网络的规模放大得很快，从几亿、几百亿、千亿，到现在万亿的规模。为了描述模型参数不断增大的趋势，我们智源在2021年发布“悟道”模型时，就造了一个中文词叫“大模型”。

凤凰网科技《浪潮》：您刚才说2021年智源就已经提出大模型时代即将要到来，当时是怎样预判到的？

黄铁军：这个道理其实很简单。因为人工智能智能水平的高低，取决于它对这个世界的刻画能力。世界是不断在变化的，有海量的数据来描述这个世界。人工智能模型要有效地表达这个世界，规模就要达到一定的程度，太少的参数是无法表达现实世界的复杂性，所以我们当时就提出了这么一个概念。

大模型本身作为一个产品、一个结果，实际上背后有大量的工作要做，第一个就是数据，没有足够多的数据无法训练出先进的大模型；第二，就是训练本身是需要一个先进的软硬件平台才能实现的，智源这方面也做了很多工作；最重要的是算法，我们智源研究院开展这方面工作比较早，也比较系统，当然我想算法并不是任何一个机构所能包揽的，它一定是产、学、研各方面共同协作的一个结果，所以我们在构造开源开放平台方面做了很多工作，这是我们的一个特点。

凤凰网科技《浪潮》：我们提到AI大模型，一定离不开一个词语就是ChatGPT，ChatGPT 的出现，让许多人觉得人工智能已经具备了“涌现”的能力。我们怎么去理解这个“涌现“？从ChatGPT-3.5再到4，您怎样看待当前AI的智能进化能力？

黄铁军：一方面，大模型规模要越来越大。“大”很重要，对于一个复杂系统，特别是像神经网络这样的复杂系统来说，规模不达到一定程度是无法产生新的“涌现”这种可能性，这是一个基本的条件。但还有另外一个特点，特别像ChatGPT这一类模型，我们必须要强调的就是生成式模型，也就是GPT中“G”的含义。

生成式的模型，与以往的人工智能模型有很大的差别。以前，我们说人工智能系统或者人工智能模型的时候，往往是一种叫判别式思维，比如一个图像识别系统、人脸识别系统、语音识别系统，我们考核它的这个能力，主要用正确不正确来做评判标准。比如通过人脸识别考勤，需要的识别率要很高，这就是叫判别式模型。

生成式模型发生了一个根本性的变化，就是一个人工智能模型要具有产生新可能，甚至于无穷无尽的可能性的能力，这种能力是以前不怎么关注和强调的，可以说是“涌现”的一个前提条件。

当然，涌现什么时候出现，在什么条件下出现，现在应该说还是一个开放问题。事实就是它已经涌现，产生了当初没有预测的能力。但怎么产生更好的涌现，这背后还有很多问题要研究。

02.未来大模型智力服务会像电一样便宜

凤凰网科技《浪潮》：现在可以看到国内外的大模型，在语言理解、文本生成等方面表现都很好，但在真正的产业空间里，大模型规模化、标准化应用还需要一段时间。大模型产业化落地方面，主要会面临哪些困难和挑战？

黄铁军：我认为整个人工智能落地现在才刚刚开始，之前的一些人工智能产品，包括图像识别类的产品，包括自动驾驶里、图形处理里用的一些人工智能技术，已经很多了。但总的来说，更多的是一些专门的应用，或者叫“专用人工智能”。

现在已经过了一个转折点，就是人工智能作为通用技术赋能于千行百业已经发生了。任何一个技术，要向各行各业、千家万户都要服务的话，那还是面临很大挑战的。就像刚才讲的电力、互联网，都有一个发展的、部署的过程，会有一个时段要建基础设施，要跟原有的产业体系进行磨合，去替代原有的一些智能，但是这个趋势显然是大的浪潮。

现在面临的挑战，就是经济社会方方面面如何能够快速适应新技术的冲击，以及跟新技术最终融合后形成一个全新的产业体系。

凤凰网科技《浪潮》：现在各方各面的声音都很多。之前有企业家说10月要赶超GPT，也有企业家表示说赶超的都是吹牛。目前有没有国内外公认的标准，能评价大模型的性能优劣？我们到底如何去评判一个大模型？

黄铁军：首先我们要放弃用绝对的标准进行评价，因为它是生成式的人工智能，它可以产生无穷无尽的可能性，我们不能用一把尺子来完全确定下来哪个分更高一点，不能僵化的去评价大模型。

我们智源研究院在做一个评测体系，这是我们国家新一代人工智能重大科技项目的一个旗舰项目，有一整套的评价体系。其实，我们现在有能力，只要发布一个模型允许访问，允许有API访问，我们马上就可以给出体系化的评价指标。但我们做评价不是从商业上去做，我们更多的是要评价技术。我认为现在用哪个模型，哪种模型更好，可能从商业上看各有各的一些考虑。但我认为，最重要的还是训练模型所用的算法和技术。

凤凰网科技《浪潮》：有观点认为目前有大模型而无生态，您怎么看待？

黄铁军：这种说法其实很有道理，AI生态它是体系化，它是个运营化的生态。

电力时代，那些发电的公司就属于供应端。类比到人工智能领域，大模型本身可以类比为发电机。如果只是一个企业在自己商业范围之内用，那跟当年企业造一个发电机或者买一个发电机，没有什么差别。这不是人工智能大模型时代的主要生态。

它主要的生态就是做模型训练，连续不断地训练，这是一端。另外一端，是各行各业千家万户大家去用这个智力，而不是用模型。大家不会买一个模型拿回家去用的，就像刚才举例子，我们都是用电网的电，没有人去买一个发电机给自己发电。

人工智能大模型时代的基本特点也是一样，将来大家是在智力服务的云上直接获得智力，成本很低，就像我买一度电只用花2角钱。现在生态还在形成的初期，我们今天看到的还不是体系化的生态，生态形成还需要一个过程。

凤凰网科技《浪潮》：现在也有声音说，人工智能最终的战场是生态的战场。

黄铁军：因为我是搞技术的，我更倾向说大家联合去构建这么一个生态，这其中有社会分工，有人研发、有人运营、有人做产品、有人做服务，形成一个千万人相互合作的生态。当然，这里边肯定也有竞争，做同类服务有竞争这很正常。大家不要上来就以垄断的思路想大模型就是“我的”，不是那么回事。

03.ChatGPT训练只用了百分之几的中文数据

凤凰网科技《浪潮》：如何看待对于中国大模型发展，中英文数据的质量差别是比较大的瓶颈？我们如何推进更优质、更安全的中文数据？

黄铁军：ChatGPT当初训练时确实是英文数据多，中文数据少。而且据我们了解，他们也用了智源的中文数据集，但他们用的中文数据只有百分之几，所以它英文表现得比中文好，这也是自然而然的。

数据的分布，决定了大模型智能输出特性的不同。中文数据的建设，对于未来大模型发展来说是特别重要的一项工作。1997年，互联网行业刚刚起步，我发表了《警惕我国成为信息盆地》文章，当时全世界都在发展互联网，如果中文的网页网站少了，那就成为“信息盆地”，低洼的地方。

现在训练大模型面临的问题是一样的。如果未来，我们想中文在全球范围的大模型产业体系里能有它该有的地位，那中文数据建设一定要加强的，不光是数量，还有质量。现在大家已经注意到这个问题，而且一定程度上形成了共识，已经开始行动了。

凤凰网科技《浪潮》：ChatGPT带来了革命，也带来了乱象，您怎么看待这种情况？

黄铁军：目前应该说是人工智能的一个突变性的时刻。无论是从研究人员还是到社会公众，其实大家对这样的一个突变可能还没有做好心理准备，所以可能会有很多社会的这种反应。

凤凰网科技《浪潮》：我们怎么去分辨哪些在炒作大模型，哪些是真正有用的？

黄铁军：“大模型驱动”的时代现在还正在形成中，今天的大模型和未来大模型生态之间我们还要走不短的路。大家都知道， ChatGPT最初的数据库截止到2021年的，所以它知道2021年之前的事情。但2021年的事情就不知道了

今天我们讨论的发布大模型，当发布大模型的时，它就已经是个静止的东西了，静止的东西怎么对未来会产生那么大作用呢？如果说大模型的话，它一定是藏在后面的24×7训练服务一套智力服务体系。今天我们说发布一个大模型或者一个大模型产品，某种意义上只是在证明我能做，或者做的模型好不好，还是一种技术能力的展示，不是大模型服务生态。

04.人工智能发展至今，是否可以替代人脑？

凤凰网科技《浪潮》：您之前的论文中也有提到，人类的神经元是有限的，但可以通过研究去开发出“超级大脑”，那现在大模型的出现，是否意味着我们到了这个阶段呢？

黄铁军：人工智能有很多种技术路线，做神经网络是大家一直在探索研究的。这个过程有波折，有时候大家认为可以不要神经网络，直接用逻辑的方法，还有其他一些方法也可能实现人工智能。但最近，特别是“深度学习”提出以来，应该说用人工神经网络做人工智能，现在成了主要的主流的技术路线。

今天的大模型，包括生成式人工智能都是建立在神经网络基础上。但这样的神经网络和生物神经网络差别还是很大，现在技术手段能实现的还是很粗略、很粗糙的人工神经网络。

我原来讲“超级大脑”，其实涉及两个方面，一是人工神经网络规模上要更大，要接近人类，甚至于比人类要更大，这是一个方向；另外一方向，是从网络信号信息的表达处理机理上也要像生物一样。从规模的角度来说，万亿模型已经算现在最大参数量的网络了。但万亿跟人脑比，那还是“小巫见大巫”，我们人脑是百万亿连接，最大的大模型也只有（人脑）1%，可以说是很小了，后边要扩展的空间很大。

它从信号信息处理机理上跟人脑差别很大，大致来说，现在的人工神经网络相当于一种静态的神经网络。就是收集好语料、图片，再训练出一个参数，这个参数对这些数据隐含结构与关系有一个表达。这时候，我们给它一段文字，它可以做出一个生成或者是预测。这是相对静止的，就像读了书后就可以写文章，但实际上这只是智能生物能力中的一方面。

我们生活在不断变化的时空中，视听觉每时每刻都在感知，要做出实时的判断。而人工神经网络要做到这点，不仅规模要大，还要精密、精细，它的信号信息处理能力要和真正的生物相当才能叫超级大脑。

凤凰网科技《浪潮》：刚才我们提到人工智能有一些局限。现在，有许多人在研究脑机接口，比如说马斯克，他在5月底宣布了脑机接口通过了人体试验。你怎么看他这项研究呢？

黄铁军：就（脑机接口）这项技术来说，它已经研究了几十年，在一些疾病的治疗中发挥作用，这很重要，这个是很有意义的。但从人工智能的发展来说，脑机接口我不认为它是将来一个重要的方面。

这个逻辑很简单。以速度为例，人工智能比人快了不是一点半点，它是要快好多数量级的。现在计算机每秒计算的次数和我们人的计算次数相比，那就是差了百万甚至于更多倍数。所以将来的人工智能系统一定是高速系统，因为它的物质基础是芯片，是光电这样的技术。

而人是一个基于有机化合物的慢速系统，这俩东西如果你要接在一起的话，绝对是不匹配的。

我们的脑是慢速的，如果你接的是一个高速AI，那就像把一个人挂在飞机后边往前跑，一下子就给甩出去了，所以频率根本无法去匹配。当然反过来说，我们将相对慢速的芯片植入系统，用于人的治疗，那另当别论。

凤凰网科技《浪潮》：很多人会担心AI现在的发展，不是成为自己的工具，而是把自己完全取代了。您怎么看待碳基文明和碳基文明的未来呢？

黄铁军：这是一个很复杂的问题。我认为至少在一段时间之内，AI只是取代一些工作，取代一些职业，同时又创造了更多的工作和职业。现阶段，实际上是 “人类和AI系统相结合”的阶段。

“一个超级的人工智能比人类要强，要主导这个世界”这种想象，有很多值得讨论的地方。但我想有什么建议的话，就是大家思考这个问题的时候，可能要稍微把以人类为中心的一些想法尽量剥离掉。这种人工智能系统是不是可以做出来？是否会在一定的历史时期会出现？我们不能排除这种可能性。

智力水平比人类要强的系统是有可能出现的。不用过分担心，有时候担心来源于我们以人类为中心的思维延伸，不用过分担心和炒作。另外一方，面对这种可能性不能完全视而不见，我们要想应对的办法，或者应该思考允不允许这样一个系统出现。

凤凰网科技《浪潮》：有一句话我觉得很深刻，可以作为今天最后一个问题去讨论，就是人类只是人工智能演化的一个阶段，有什么是AI无法替代人类的吗？

黄铁军：AI这个词也才出现大概六七十年的样子，要说人类就是AI的一个阶段，这个不应该这么说。人类本来就是进化的产物，然后发明了AI，然后AI自己在演化发展，它也是个智能系统，人类也是一个智能系统，这两种智能系统可以说目前还有很大差别。人类是一个一个的个体人，几十亿人在地球上，形成了一个复杂的社会系统，按照我们的特点在往前发展。

AI个体性没那么强。以大模型为例，大模型不会有那么多，大模型就是一个可能极少数的存在。

但从智能进化的角度来说，我们从无机物进化出有机物，从简单细胞到复杂的细胞系统，把细胞分化出神经系统，然后形成大脑，形成越来越庞大这样的一个生物进化过程，这是智能水平不断提高的这么一个历史进程。将来智能的发展是不是要永远这么发展下去？那也不一定，没有什么事物应该是永久的、绝对的，它会不会在新的物理的基础上然后更快的演化？

我觉得有很多可能性值得去探索。现在可以不用yes or no来思考。