分享

别看AlphaGo这么狂,它离真正的智能还差得远|陈经

 伤心的小剑客 2017-02-09

解读科学 洞察本质


戳穿忽悠 粉碎谣言

导读

现在所有的人工智能程序,都和最简单的程序一样没有智能。说是机器在学习,其实机器做的仍然和过去一样,没有本质区别。如果人类只管建神经网络,把各种数据扔给机器自己去“领悟”,然后机器输出了一些出人预料的、有意义的智力成果,那就真有本质不同了。


2016年12月,《科学》杂志照例公布了年度十大科技进展,其中围棋人工智能AlphaGo击败人类高手排在第三位,仅次于引力波检测,以及比邻星系行星的发现(就是刘慈欣笔下三体人的行星)。同月《自然》公布的年度八大科技进展中,AlphaGo排在第七位。围棋人机大战也在全社会引发了人工智能热潮,机器在围棋这个最难的博弈游戏中取得了出人意料的胜利,引发社会思考人工智能技术突破对人类的影响。


很多人对机器拥有与人类相当甚至超过人类的智能这事很有兴趣,在相关的科幻小说与电影中,人工智能也经常是众多媒体的关注焦点。“人工智能”这个词本身就是常见词汇,人们并不陌生,但其实大多数人对人工智能技术细节并不了解,有时会有一些误解,或者作出过于夸张的解读与联想。


AlphaGo战胜李世石是“人工”而非“智能”


IT时代的人们早就熟悉了计算机的特性,如电脑做数学运算速度远超人类,可以不眠不休一直稳定运行,程序可以海量快速复制,但我们并不把计算机看成智能。汽车跑得比人快,起重机比人力气大,但这些都是人发明的工具,并没有智能的感觉。人类对自身的智能非常自豪,认为这是人特有的“本事”,动物没有,机器也没有,所以人类是“万物之灵”。


五子棋、国际象棋、围棋等“完全信息博弈”游戏,是一类典型的智力活动,其中围棋是最难的一个。


1997年国际象棋AI深蓝打败了代表人类最高水平的卡斯帕罗夫,但当时的围棋程序非常差,水平比业余“低手”都差得多,怎么写出能挑战人类高手的围棋AI毫无头绪,没法估计要多少年。


2016年AlphaGo战胜李世石,以及年底升级版本Master在对人类高手快棋比赛中以60:0碾压式胜利,可以说人类在最难的围棋中都已经被机器打败了,找不到更难的棋类去显示人相对机器的智力优势,人在这个类别的智力活动上已经不如机器了。是不是说机器的智能已经开始超过人类了?很多人对此很迷惑。

可以肯定地说,到目前为止,人工智能虽然在下棋、图像识别、自动驾驶等多个领域取得了令人印象深刻的成就,但都只是“人工”的结果,完全是人类自身的智力活动成果。“机器智能”的进展并没有想象的那么大,甚至可以说毫无进展,机器本身没有任何智能。


从程序开发的角度看,如果先不管这些人工智能程序最终的效果,它们只不过是一些算法思想与程序代码,并没有任何特殊之处。代码是程序员一行行编写、修改、调试出来的,程序中用到的数据不管有多少,都是开发者有意识地收集、生成、维护的。如果告诉程序员群体,这里有一个程序,它的代码是这些,数据是那些,它的功能是对给定的输入产生期望的输出,没有任何一个程序员会感到奇怪,因为所有程序都是这样的,利用电脑的存储与数学运算能力,设计算法写代码实现,让输入的数据得到预想的输出。


举个例子,我们来看两个程序。

第一个程序将两个输入数字的乘积输出给用户,并保证它是绝对正确的。

第二个程序对于一个围棋局面的输入,给出两个坐标作为输出,下这个点能够获胜。


我们可能把前一个程序叫工具,因为它就是计算器的一个功能,但是把后一个程序称为有“智能”的AI,因为它看上去需要很深的智力思考。但是从使用的机器、开发的过程、最终生成的程序文件、程序执行时的运算过程等各方面来看,两个程序本质上完全一样。可以说第二个程序除了最后展示出来像是智能,和第一个程序性质上并没有任何不同。


也就是说,现在所有的“人工智能”程序,都和最简单的程序是一回事。聪明的算法设计者和程序员们,让一些程序看上去有了“智力”才能实现的能力,并称之为“人工智能”。实际执行程序的电脑完全就是在执行人类的指令,没有任何智能。


可以说,目前的“人工智能”,都是人类智能的第二种展现方式。人可以直接用人脑去下棋,用的是人的智力思维。也可以写程序代码,用机器去替自己下棋,而且比第一种方式干得更好。人可以自己用锄头挖地,也可以开挖掘机挖地,这是人类劳动的两种方式。在体力劳动上,挖掘机比人力气大,显然更先进,但没有人会说挖掘机有智能。也就是说,人类的体力劳动方式能够借助工具不断变化,先是用手指挖地,再挥锄头挖,再开挖掘机挖,以后可能有更先进的方式。而人类的智力思维,同样也可以借助工具。人类可以自己用脑子算315*227,可以用算盘算,也可以用计算器算,可以用电脑上的EXCEL表格算,也可以说话让手机AI助手算。无论哪种,都是人在用各种工具实现人解决问题不同的思路。


现在所有的人工智能程序也是如此,都是人类主动去发明创造一个工具,用另外一种办法展示人类的智能。最终好像是一个机器下棋打败了人类高手,人们说AlphaGo智能超过人类了。但其实是Deepmind团队里做算法设计与程序开发的十多个人,换了一种思维方式,借助电脑这个工具打败了靠传统思维下棋的人类高手。AlphaGo的单机版或者分布式版本中的CPU、GPU都只是工具,没有任何智能,只是在做简单的加减乘除运算。AlphaGo不知道自己在下棋,它就是在机械地做算术。和人类高手对战的,其实是程序开发者,他们是用设计算法写程序的思路来下棋。


图为AlphaGo开发团队,李世石真正的对手。左五为David Silver,左六为Aja Huang,负责算法设计的两位核心成员。


如今的人工智能远没有人们想象的那么强大


现在人工智能开始在很多领域尝试人的专业“智力”工作。如人工智能像专家那样分析医疗图片,像保险专家那样审核保单,像律师那样分析案件涉及法律条款,像记者那样写稿件。很多人将这理解为,机器在代替了工人的体力劳动之后,开始冲击知识水平更高的专家的工作了。甚至有些人忧心忡忡,怕自己的专业工作也变成能被机器取代的简单劳动。


根据以上的分析,这并不是“机器”对人的冲击,而是算法开发者与程序员们,在用另一种思维进行各种专业智力活动。本质是人类两种思维方式的碰撞,一种是算法思维,一种是传统专家思维。电脑与机器本身都只是工具,没有思维没有智能,体现的是背后指挥它们行动的人的意图。算法开发团队,会设计算法写程序实现,让电脑去看医疗图片给出分析结果,自己手工抄到纸上;而传统医生专家,用人眼看医疗图片给出判断,他们也会用电脑,如把图片显示在电脑屏上,给出的结论输入到电脑存成文件。两种思维方式的区别是,对电脑不同的利用水平。


如果说近两三年“人工智能”取得了巨大突破,那更接近事实真相的描述是:热衷于算法设计与程序工程实现的开发者群体取得了巨大进展。他们搞出了一些先进技术,借助电脑把触角伸到非常多的领域里去。以前这些领域是被人类传统“专家”占据的,现在算法开发者们认为自己能用新的思维方法在这些领域搞出大的创新,在效率、可靠性、识别率等指标上超过传统专家。


这些技术可以统称为“机器学习”,是近年来发展最快的科技领域之一。虽然说是“机器”在学习,其实机器仍然和过去一样,做的是数据存储、数学运算,没有本质区别所有机器学习技术的共同特征是,电脑存储了一些“系数”,这些系数是“神经网络”、“分类器”等数学结构中可变的部分,开发者让电脑程序执行或多或少的“样本”进行“训练”,得到正确或者错误的输出,根据结果回头去正向负向改变这些系数。近年来的新趋势是:


  1. 系数数量越来越多,多达上百M,比程序代码行数还要多得多。组成的数学结构越来越复杂,如以前简单的三层神经网络,发展成十几层甚至上百层的多层“卷积神经网络”。各种新型的数据网络结构层出不穷,非常活跃。


2. 用于训练的样本数量,从过去的几百、几千,发展到几十万、上百万个。训练需要的时间越来越长,需要GPU、机器学习专用芯片等新式的硬件支持,过去的硬件跑不动训练了。


3. 训练样本,过去是人工收集、人工标注正确输出,现在发展到机器自我“强化学习”。如AlphaGo进行海量的自我对局,生成几千万个样本,回头用于神经网络训练。也有些样本是程序在互联网上用“爬虫”自动收集的。因此,机器学习有时需要海量的服务器支持,可能需要十万个以上,有实力的公司才做得了。


4. 研究者群体在机器训练方法上取得了突破,对于很复杂的数学结构、海量的样本,想出了“深度学习”这样的办法。在语音识别、图像识别等多个领域,最终效果甚至可以超过人类的水平,在指标效果上比过去有了重大突破。程序识别率指标突破临界点以后,就会对产业产生爆发式冲击。如语音识别几十年来都在研发,准确率一直在提升,但都不温不火。但这两年来准确率足以实用了,一下就爆发了。


因此,目前人工智能行业与社会其它行业的互动趋势是,机器学习研究者群体会用以上这些技术,去各种有价值的行业里,用算法与程序思路去解决专业问题,提供另一种智力劳动的方式。当他们在一个行业成功了,这个行业就面临重大技术变革,旧的从业人员确实会受到冲击。但是正如前面所述,这并不是机器对人的挑战,而是算法与程序思维的人群,对传统思维人群的挑战。


这种挑战是真实正在发生的。上面描述的人工智能技术仍然在高速发展,还没有遇到之前几次人工智能热潮遇到的瓶颈。人工智能技术突破一定会在更多行业中发生。作为社会大众,其实我们已经不知不觉已经用了很多人工智能的成果,如手机语音输入,停车场自动收费,高速公路卡口自动开闸通行,高效的快递分发,可以说全是好事。


至于说旧的从业人员会受到什么样的影响,应该要具体行业具体分析。可以肯定一些行业的从业人数会大幅减少,如港口集装箱理货人员数量会大降,富士康生产线上的工人会减少,智能机器会增加。这些简单劳动,并不需要特别的专业知识,普通人经培训后都可以做。用机器代替人做简单劳动,将人从枯燥繁重甚至危险的工作中解放出来,从生产力角度看应该对全社会有益,能够创造更多社会福利。如果发生大规模的失业,这是社会生产关系的范畴,只要社会在福利分配上做好,解决问题没有本质困难。欧洲一些国家这方面走在前面。往深里说,甚至可以设想“机器共产主义社会”,劳动全由机器干,人类就管幸福生活,当然还只是比较遥远的幻想。


一些更复杂的智力劳动会受到什么样的影响还不好说。如医疗专家、保险专家、销售专家会不会失业,只有等相关行业的人工智能程序真的出来后才知道。媒体编辑记者们,会不会被机器写手大量代替,也不好说。无论如何,如果行业传统专家们能够熟悉算法与程序的思维,将机器的能力与自己的能力结合,就能更好地适应被机器改变的行业。


以上介绍了目前正在快速发展的人工智能产业技术现状,可以说还是人类自己思维方式的重大进展,机器仍然做过去一样的事,没有任何智能。有些研究者,把目前的机器智能称为“弱人工智能”,就是这个意思。那么,真正的机器智能,或者说“强人工智能”,会是如何的?我们可以作一些探讨。


自主创新才是真正的机器智能


有人说“强人工智能”就是机器有自己的思想了,甚至会像“天网”一样反抗人类,很危险。也有些人受“技术奇点”思维的影响,认为人工智能发展下去,就会出现比人类智力水平高一档次的机器智能物种,而且发展是加速度的,奇点一到历史就不属于人类了,有些专家们认为就是三四十年事,听上去很吓人。


据笔者对人工智能技术的了解,这些还是属于科学幻想的范畴,没有可行的技术路线。可控核聚变、量子计算机、强人工智能,是目前意义最大的三个技术领域。但是都没有头绪,什么时候能突破完全没法估计,有时会说要50年,等50年过去还是要50年,其实就是说不知道要多久。


现在的人工智能程序,全是人写出来的。机器自我生成数据训练神经网络数据也是人让它做的,代码不会变,程序输入输出的目的不会变。人类只是没法理解几百M的神经网络数据黑箱子,说不清楚为什么就挺厉害了,但并不是不了解它。了解多的研究者会知道黑箱子有时会出一些离谱的错误,如将完全没有意义的混乱图片认成一只猫。


而且现在人工智能程序其实都是些“白痴天才”,就一个事特别厉害,其它什么都不会。用专业术语,就是没有“泛化”的能力。下棋厉害的程序不能用来开车,认图片厉害的不能用来语音识别。开一个新任务,还是得人类开发人员绞尽脑汁建模编码调试优化,虽然这个过程倒是有套路了,但那是人类的本事。人类的智能不会这样,一个脑子,可以学会成千上万种本事,而且不同的本事还能触类旁通。


如果研究者们开发出了一种庞大的神经网络连接结构,然后用不同的数据集对它进行训练,就可以完成不同的智力任务,那会是一个极大突破。这会使得人工智能研发的任务大大简化,甚至有点人脑的雏形了。这目前看有一点希望,如一个训练好的神经网络,可以直接移到另一个任务里去当一个部件,当然难度还是极大的。如果这种训练弄得很容易了,有可能在社会上造成很大影响。

现在人工智能的开发难度不低,门槛较高,需要专业的算法开发人员与程序员进行编码,一般人做不了。如果搞出了有“泛化”能力的人工智能学习框架,也许社会各界稍微学一下就能自己训练出人工智能了。这样,人工智能的发展就不再是极少数技术精英的事,全社会各领域会主动去引入人工智能技术。这种情况下,正如百度首席科学家吴恩达说的,人工智能会像“电”一样,变成各行各业的新型工具。这无疑会极大地推动各行业的技术进步,人工智能可能会是第四次工业革命,像蒸气机、电力、计算机一样改造各行各业。


但就算做到了这一步,仍然是人类在进行思维,机器还是没有智能。如果再进一步,人类只管建神经网络,然后漫无目的地把各种数据扔给机器自己去“领悟”,然后机器输出了一些出人预料的、有意义的智力成果,那就真有本质不同了。


比如在电脑里放一个程序连上多个摄像头,把某户的家庭生活全拍下来,算法开发人员让它自己观察想办法优化主人的家庭生活。然后这程序某天对男主人报告,我这已经准备好了一个功能,帮您每天到网上搜索好一个笑话让您讲给太太听,根据太太的情绪准备不同的素材。过阵子又对主人报告,准备好了另一个功能,对小孩作出提醒,优化小孩的学习效率。这些功能是机器自己想出来的,不是人规划出来的。


再比如,电脑里一个AI程序吃下一个公司的所有营销数据,开发者让这个AI自主分析观察这些数据。过阵子,AI建议说公司要如何改变经营策略,公司有哪些工作是做得不好需要改善,要开除哪些人,哪个部门要多招人。电脑具体会提出什么建议,开发人员事先并不清楚。


如果这种机器程序真有了,那就特别厉害了。也许这个程序不知道自己在干啥,仍然没有自主意识,但和之前的人工智能相比,它能自主地搞出了一些智能发现,不需要人去规划引导。这时就可以说,人工智能脱离了人的具体指导,有了“自主创新”的本事了。当然还需要人去划一个大框架,人工智能程序在里面发挥一定的“主观能动性”。成果可能是,机器自己到网上乱看小说后写出了畅销小说,机器自己看了很多数学定理的证明后证明了很难的数学定理,机器听了很多乐曲之后写出了好听的乐曲。和以前的作诗机、机器证明、机器作曲不同,机器用什么办法去写作、证明、谱曲,人没有告诉它。这时机器再要声称自己是有智能的,就理直气壮了。这类机器会脱离开发者,在那不断地进行“自主创新”。人面对的竞争者就真的是这些机器了,而不是开发出机器的人,因为开发者也不知道机器会干出什么事。


当然这些功能现在还不知道怎么做出来,但并不是完全不可想象。研发人员可以给机器设定更复杂、更自由的系数变动模式,数据输入的样式也更多种多样,机器学习的目的更加泛化。其实人类自己具备的能力,也是经过不计其数的人自由尝试之后,不断积累而来的。


这个阶段的人工智能,应该还是在人类的控制之下。因为它们的工作范围还是人设定的,控制起来不难。它们也没有自主意识,只是在漫无目的地进行运算,有时会给出对人有意义的结果。但是这种人工智能显然会极大地改变人类社会,也许会让人类科技突飞猛进,不仅是工业革命,还是科学技术的革命。比如在人工智能帮助下,可控核聚变有了新的方案,实现了能源革命。


美剧《西部世界》剧照


再往下发展,要是人工智能发展出自主意识,那意义就大得没边了。本文主要基于现阶段的人工智能基础技术,进行技术性的讨论。具有自主意识的人工智能与人的互动,是很多科幻小说、影视剧、科普文章的关注焦点,如美剧《西部世界》。对此笔者并没有特别的观点,也是个看片欣赏的,只能说机器自主意识现在还是文艺与科幻意义上的,没有太多现实意义。


总的来说,笔者对人工智能的发展是非常乐观的。即使人工智能技术进展不大,用现有的技术也能改造一大批行业。如果人工智能技术再有突破,将会极大促进人类社会的生产力发展。而人工智能完全脱离人类发展进而威胁人类,又过于遥远,这个问题可以用轻松的心态去面对。



背景简介:作者笔名陈经,香港科技大学计算机科学硕士,科技与战略风云学会会员, 微博@风云学会陈经。


风云之声获授权转载

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多