分享

人工智能革命性突破!最难的围棋,人脑也挡不住电脑了

 昵称22998329 2016-01-28

还记得电脑“深蓝”与国际象棋世界冠军卡斯帕罗夫的惊世一战吗?1997年“深蓝”取得的这场胜利,拉开了在棋类竞技比赛中电脑向人脑叫板的序幕。




2006年,中国象棋也宣告沦陷。在“浪潮杯”人机大战中,电脑“浪潮天梭”战胜中国象棋特级大师柳大华等人。


于是许多人把希望寄托在围棋上,认为这种比国际象棋和中国象棋都更为复杂的棋类运动,可以成为抵挡电脑进攻的最后阵地。就在去年11月,在北京举行的“美林谷杯”计算机围棋锦标赛上获得冠军的程序“石子旋风”,在人机大战中仍然不敌人类职业棋手。当时一些计算机专家认为,再过十多年电脑才能在围棋上击败人类;而一些职业棋手则认为“100年也许都还不够”。


令人没有想到的是,电脑已经在地球的另一面暗度陈仓。2015年10月,在伦敦,谷歌下属的“深度思维”公司开发的AlphaGo电脑程序以5比0的成绩击败了围棋欧洲冠军、前中国职业棋手樊麾,成为第一个击败人类职业棋手的电脑程序。由于论文评审的保密流程,对局详情刚刚刊登在新一期《自然》杂志上。




1
什么是AlphaGo?

“关键的一步”

 

位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队,开发了一个叫“AlphaGo”的程序。名称由两部分组成,Alpha对应希腊语的第一个字母,有“首要、关键”的意思;Go来自日语对围棋的称呼,在英语中也有“行走、前进”的意思。因此,AlphaGo也许可以意译为“关键一步”。


AlphaGo 下围棋的主要方法是 Value Networks(价值网络)和 Policy Networks(策略网络),其中 Value Networks 评估棋盘位置,Policy Networks 选择下棋步法。


这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的监督学习,以及在自己和自己下棋(Self-Play)中学到强化学习。这不需要任何前瞻式的搜索(Lookahead Search),神经网络玩围棋游戏的能力,就达到了最先进的蒙特卡洛树搜索算法的级别(这种算法模拟了上千种随机自己和自己下棋的结果)。AlphaGo 引入了一种新搜索算法,这种算法将蒙特卡洛模拟和价值、策略网络结合起来。它通过名为“价值网络”的算法来评估棋盘上的各个位置,再通过名为“策略网络”的算法来选择在哪落子,从而取得了高度优化的围棋策略。


与当年的“深蓝”相比,AlphaGo所评估的棋子位置只有数千分之一。这说明它已经减少大量的无用计算,变得更加智能。


2
人类智力将接受终极挑战

李世石将于3月与电脑过招

 


按计划,这个电脑程序将在今年3月挑战韩国棋手李世石。李世石曾获多个世界冠军,是围棋界可与国际象棋界的卡斯帕罗夫相比的人物。这场大赛,也可谓是电脑与人脑竞技大战中的“关键一步”。


如果电脑赢了,一个科幻般的念头可能会浮上许多人的心头。既然在棋类游戏中人类已经没法阻止电脑,那么未来是否真会像《终结者》、《黑客帝国》等电影里那样,出现电脑满世界追着人类打的场景?


如果李世石赢了,人们心中也不会太轻松。毕竟许多人认为还要过很多年才会发生的事情,已经逼近到眼前。电脑更新换代的速度有目共睹,谁知道人类还能阻挡它们多久?




3
专家怎么说?

“一切皆有可能”

 

托比·曼宁(Toby Manning),英国围棋协会财务主管,范麾与AlphaGo比赛的裁判


围棋选手都知道围棋是人工智能领域一大尚未解决的难题,大多数人都觉得计算机能达到职业人类棋手的水准,但得再过十多年才行。


在范麾与AlphaGo对弈的那场比赛中,我本以为范麾会赢,而最终的结果让我深深震惊。


目睹对弈过程,你甚至很难区分哪一方是人类,哪一方是计算机。在之前的很多软件中,计算机下的很多步可能都很理性,但突然就会变得毫无头绪,而在这场比赛中,几乎看不到计算机与人类的区别。

  

一个区别是时间的分配方式:范麾下每一步所花的时间都要比AlphaGo更久,而AlphaGo的棋路也不像人类棋手那样富有进攻性。它会非常冷静地落子,而非积极地侵略领地或提子。

  

对此,我觉得围棋界的反应可能和当年IBM的“深蓝”(Deep Blue)打败国际象棋大师一样,棋手会使用这个软件来分析他们自己的棋局,以找出他们在哪里犯了错误。


德米斯·哈萨比斯(Demis Hassabis),DeepMind公司创立者之一


AlphaGo很可能在围棋这一领域超越最顶尖的人类,我非常期待看到它在围棋的规则之内创造出新的东西。这是我亲手打造的系统,自然对它怀有很深的感情,尤其考虑到我们打造它的方式——它会不断学习,从某种意义上说我们是在不断”训练”它,它下棋的方式也很像人类。你在写一段普通的程序时,可能

对所有细节都了如指掌,事先安排好了一切,但AlphaGo不一样,它会自己学习提高,这种能力是很了不起的。


李夏珍(音译),韩国围棋协会,国际围棋联盟秘书长


一开始听到计算机要挑战李世石的时候我惊呆了,我想计算机团队可能根本不知道李世石的实力有多强,但事实上是我不知道计算机的实力有多强。我非常期待他们之间的较量。

  

谁会赢?我真不知道。李世石不相信计算机有他那么厉害,但我过去曾经听到过一些关于AlphaGo的消息,并被它的实力所震惊。当然,我也知道李世石有多强,所以我觉得两边获胜的可能性都是50%吧。

  

在我看来,围棋仍然是一项可以带给人类很多启迪的游戏,即使人工智能在这方面打败了人类,也不会削减它一丝丝的魅力。人类会接受计算机技术超越自己的现实,并找到方法让它们为自己所用。


乔纳森·谢弗(Jonathan Schaeffer),加拿大阿尔伯塔大学计算机科学家,也是2007年解决国际跳棋问题的计算机程序“奇努克”(Chinook)的设计者。


这还不能与1997年“深蓝”击败国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)的时刻相比肩,等到计算机程序打败真正的围棋顶尖棋手才算。“深蓝”从1989年开始就常常能击败国际象棋大师了,但直到8年以后击败卡斯帕罗夫才算得上统治了这一领域。但这一棋局让我看到AlphaGo与顶尖人类棋手的距离已经大大缩小,很可能再改进一下算法,提高一下计算能力,在一两年之内就能打败顶尖棋手。

  

关于三月即将进行的那场棋局,我还是赌李世石会赢。不是瞧不起AlphaGo,我觉得它就像一个天才儿童,一下子就学会了围棋,而且水平极高,但它的经验还不够丰富。而我们知道,在棋类游戏中,经验是很重要的一方面。


戴维·西尔弗(David Silver),DeepMind公司的计算机科学家


我没下注赌AlphaGo赢,不过三月这场比赛的结果的确会对我们的名声有很大的影响,如果输了,我们会非常失望的。但一切皆有可能,人类总有很多技巧,有些是我们无法训练我们的计算机来应对的。


4
人工智能发展的“伦理挑战”

人类是否会因此灭绝?

 

在人工智能领域,还有另一个著名的关卡是“图灵测试”。这种由著名计算机科学家图灵提出的测试,是让电脑模仿人类与人类裁判“对话”,如果成功诱使人类裁判认为与之对话的是人,则通过测试。


2014年,在英国皇家学会于伦敦举行的“图灵测试”竞赛上,一台名为“尤金·古兹曼”的电脑通过测试。




电脑在与人脑的大战中不断过关斩将,但它们目前还面临一个限制,那就是还不会将其智能“通用化”。“深度思维”首席执行官德米什·哈萨比斯说,AlphaGo只会下围棋,如何将这种智能用于其他领域还是一个挑战。如果电脑能够突破这个限制,无疑会将人工智能带入一个新的境界。


在推动人工智能发展的过程中,人类如何在伦理上“控制”电脑也是一个挑战。如一些科幻电影描述的那样,许多人担心人工智能的发展可能带来灾难,著名科学家霍金就曾表示人工智能可能会导致人类灭绝。因此,科学家也需要注意让人工智能不会迈出真正挑战人类的“关键一步”。





    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多