人工智能革命性突破！最难的围棋，人脑也挡不住电脑了

昵称22998329 2016-01-28

展开全文

还记得电脑“深蓝”与国际象棋世界冠军卡斯帕罗夫的惊世一战吗？1997年“深蓝”取得的这场胜利，拉开了在棋类竞技比赛中电脑向人脑叫板的序幕。

2006年，中国象棋也宣告沦陷。在“浪潮杯”人机大战中，电脑“浪潮天梭”战胜中国象棋特级大师柳大华等人。

于是许多人把希望寄托在围棋上，认为这种比国际象棋和中国象棋都更为复杂的棋类运动，可以成为抵挡电脑进攻的最后阵地。就在去年11月，在北京举行的“美林谷杯”计算机围棋锦标赛上获得冠军的程序“石子旋风”，在人机大战中仍然不敌人类职业棋手。当时一些计算机专家认为，再过十多年电脑才能在围棋上击败人类；而一些职业棋手则认为“100年也许都还不够”。

令人没有想到的是，电脑已经在地球的另一面暗度陈仓。2015年10月，在伦敦，谷歌下属的“深度思维”公司开发的AlphaGo电脑程序以5比0的成绩击败了围棋欧洲冠军、前中国职业棋手樊麾，成为第一个击败人类职业棋手的电脑程序。由于论文评审的保密流程，对局详情刚刚刊登在新一期《自然》杂志上。

什么是AlphaGo？

“关键的一步”

位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队，开发了一个叫“AlphaGo”的程序。名称由两部分组成，Alpha对应希腊语的第一个字母，有“首要、关键”的意思；Go来自日语对围棋的称呼，在英语中也有“行走、前进”的意思。因此，AlphaGo也许可以意译为“关键一步”。

AlphaGo 下围棋的主要方法是 Value Networks（价值网络）和 Policy Networks（策略网络），其中 Value Networks 评估棋盘位置，Policy Networks 选择下棋步法。

这些神经网络模型通过一种新的方法训练，结合人类专家比赛中学到的监督学习，以及在自己和自己下棋（Self-Play）中学到强化学习。这不需要任何前瞻式的搜索（Lookahead Search），神经网络玩围棋游戏的能力，就达到了最先进的蒙特卡洛树搜索算法的级别（这种算法模拟了上千种随机自己和自己下棋的结果）。AlphaGo 引入了一种新搜索算法，这种算法将蒙特卡洛模拟和价值、策略网络结合起来。它通过名为“价值网络”的算法来评估棋盘上的各个位置，再通过名为“策略网络”的算法来选择在哪落子，从而取得了高度优化的围棋策略。

与当年的“深蓝”相比，AlphaGo所评估的棋子位置只有数千分之一。这说明它已经减少大量的无用计算，变得更加智能。

人类智力将接受终极挑战

李世石将于3月与电脑过招

按计划，这个电脑程序将在今年3月挑战韩国棋手李世石。李世石曾获多个世界冠军，是围棋界可与国际象棋界的卡斯帕罗夫相比的人物。这场大赛，也可谓是电脑与人脑竞技大战中的“关键一步”。

如果电脑赢了，一个科幻般的念头可能会浮上许多人的心头。既然在棋类游戏中人类已经没法阻止电脑，那么未来是否真会像《终结者》、《黑客帝国》等电影里那样，出现电脑满世界追着人类打的场景？

如果李世石赢了，人们心中也不会太轻松。毕竟许多人认为还要过很多年才会发生的事情，已经逼近到眼前。电脑更新换代的速度有目共睹，谁知道人类还能阻挡它们多久？

专家怎么说？

“一切皆有可能”

托比·曼宁(Toby Manning)，英国围棋协会财务主管，范麾与AlphaGo比赛的裁判

围棋选手都知道围棋是人工智能领域一大尚未解决的难题，大多数人都觉得计算机能达到职业人类棋手的水准，但得再过十多年才行。

在范麾与AlphaGo对弈的那场比赛中，我本以为范麾会赢，而最终的结果让我深深震惊。

目睹对弈过程，你甚至很难区分哪一方是人类，哪一方是计算机。在之前的很多软件中，计算机下的很多步可能都很理性，但突然就会变得毫无头绪，而在这场比赛中，几乎看不到计算机与人类的区别。

一个区别是时间的分配方式：范麾下每一步所花的时间都要比AlphaGo更久，而AlphaGo的棋路也不像人类棋手那样富有进攻性。它会非常冷静地落子，而非积极地侵略领地或提子。

对此，我觉得围棋界的反应可能和当年IBM的“深蓝”(Deep Blue)打败国际象棋大师一样，棋手会使用这个软件来分析他们自己的棋局，以找出他们在哪里犯了错误。

德米斯·哈萨比斯(Demis Hassabis)，DeepMind公司创立者之一

AlphaGo很可能在围棋这一领域超越最顶尖的人类，我非常期待看到它在围棋的规则之内创造出新的东西。这是我亲手打造的系统，自然对它怀有很深的感情，尤其考虑到我们打造它的方式——它会不断学习，从某种意义上说我们是在不断”训练”它，它下棋的方式也很像人类。你在写一段普通的程序时，可能

对所有细节都了如指掌，事先安排好了一切，但AlphaGo不一样，它会自己学习提高，这种能力是很了不起的。

李夏珍(音译)，韩国围棋协会，国际围棋联盟秘书长

一开始听到计算机要挑战李世石的时候我惊呆了，我想计算机团队可能根本不知道李世石的实力有多强，但事实上是我不知道计算机的实力有多强。我非常期待他们之间的较量。

谁会赢？我真不知道。李世石不相信计算机有他那么厉害，但我过去曾经听到过一些关于AlphaGo的消息，并被它的实力所震惊。当然，我也知道李世石有多强，所以我觉得两边获胜的可能性都是50%吧。

在我看来，围棋仍然是一项可以带给人类很多启迪的游戏，即使人工智能在这方面打败了人类，也不会削减它一丝丝的魅力。人类会接受计算机技术超越自己的现实，并找到方法让它们为自己所用。

乔纳森·谢弗(Jonathan Schaeffer)，加拿大阿尔伯塔大学计算机科学家，也是2007年解决国际跳棋问题的计算机程序“奇努克”(Chinook)的设计者。

这还不能与1997年“深蓝”击败国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)的时刻相比肩，等到计算机程序打败真正的围棋顶尖棋手才算。“深蓝”从1989年开始就常常能击败国际象棋大师了，但直到8年以后击败卡斯帕罗夫才算得上统治了这一领域。但这一棋局让我看到AlphaGo与顶尖人类棋手的距离已经大大缩小，很可能再改进一下算法，提高一下计算能力，在一两年之内就能打败顶尖棋手。

关于三月即将进行的那场棋局，我还是赌李世石会赢。不是瞧不起AlphaGo，我觉得它就像一个天才儿童，一下子就学会了围棋，而且水平极高，但它的经验还不够丰富。而我们知道，在棋类游戏中，经验是很重要的一方面。