分享

李世石为什么会输:一个投资人眼中的围棋“人机大战”

 真友书屋 2016-03-09



今天全世界的棋迷(其实还包括很多不懂围棋的科技迷)都抛下了手头工作,很没节操地围观一场围棋人机(人狗)大战。


之所以说没节操,是因为入门级的游戏迷才会去玩人机对战,竟然还直播。而之所以很多不懂围棋的也兴致勃勃去围观,是以为这场人机大战是代表着人类最高智力领域:围棋。


对弈双方,一方是获得过十多个世界冠军头衔,代表人类围棋最高水平之一的韩国九段棋手李世石,另一方是“公司10%的人负责赚钱,剩下90%的人全部在做各种与赚钱没有任何关系的科技创新”的GOOGLE公司开发的机器人,他们给它取了一个很好听的名字“AlphaGO”——阿法狗。


下面是整局棋谱(图一):




人狗对决,你看得可能有点晕,我直接告诉你结果:186手后,李世石(执黑)投子认输,盘面负8目左右。


赛前聂卫平等大腕一致对小法嗤之以鼻——人类的骄傲被还以耳光。


事实上,李世石的开局形势一度大优,阿法狗在初期盘面并不复杂的时候,并未显出丝毫优势,甚至出现不少明显“业余”的“电脑棋”,比如白48立,80长,都感觉莫名其妙,尤其白90沾,下出围棋里最忌讳的“草帽头”,把整个味道都弄没了,而且帮李世石把左下角迅速定型,明显智商堪忧(见下图)。

 



及至白黑93长,左下角定型(见下图),考虑到左上角黑棋能掏空,右下黑棋简单尖顶就可活,二者必得其一,黑棋已大优。

 



如果换成人,这个时候就已经投降了——问题是,阿法狗是个机器,它没有优势劣势的情绪变化,既不会得意忘形,也不会垂头丧气,更没有投子认输这个选项。


局势从白102打入开始发生变化。

 



在左下角下得太舒服的李世石明显优势意识过浓,应对开始偏软,在右边的应对和交换明显失误和吃亏,差距被迅速缩窄。开始紧张的李世石为了扳回损失,在右下角不是简单尖顶做活,而是采取了更复杂的黑2压,意图吃掉白一子(见下图)。




后面的结果我们知道了,患得患失的李世石后半盘如同梦游。


随着局势越复杂,阿法狗的计算能力越显出优势,几乎滴水不漏,在白116先尖守角,122沾,150拆这几个关键点都先手抢到(见文首的全局棋谱),之后右下轻松走活以后,李世石除了认输,已经没有其他路可走了。



在这场人机对战前,应该没几个人会知道是这个结果:几乎所有人都认为小法没戏。


尽管上个月,阿法狗刚5战5胜,完胜欧洲围棋冠军樊麾。


尽管李世石并不是当今围棋界最强的——最牛掰的是19岁的中国小将柯洁。在几个月前两人争夺世界冠军头衔之前,被问及与李世石之战胜率如何时,柯洁的回答是:李世石有5成胜率,如果总共有100成的话。而且,柯洁也第一时间在微博表示了对人狗大战结果的鄙视:




但稍微懂点围棋的都知道完全不是那么回事。樊麾只是职业二段(Elo3000左右),而李世石是职业九段(ELO 3532)。简单说,一个人的乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。


而且,去年年底阿法狗的Elo只有3168分。

 



你不必知道Elo围棋等级分怎么来的,总之,按照阿法狗和李世石这两个等级分的两个棋手对弈,李世石每盘的胜算为89%。如果对弈一盘,AlphaGo尚有11%的获胜的可能性,而整个比赛五盘胜出三盘,或更多,AlphaGo就只有1.1%的可能性。


 
(胜率参考公式)


当然,阿法狗在成长。据说阿法狗每天和自己的分身下了几十万盘,李世石最多回去复盘一次。


但,最关键的原因,应该还是不在这里,而在于随着变量的几何级增加,人的犯错几率会越来越大。


机器不会。变量和数据增加几个数量级,对于机器而言,只是提高点CPU的运算速度而已。


李世石的棋风,尤其如此。


李世石能一度统治职业棋界,就在于他张扬桀傲,不求平衡,拖人犯错的棋风:你要战,我便战;你不要战,我更要战,从一开始便将对手拉入不到终局不休的无数场战斗之中。战斗中,双方下错的概率会显著增加。这就是李世石的“僵尸流”:“我算不清的变化,我的对手一定也算不清”,逼自己和对手都犯错,但是让自己的错误犯得小,并避免自己成为犯最后那个错误的一方。


李世石雄踞世界棋坛多年,但几乎没有留下传统意义上的名局:就是那种双方落子都甄于完美,没有恶手,一方取胜是因为下得更好,而不是另一方下得不好。李世石固然下出过很多妙手,但下出更多恶手,他能赢棋,只是逼迫对手的破绽和恶手更多。这就是为什么李世石拿到世界冠军的不少决胜谱很难看,而对手在懊恼自己犯下错误之余,更有许多心理郁结。


这就是李世石的绝招:用自己的不稳定,賭对手的更不稳定。


用投资界的术语说,他在博弈,而不是价值投资。


但这对没有情绪的机器人,比如阿法狗,这招完全无效。



所以,真正可怕的,是变量的数量级。一旦比拼数量级,一旦要在几何级数的变量中寻找最优解,而这个最优解又正好存在,那人类大概率是会输的,时间早晚而已。


李世石会输,如日中天的柯洁,也会输。


“国际象棋电脑程序想要在人类大师级选手上赢得一场比赛的唯一可能,就是等到这位大师喝得烂醉,同时在下着50盘棋,并且在棋桌上犯下无比严重的错误。”


这话听起来是不是很耳熟?


但1997年,深蓝击败了世界冠军卡斯帕罗夫。这次,GOOGLE公司的阿法狗又击败了李世石。


下面,我们回过头来看看制造了阿法狗的GOOGLE到底是一家什么样的公司?


Google是一家“10%的人负责赚钱,90%的人负责胡思乱想和科技创新”的公司,就像他们花了一堆人力物力造出个AI机器满世界找人下棋一样——这与赚钱明显没有毛线关系,事实上,李世石赢了的话,他们还要倒贴100万美金。


他们只是在验证一些关于人类的命题和行为规则:比如,在需要穷举变量数据的领域,比如围棋,比如投资,人类该怎么做?


GOOGLE当年的命名源起自一个美丽的拼写错误。它们本来是想叫Googol,意思是10的100次方,代表互联网上的海量信息。


10的100次方是什么概念呢?恒河沙数据说是10的20次方;可见宇宙中星球的总数,约为10的22次方;宇宙中所有原子的总数,约为10的70次方。


去年GOOGLE公司把自己名字改成了Alphabet——翻译成中文是字母表,意思是囊括所有。因为他们发现,Googol代表的10的100次方,也许能代表互联网上的海量信息,但放到19*19的围棋盘前并不够用。


因为围棋变化可能是10的172次方,博弈复杂度是10的360次方的(见下图)。

 



这样的数据穷举,人脑在机器面前,只会越来越相形见拙。但机器的好处在于,它能无限扩容它的“脑容量”,并完全消除情绪影响,去无限可能逼近真实结果,或者接近最优解。


而人类,只有靠归纳与演绎——这种优势,在AI机器人拥有了图像识别技能后,也已消失。


所以,GOOGLE公司教给我们,客观而理性的做法是:在需要穷举变量数据的领域,承认我们的短处,寻找我们的确定性。


所以,GOOGLE公司是一家伟大的公司。




我们的确定性是:我们知道哪些领域,我们不拥有确定性。


比如,围棋的人机博弈,再比如,投资。


围棋是一个人为参与和博弈引出结果,一个穷尽计算能力也没有唯一正确答案,直到大官子阶段可能仍不确定结果的博弈游戏,它像极了证券投资市场。


巴菲特从不去试图摸清市场的每一个角落,他对付这种无法穷举变量市场的极简办法是:在自己能力圈内做事。


所以,巴菲特是一个伟大的投资人。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多