核心提示:AlphaGo与李世石对战已经到了第五局,面对“人造吴清源”江铸久分析了这场人机对弈的实质是人人大战,早期的人机大战由于没有足够数据的支持都是人赢。这次AlphaGo的表现确实超出职业界围棋手的成长思维 凤凰卫视3月15日《锵锵三人行》,以下为文字实录: 窦文涛:《锵锵三人行》,今天的两位嘉宾绝对体现了业余了18年的《锵锵三人行》正在向专业化挺进,一位是咱们来过的,咱们围棋的国手,江铸久九段老师。感觉刚从武当山上下来,江铸久九段老师,上次您来我们这儿,您记得聊的还是棋圣吴清源老师,这回您来是因为出了个人造吴清源。 江铸久:人机大战事实是人人大战 江铸久:对,真的是可以这么说。 窦文涛:是吧,虽然偶尔出点荤招,但是感觉也是大智若愚。 江铸久:是,而且它能下出很多创造性的棋来,其中一招我们待会儿会讲到。我当时就是说很少有这种时候,就是看到这步的时候,就觉得有点热泪盈眶的感觉。 窦文涛:好,现在韩国那边有李世石,我们这边有江铸久,韩国那边有阿尔法狗,我们这边也得来个人机大战。您算人,您只能算机,不好意思,计算机,因为这位是咱们香港科技大学计算机系的系主任杨强老师。不过,我觉着杨强老师长的像下围棋的,你觉着吗,他有点像李世石那模样,是吗? 江铸久:对对对。其实我们也一直说这次媒体写的人机大战事实上是人人大战。因为是人跟职业棋手,就是说比较好的至今为止,职业棋手是人类最好的下棋的一些代表。跟人类智慧、科技,人类创造出来的智慧,从高科技那代来跟棋对决。 杨强:对,不仅如此,其实这次很重要的特点是大数据,那些数据是什么呢,就是以前人和人之间对弈的那些数据。从六段到九段收集了很多很多的数据,最后产生了,这是具有多大呢,三千万个盘来训练这只阿尔法狗。所以,有个笑话,说第一局完了,把计算机盖一打开,柯洁爬出来了。其实更恰当的应该是里边爬出了一万多人。 窦文涛:怎么说? 杨强:都是下围棋的。因为他们提供了数据,对吧? 窦文涛:就是前三局输了,我看见韩国人非常有民族自尊心,在这写文章说谷歌应该向全世界道歉,对吧?它侮辱我们李世石,因为他说,但是我就觉得韩国人是气的,我觉得有点不知道他在说什么了。他说他这个玩意儿是运用了几百台还是上千台的电脑,然后他不是利用他已有的信息来跟我们打,他是看到李世石下的招之后,然后他怎么着认真运算之后,他再下招。后来有的网友就说那怎么意思,那还让阿尔法下盲棋不成,是吧? 江铸久:早期人机大战 大数据上面支持不了 江铸久:这也是我觉得我感兴趣的地方,因为我跟着人工智能下围棋也二十多年了。 窦文涛:你也下过? 江铸久:最早的一批90年代,1991年、1992年那些研究,人工智能就是电脑下棋的在硅谷的时候,我就跟他们有对话。他们那会儿把我请去的时候。 窦文涛:是跟人对话,还是跟狗对话? 江铸久:跟机器。 窦文涛:你跟狗早就下过? 江铸久:跟电脑,这样二十多年来就是有一些我们说的电脑专家们像风一样,利用个人的智慧和能力,不停地在研究电脑跟人对局会怎么样。但那个时候,就是在数据方面,它就支持不了。最明显的例子就是,最早我跟他们下的是让十几个,一般人让九个我们就说很业余了。让十几个,我们怎么能够对付得了他呢。就是很快摸着他规律,你下几个死子在那儿,机器就会不停地开心地吃你,而下围棋。 窦文涛:真是个鼠目寸光的家伙。 江铸久:对,而下围棋最重要的一点就是讲效率,所以我们就利用他这弱点,你丢几个弃子我们说,他会多花一倍的兵力,1.5倍、1.4倍,你就从那里边占到便宜了。 打劫使AlphaGo需要大量搜索 李世石这局赢得机会非常大 窦文涛:这样江老师,咱们先找点直播的感觉。我们是今天晚上播这个节目,但是现在是我们下午录像,现在的时间是下午的两点50分,这最后一局正在人机大战。你看着这个直播的这个棋盘,我想知道您对现在的形势怎么分析?这一局,李世石能赢得下来吗? 江铸久:我觉着这局李世石的机会非常大,如果现在要让我投的话,我觉得李世石赢的赢面非常非常大,如果李世石不出现重大失误的话。而且,我们看周围,我想李世石也一定想到了,有机会就给你造成比较复杂的打劫,打劫看样子对计算机来说它的搜索的东西要多得多。 杨强:非常多。 窦文涛:你觉得他打劫吗? 杨强:我来解释一下这个原理。这个阿尔法狗它的原理实际上就是在搜索一个很大的空间。咱们打个比方吧,就好像是一个人在一个很大的迷宫里面,他想走出去,他怎么走出去呢?他只能搜索,他看看往这边行不行,往那边走行不行。那搜索的空间如果大的话,如果问题复杂的话,那么他在一定时间之内只能搜索很小的一部分的空间,所以犯错误的机会就会大。所以,如果这个打劫发生的越早,那么这个混乱度就会越大。 江铸久:而且最好这个打劫是发生在不止一块棋,发生在两块棋、三块棋,关联五六块的时候,事实上我们看李世石很明显地这盘棋,现在正在进行的,就是在各种变化里面有机会就给你搞个打劫出来,或者吓唬它,下一步你要这么来的话,我就要跟你玩打劫了。那电脑如果是它的弱点的话,原来说它不会打劫,其实它是会的,那可能是我们猜测是它的后一个选项,第一个选项不是跟打劫。 杨强:不喜欢打劫。 江铸久:对,不喜欢打劫。 窦文涛:这个为什么?从人工智能来讲。 杨强:这是为什么呢?这个阿尔法狗里面有两块最重要的软件,一块是给你一个棋盘,它来评估这个棋盘对我多有利;另外一个是说给你一个棋盘,下面这个子应该走到哪儿。 窦文涛:说一个叫策略网络,一个叫价值网络。 杨强:对,说的太对了,那么这两个网络在什么时候会犯怵呢?就是在打劫这种情况,我们叫非确定现象出现了,可能这样,可能那样;也许这样,也许那样。那么它把这些情况都放到那儿的时候,它发现一个现象出现了,数据不够,训练的不够。所以,这个时候。 窦文涛:训练还不够? 杨强:还不够,对,还不够,因为那个数实在是太大了,那个数有多大呢,就是那个搜索数。有人估算过,它的那个总数,那个棋盘的总数比这个全宇宙的原子还要多。 窦文涛:还多得多。 杨强:还多得多。 窦文涛:全宇宙的原子才十的八次方,大家听着好像不多,其实这就是那个数学那个效应,十乘十乘80次,那就无限大了。 江铸久:反正对人类来说,对职业棋手来说,他看打劫他是这样看的。一,这个打劫对我有没有利;二,我打劫下去的劫财对我有利不有利,不有利我就不玩,有利,只要有利的时候我开始给你打。不确定的时候,他就靠我们说靠逻辑性来推两下,这个打劫这个局面对我有利,我跟你打,对我没利,我不跟你打。有利的情况就是我看看劫财对我有不有利。 江铸久:计算机很难赶上人类“虚”的方面 窦文涛:所以我请教您一个哲学问题,也可以说人类学的问题了。感性、直觉它最终是不是无限大的计算和无限大的逻辑?只不过人脑不能进行那么精确的计算,所以培养出一种。实际上还是一种模糊的理性,基本上是这么回事吗? 江铸久:这我就不知道,但是我知道下棋对于虚的东西,原来我们一直觉得计算机很难赶上我们的一点就是在虚的方面表现。比方说什么是虚呢?如果这个地方拆解,计算机很难计算出来,如果这个地方死活,它都是局部空间,而一上来的布局,考虑到战略的时候,那是需要你的经验,你可能有好几条路要走,可以走,似乎都不错。而这个时候,人的直觉、经验加上你的逻辑训练出来,你就会选一个,我可以选一个大概方向不错。而计算机如果这个时候,不要说计算机,就只说人,我们往前面推一推让我联想到的就是当时在上世纪一九三几年的时候,日本理论比较厉害的就是,代表是木谷实,他就是尽可能地把围棋上的变化我都算变,来克制了很多对手。擂台赛九连胜这些新的,但是紧跟着从中国我们都知道,中国去了吴清源老师,而后来吴清源老师大家知道,他的理论是我无法穷尽,我的计算无法穷尽,而且也很花时间,那么我就是凭着我的经验我来选出五六条路,然后我把旁边的两条路先去掉,剩下三个了,我把最弱的一条再去掉。 窦文涛:这不就是阿尔法狗的思路吗? 杨强:完全是阿尔法狗的思路。 江铸久:是。 杨强:西方的叫法叫蒙特卡洛搜索树,这个也差不多。 窦文涛:为什么,因为你们爱赌博,是吗? 杨强:这跟赌博有关,因为你是选择在这么多里面你选择几个,然后你就拿它来计算了,是一个我们叫抽样,所以这个抽样如果你抽的够多,如果你的数据够多,你可以非常准的。所以,这个也就是完全是您刚才说的吴清源老师的这个直觉。 扫描屏幕下方的二维码关注凤凰卫视官方微信平台,更多精彩尽在凤凰私享会! 点击关注@凤凰私享会,更多精彩内容实时掌握 《锵锵三人行》凤凰卫视中文台播出[节目专区] 主持人:窦文涛[主持人专区] 首播时间:周一到周五 23:00-23:35 重播时间:周一至周五 13:00-13:35 |
|