分享

梅宏院士揭秘阿尔法狗的下棋思路!

 菌心说 2021-11-29

众所周知,阿尔法狗已经横扫人类所有的围棋顶尖高手,但是,它究竟是怎么做到的?你知道吗?

下面让我们来看看中国科学院院士、全国信息技术标准化委员会大数据标准工作组组长、知名战略科学家梅宏,在《中国经济大讲堂》节目中是怎么说的吧。

00:00 / 00:00
2X快进中
重播
播放
00:0000:00
进入全屏
画中画
点击按住可拖动视频

阿尔法狗怎么做的?

每一个棋,不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则,而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则,马走日象走田一样。我们形成了一个搜索空间,我们过去的做法都是用计算机去完成的空间的搜索,找出最可能赢的这么一个套路。

这是过去的做法,按照这个套路计算机围棋赢几乎不可能。

文章图片1

换一个思路大家想想,围棋高手下棋,很多时候是棋感,对当时棋势的把握,棋局的把握。很多高手直觉一来,他就知道下一个棋该到那儿,这就是棋感。

这件事情捅破以后,计算机怎么做?相当于把围棋盘黑白子变为一个图片,那么这件事情恰恰是计算机最擅长的,做图像的匹配和识别。

所以就这么一个纸的捅破,把过去完全是用规则的方式,把它变为一个图像识别。我们做所有的智能,感知智能,我们人脸识别也好,指纹识别也好,再强大的人类高手,你要识别指纹都识别不过计算机。

首先,它是用的数据,这个数据就是人类不可能去想象出来。阿尔法狗用到的数据,三万多幅人类专业棋手对决的棋谱,三千万盘自我对弈的棋局。它用人类的棋谱,打谱学习,然后自己又和自己下棋,最新版的阿尔法狗Zero,用了490万盘,自己和自己对弈。大家想想人类的棋手每年下多少?大概一千盘了不起,脑袋能记多少?再牛的人也记不了多少。

文章图片2

微软亚洲研究院郑宇等人总结的Alphago原理图

这个图像一存在,这么多幅同样的图像,差不多这个格局一出现的时候,这个图像计算机快速一比对,就知道从概率上,下一步棋往哪儿走。

可以预测,在围棋里面你再怎么样,人类已经不可能赢过计算机了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多