梅宏院士揭秘阿尔法狗的下棋思路！

菌心说 2021-11-29

展开全文

众所周知，阿尔法狗已经横扫人类所有的围棋顶尖高手，但是，它究竟是怎么做到的？你知道吗？

下面让我们来看看中国科学院院士、全国信息技术标准化委员会大数据标准工作组组长、知名战略科学家梅宏，在《中国经济大讲堂》节目中是怎么说的吧。

00:00 / 00:00

2X快进中

重播

播放

00:0000:00

进入全屏

画中画

点击按住可拖动视频

阿尔法狗怎么做的？

每一个棋，不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则，而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则，马走日象走田一样。我们形成了一个搜索空间，我们过去的做法都是用计算机去完成的空间的搜索，找出最可能赢的这么一个套路。

这是过去的做法，按照这个套路计算机围棋赢几乎不可能。

文章图片1

换一个思路大家想想，围棋高手下棋，很多时候是棋感，对当时棋势的把握，棋局的把握。很多高手直觉一来，他就知道下一个棋该到那儿，这就是棋感。

这件事情捅破以后，计算机怎么做？相当于把围棋盘黑白子变为一个图片，那么这件事情恰恰是计算机最擅长的，做图像的匹配和识别。

所以就这么一个纸的捅破，把过去完全是用规则的方式，把它变为一个图像识别。我们做所有的智能，感知智能，我们人脸识别也好，指纹识别也好，再强大的人类高手，你要识别指纹都识别不过计算机。

首先，它是用的数据，这个数据就是人类不可能去想象出来。阿尔法狗用到的数据，三万多幅人类专业棋手对决的棋谱，三千万盘自我对弈的棋局。它用人类的棋谱，打谱学习，然后自己又和自己下棋，最新版的阿尔法狗Zero，用了490万盘，自己和自己对弈。大家想想人类的棋手每年下多少？大概一千盘了不起，脑袋能记多少？再牛的人也记不了多少。

文章图片2

微软亚洲研究院郑宇等人总结的Alphago原理图

这个图像一存在，这么多幅同样的图像，差不多这个格局一出现的时候，这个图像计算机快速一比对，就知道从概率上，下一步棋往哪儿走。

可以预测，在围棋里面你再怎么样，人类已经不可能赢过计算机了。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：菌心说 > 《AI、人工智能、神经网络、深度学习》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多