分享

如果用两个阿尔法狗彼此对决,胜负会如何呢?

 pgl147258 2017-09-22

网上已经公布了阿尔法狗之间对弈的50盘棋谱,还有大量的棋谱没有公开,但仅仅从这50盘棋来看,就已经是惊世骇俗了。很多招法别说我们这个岁数的棋手没见过,就是柯洁他们,也不敢说见过吧?实在太不可理喻了!就像这盘棋,白10在角上碰了后又跑到下边盘碰一下,白12、白14放置一边又不继续了,然后又转到右下角白16扳,如果阿尔法狗是人类的话,很想问问他,这两处的着法之间有必然性吗?如果有必然性,那需要多少个变化图讲清楚这样下的内在必然性。

我们也相信,阿尔法狗的后台程序里肯定已经将这两处变化都算得清清楚楚,人工智能不会凭感觉下棋,那是人类之所长。阿尔法狗的每手棋就基于形势判断和详细计算,因此看似匪夷所思的着法在阿尔法狗那里,应该是经过了海量的计算后,得出的最佳结论,问题是,这样的实战着法估计就算过了一百年,人类也没法接受。

人类如果能洞悉阿尔法狗下棋的思维模式,那么就能破译其着法的必然性所在,否则,人类与阿尔法狗之间没有胜负可言,它已经破译了人类的所有思路、着法,而人类却对它几乎一无所知,据说它还可以不断地升级,现在的AlphaGo2.0版要让2016年AlphaGo1.0版三个子,这实在是太可怕了!围棋竟然如此深奥,人工智能竟然如此先进。从上边棋谱来看,阿尔法狗跟人下的还是围棋,它们相互之间进行的只能说是来自遥远未来的棋局。

其实,你提的问题,本身就是阿尔法狗深度学习的秘密!

请仔细看上图,AlphaGo通过自我对弈,产生一个输赢的结果;然后再以此为基础,再自我对弈;一直循环往反复。通过大量的自我对弈棋局,最终提升预测水平,也就是围棋水平。

人类棋手,穷其一生,对弈局数最多也只有数万而已。

但阿尔法狗就不一样了,通过分布式电脑的顶尖运行速度,它短时间内就可以产生百万甚至千万的自我对弈局数,并且随着时间的增长,它可以持续通过自我对弈提升自己的水平!

所以,你的问题答案就很明白了:

两个版本完全一致的阿尔法狗对弈的话,肯定会有赢有输,输赢会非常接近!

如果版本不一致的两个阿尔法狗对弈的话,肯定是后期版本的赢的机率大!这是它深度学习的原理决定的!

一句话:你的两个阿尔法狗对弈的问题,它其实已经进行了上千万甚至上亿次了!

两个阿尔法狗下棋,比一个人自己拿黑白棋对下(智力较量),或者左右手互搏(体力较量)都没有悬念,即:如果不贴目的话,黑棋必胜。如果贴目的话,就很复杂了,后面会提到 。

二狗相争,不贴目执黑必胜的道理很简单:两个一模一样的智能机器,每一步棋都经过海量计算和智能学习比对,因此“不会犯错”是必须的,既然在“同级别智能状态”下不犯错,那么,先行获胜岂不是必然事件吗?

阿尔法狗落子如飞,是其应用了新算法中的“走子网络”,智能强度与载体的GPU性能息息相关。懂电脑的人都知道GPU是图形处理器,主要负责图形计算。而图形计算和普通的CPU数据计算不同,是一种图形匹配技术。这是阿尔法狗的一个技术关键。

阿尔法狗是进行围棋图形大数据检索,即调用自己的围棋图形的的数据,通过图形匹配,找出当前围棋图形下的近似解,并以胜率进行选择。这个“当前围棋图形”,应该是基于整个棋盘的。阿尔法狗的棋形数据库应该是经过长时间深度学习后融入其的神经网络的一部分,相当于人的记忆部分。其与人类不同的是,这个记忆非但不会磨灭,而且通过学习,对弈,还在不断自我增强,爆炸式增强,并且两狗都一样,同步增强。

这倒是扯出一个新问题,执黑先行的“便宜”到底有多大?这才是决定狗狗谁胜谁负的关键:既然技术无瑕疵,那么先行的优势和其应该付出的代价(贴目)就至关重要了。

不要以为这是废话,黄龙士,本因坊秀哉,木谷实,坂田荣男,赵治勋,李昌镐,李世乭,柯洁等等这些曾经各领风骚数百天数千天的棋坛霸主,甚至,在不贴目时代的棋圣吴清源,十二岁即崭露头角,翌年在国内无敌手,二十岁创围棋新布局法,在日期间尽败日本高手,被誉为古今第一人的吴清源,也没有做到不贴目执黑全胜。

历史上从不贴目(互先),然后贴三目五目半……六目半七目半的都存在过。现行的日本韩国贴六目半,中国以及台湾应氏杯等价于贴七目半。到底多少合适?恐怕没人能说清!

无论如何,从三十年代到迄今为止的发展趋势,贴目负担是越来越重。棋盘空着的时候一手棋(黑方先手的优势)的价值有多少?这在职业棋手中也众说纷纭。陈祖德评棋,认为一手棋有十目价值;而沈果孙七段则认为有贴目的二倍也即是十五目左右,当然还有各种各样更小更大的说法……有趣的是,贴目规则的原理是先手优势。但是贴目多少的指定更多的是大数据下的统计胜率,而非像理论家这样去想先手价值与次一手的价值差。

只有明确了这个贴目的最合理数字,才能真正知道一盘棋定胜负的“二狗相争”是谁能笑到最后,这个真的真的很关键。

“想一万年也不会想明白啊”……木谷实语。

据说阿尔法狗学习能力,推演能力都很强,而且更要命的就是理论上计算机不会犯错误!!!!!这个好像就是破坏游戏规则嘛………但是两只狗狗🐶一起对战,一起互相学习,一起不犯错的话,我觉得…………………………………!……………………………………………………………………………………电量大的那只能赢!!!!因为阿尔法狗好像很费电!!!!每落下一颗棋子据说电费3000美元!!!所以…………电量大的那只能赢…………😂



围棋与其说计算得出最优解,还不如说是在众多选择中排除恶手。水平高的就能正确地排除更多的错误选择。谁的效率更好,谁的准确度越好,谁的胜率就越大。

面对一个局面,外行、爱好者和初入门新手可能只能排除一部门选择,留下十几种深入思考,而九段高手可能非常熟练地用更短的时间就留下两三种变化进而分析。这就能解释为什么刚入段的小朋友为什么三两步摆定式就能把十多年野棋经验的业务选手弄得手足无措。也能解释为什么大高手错算一步就导致大龙遭屠。

再进一步,我认为人工智能的优势有两个。一是计算深度。这个不用过多解释。在明确规则限制下,计算机可以快速演算模拟接近于穷尽的所有变化。再辅以选择策略,可以大幅提升效率和准确度。夸张地说,人工智能可以用普通人一生的精力去计算一步棋,人是做不到的。二是人工智能几乎不受情绪波动的干扰。胜不骄败不馁。不会因为一处得失而影响后续行棋。不会因为前一天和旁人争执而影响现在的对局。更不会因为性格而产生爱杀伐或者爱造势的棋路派别。简而言之就是务实到可怕。

最后就是总结,我感觉两个完全一样的程序在运算,结果必然是一样的。但毕竟有先后手的区别,所以每一步面对的实际上是不同的局面。因此,影响结局的会是规则。也就是让子数量会影响判断依据。现在的让子标准也是估算出来的,是否准确有待商榷。

引申一下,是否可以考虑让人工智能海量对战,调整让子标准。让胜负更加客观公正。

谢邀。我觉得这个问题有点无聊。因为柯洁与阿尔法狗大战,包括以前阿尔法狗同韩国李世石大战,目的都是为了检验人工智能与人类棋手的水平高低,如果换成两个阿尔法狗对战,不论输赢抑或打平,那都毫无意义,不能说明人工智能超过人类。举办阿尔法狗与世界顶尖围棋手大赛,目的是为了更好研发人工智能服务的。

两个阿尔法狗彼此对决,双方刚开始分别知道对方是怎么运算的,那么A每下一步棋,都会推演B怎么下,然后开始设计各种阴谋诡计。

同时B也会这么干。

经过无数次对弈之后,阿尔法go-A和B会成为我们都不认识的集所有阴谋诡计之大全的超级智能机器人,从甩李世石十条街,变成甩1000000000条街。这种“狗”以后会把我们虐哭。

而且因为,机器学习也有随机性,优势会积累放大,一年之后,阿尔法go-A或B会变得实力悬殊,一年后,两者的对弈状态是,要么是A一直碾压B,要么是B一直碾压A。

谢谢邀请!对围棋了解不多,但对这件事儿还是有所了解,一方面说明了人工智能在某些方面要强于人脑,另一方面,人脑思考能力还是有局限性,而人工智能会因人类科技的发展越来越强!

如您所说,如果是两个机器人比,我感觉会不相上下,打成平局,毕竟人工智能是人创造出来的,各种程序也是由人设计的。但这种可比性我感觉毫无意义,结果也证明不了什么,只能是看看稀罕!

依您提出的问题,我想反问一下:人工智能越来越进步的同时人类会不会退化?

狗狗本来就是这么下棋的,它的学习就是自我对弈,包括在比赛时,它的每一步用时也是都花在自我对弈上,它在每一步的用时中已经不知道下了多少盘自我对弈了,并且从中选出一个胜率最高的落子。

所以两个一样的狗对弈,如果基础条件相同,即自我学习的时间相同,那么他们的胜负应该是各半的。其实真正有意义的是不同的狗之间在同样的学习时间后对弈,可以看不同算法的优劣。

两个阿法狗彼此对决的棋谱已经公开了五十局,在deepmind的网站可以下载,黑棋贴七目半的负担略重,白棋的胜率较高一点点。从阿法狗的自我对决的招法来看,如果说人类棋手的战斗是一场平面战争,那么阿法狗的战斗就是一场海陆空全方位的立体战争。我认为阿法狗比人类最强的棋手也要高出两子。假如谷歌公司继续提升算法,阿法狗会变得更强,将无限接近于围棋上帝。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多