分享

“老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

 耽读斋 2017-10-23

文章来源:科普中国微信公众号

本文审稿:李长亮,中科院自动化研究所博士

昨天人工智能界又发生了一件大事儿!

开发了AlphaGo的谷歌DeepMind团队在知名期刊《Nature》上发表了一篇论文,宣布其发布了新一代AI程序——AlphaGo Zero,并以100:0的成绩完败前代版本。

 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

我们都知道,AlphaGo Master刚刚在5个月前战胜了人类世界实时排名第一的棋手柯杰,一时间人类如梦中惊醒般,在感叹AI迅猛的成长速度的同时,也对其未来的发展多了一丝隐忧。

而Master的王座地位才刚坐稳没多久,Zero便横空出世成为了新一届的围棋冠军。并且从“萌新”成长为“大佬”仅用了短短40天的时间,那么这40天里究竟发生了什么?Zero又比前代AlphaGo版本进步在何处? “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

AI脱离人类自学成才

DeepMind团队在论文中表示,他们通过一种新的“强化学习”形式,将更新后的神经网络和搜索算法重组,创造出了AlphaGo Zero。

前代AlphaGo版本都是以人类棋谱作为训练素材,通过分析人类的下棋规律进而预测出对方的落子位置,从而找到自己的最佳落子方式,这往往使AI局限于人类的现有的围棋理论中。

 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

而Zero首次实现了脱离了人类经验的自我学习成长。就如它的名字一样,它以人设规则为限定条件进行优化学习,但是不依靠人类经验知识。通过“左右互搏”,不停地能根据训练结果进一步优化其算法,并自行创造崭新的策略。

 3天时间,Zero便打赢了当初击败李世石的 AlphaGo Lee;到第21天,Zero的排位分数已和曾以30击败柯洁Master相差无几;经过40天的训练,Zero压倒性战胜了Maste,胜率达到 90%

连棋手柯杰都在微博发出感慨:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”

 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗! 

人类是否会受到AI威胁

科学技术的发展是一把双刃剑,AI在给我们带来便利的同时,也有可能对人类的生存产生威胁。包括霍金、马斯克在内的多位科技界名人都曾表示,人类不应低估人工智能发展可能带来的严重后果。 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

 在人机大战中柯杰输给AlphaGo Master之后,AI威胁论又一次成为网友讨论的热点。

人们不禁担忧,在AI发展到足够高级的阶段,是否会反过来统治人类。

 若以目前AI的发展速度作为参考,出现这种忧虑也并不能算是杞人忧天。

从这一次AlphaGo Zero的自我学习过程来看,和人类最初发明围棋的过程非常相像——没有前人的经验,完全按照规则来落子。

不过区别是,人类花了上千年才取得的经验成果,AI用短短几天的时间就得到了。

 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

美国的两位棋手对Zero的棋局做出点评:

它的开局和收官与专业棋手的下法并无区别,它按照基本原则,与人类的走法基本一致,这说明人类几千年的智慧结晶,看起来并非全错。

但是,Zero中盘的有些走法却很诡异。 “老顽童”阿尔法元,用一招“左右互搏”自学成才,完胜阿尔法狗!

纵观人工智能的发展史,AI仅用不到一百年的时间,就完成了从零到接近人类智慧水平的进化,这已远远超过的人类自身的进化速度。

当有一天,AI的学习能力已经远远高于人类的时候,在这极大的差距下,人类想阻止人工智能的想法已经变得不可能,就像一只蚂蚁永远无法阻止我们。

 但我们无须对因此而恐慌,AlphaGo Zero固然已经无人能敌,但它终究也只局限于会下围棋而已。如同汽车远远比人跑的快,却用来作为人类的交通工具。

 

科技发展的本质是为人类造福,在发展人工智能技术的同时,不要忽视其可能存在的风险,才能让它更好地为我们的生活服务。


{ 本博客转载文章均来自网络媒体,我们尊重原创作者的版权,转载时将标明文章出处,并保留转载文章在原刊载媒体上的署名形式和版权声明(如有),但对其转载文章的版权归属和权利瑕疵情况不承担核实责任。如任何单位或个人认为转载的文章涉嫌侵犯其合法权益,请及时联系我们删除文章。}

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多