分享

今天,阿法狗被打败了!然而, 柯洁回应:人类多余了

 Tidley9012 2018-04-09

    本文首发于微信公众号:品钛客。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

 
    今天,那个打败人类围棋的阿法狗(AlphaGo)终于被KO了。

  但打败他的并不是人类,而是新诞生的人工智能——AlphaGo Zero!

  10月19日,谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo版本,代号AlphaGo Zero。

  Zero经过短短三天的自我训练之后,就轻松击败了与李世乭对战的那版 AlphaGo,而且是100 场对决无一败绩。

  听到这一消息后,中国棋手柯洁在微博回应称:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”

  DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯·哈萨比斯(Demis Hassabis)和AlphaGo团队负责人大卫·席尔瓦(Dave Sliver) 等人同时在官方博客上发表文章,详解最强版本阿尔法狗是如何炼成的,与前代有何不同。

丹米斯·哈萨比斯
丹米斯·哈萨比斯

  与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。

  通过全新的强化学习(reinforcement learning)方式,AlphaGo Zero 真正做到“无师自通”。整套 AI 系统始于一个对围棋一无所知的神经网络,通过一套强大的搜索引擎来与自己对弈。这个原本一片空白的神经网络与自己对弈的局数越多,就越能准确的调整与预测下一步棋的走法,对围棋的掌握程度也越来越高。

这套升级过的神经网络通过与搜索算法的再次整合,最终形成了全新的、更强大的 AlphaGo Zero,并不停重复这一过程。在每一个迭代版本中,系统的性能都有小的提升,自我对弈的质量也越来越高,因此形成了一个越来越精准的神经网络,这就是空前强大的 AlphaGo Zero。
  这套升级过的神经网络通过与搜索算法的再次整合,最终形成了全新的、更强大的 AlphaGo Zero,并不停重复这一过程。在每一个迭代版本中,系统的性能都有小的提升,自我对弈的质量也越来越高,因此形成了一个越来越精准的神经网络,这就是空前强大的 AlphaGo Zero。

  这种技术比此前所有版本的AlphaGo都更为强大。这是因为,它不再受到人类知识的限制,而能够从婴儿般的白纸状态,直接向世界上最强大的棋手——AlphaGo本身学起。

  AlphaGo不仅关乎棋盘游戏

  毫无疑问,AlphaGo Zero在围棋世界标志着颠覆性进步,但是,它对世界其他领域有什么潜在影响?麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究生尼克·海因斯(Nick Hynes)认为,在一段时间内,它只是一种专门工具,不太可能对我们的日常生活造成冲击。

  正如海因斯所承认的,这一最新突破并不意味着技术奇点(即在未来某个假定时间,超过人类的机器智能实现爆炸性增长)即将来临,但它应该让人们停下思想的脚步。

  一旦我们教一种系统学会游戏规则或某一现实世界问题的强制规定,增强学习的力量将使其可以简单地按下开始按钮,让系统做余下工作。然后,它将找出在这项任务中取得成功的最佳方法,设计出超越人类能力、甚至可能是人类理解能力的解决方案和战略。

  DeepMind研究人员在其论文中所总结道:“我们的研究结果全面展示了即使在最具挑战性的领域,纯粹的强化学习方法也是完全可行的:不借助人类的示范或指导,不用学习超越基本规则的知识,就可以培养出超人。”

  事实上,现在人类玩家已经无法在国际象棋、围棋等游戏中独占鳌头,可以说,我们已经进入了超级智能的时代。

  哈萨比斯希望在10年内,人工智能可以在解决科学、医药或其他领域的重要问题中发挥重大作用。“我希望这些算法和未来的版本能够成为我们向科学和医学前沿推进的常规工作伙伴,”他说。“也许未来所有产品的设计和发现都离不开这些算法,它们将与聪明的人类一起工作。”

     文章来源:微信公众号品钛客

(责任编辑:岳权利 )

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多