分享

历史性突破!最强人工智能横空出世,自学3天,“新狗”100比0完败“老狗”(人类已无用?)

 生清净心不 2017-10-20



人工智能迎来了一个里程碑!


伦敦当地时间10月18日,谷歌人工智能团队DeepMind公布了最强版AlphaGo(阿法狗) ,代号AlphaGo Zero(阿法元)。


“阿法狗”曾横扫围棋高手,韩国李世石、中国的柯洁等,人类的顶尖高手都是其手下败将。但“阿法元”对阵“阿法狗”的比赛结果是:100 : 0,压倒性优势。


更重要的是,“阿法狗”学习下围棋是从被输入和解析人类棋谱开始的,花几个月的时间,学习三千万棋局,才打败人类;而“阿法元”从零基础起步,一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。通过这种办法,只花了3天时间,自己左右互搏490万棋局,它就成为了顶尖高手!对此,少年天才柯洁甚至感叹,“人类太多余了”。


AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)


不再受人类知识限制,只用4个TPU


“阿法狗”依靠的是多台机器和48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片)。“阿法元”则非常“低碳”,只用到了一台机器和4个TPU,极大地节省了资源。


“阿法元”采用的是新强化学习技术,由于整个对弈过程没有采用人类的数据,因此它的棋路独特,不再拘泥于人类现有的围棋理论。美国的两位棋手对阿法元的棋局做了点评:它的开局和收官和专业棋手的下法并无区别,显示人类几千年的智慧结晶,看起来还是有价值的,但是中盘看起来则非常诡异。这也就是说,人类不会那么下围棋,但“阿法元”独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。计算机走出了自己的路。


所以,采用人类经验的“阿法狗”,实际上可能被人类“误导”。而“阿法元”再次打破了人类经验的神秘感,让人脑中形成的经验也是可以被探测和学习的。并且它已经可以给人类当围棋老师,指导人类思考之前没见过的走法。


人工智能研究长期以来的目标是“创造出在没有人类输入的条件下,在最具挑战性的领域实现超越人类能力的算法。”AlphaGo Zero的成功让这个目标提前实现,标志着人类在人工智能的研究上迈出了一大步。


那么什么是强化学习技术呢?简单地说,强化学习就是让AI从中学习到能够获得最大回报的策略。AlphaGo Zero的强化学习主要包含两个部分,蒙特卡洛树搜索算法与神经网络算法。神经网络算法负责落子,蒙特卡洛树搜索算法负责优化,判断下一步怎样走胜算更好。所以,每走一步,AlphaGo Zero都在进步。


围棋只是开始,“阿法元”未来不可限量


“阿法元”给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战 。尽管才刚刚发展起来,AlphaGo Zero已经走出了通向上述目标的关键一步。但对于希望利用人工智能推动人类社会进步为使命的DeepMind来说,围棋并不是AlphaGo的终极奥义,他们的目标始终是要利用AlphaGo打造通用的、探索宇宙的终极工具。


当然,通用型人工智能能做更多事情。由于“阿法元”能够从一无所知实现自学成才,其天赋可以在诸多现实问题上派上用场,DeepMind看到了利用人工智能技术改变人类命运的突破可能。


“阿法元”向人们展示了即使不用人类的数据,人工智能也能够取得进步。所以,大数据的重要性进一步被削弱。目前深度学习需要大量数据,而数据的获得成本高昂且难度十分大。在很多领域,人类数据,尤其是专家数据都不是太贵就是根本无法获得,但有了“阿法元”这项技术后,数据问题的困扰将大大减轻,人类今后将有可能解决更大的挑战,给人类生活带来根本性的变化。比如,将“阿法元”技术应用到治疗像老年痴呆症这样重大的健康问题上的话,那么在几周内,就能找到治愈人类需要花费几百年时间才能找到的疗法。


DeepMind首席执行官Demis Hassabis透露,已运用这个技术解决实际生活中的许多问题。比如预测蛋白质分子的形状,有望成为药物发明的一大突破;还可以设计新材料和进行气候建模。他们目前还正在积极与英国医疗机构和电力能源部门合作,提高看病效率和能源效率。


美国密歇根大学人工智能实验室主任Satinder Singh表示:“阿法元”并非任何结束的开始,因为人工智能和人甚至动物相比,所知所能依然极端有限。同时,在未来发展中,我们究竟应该如何看待人类经验的作用;而机器经验与人类经验有很大差别,我们又该如何去选择和利用,这些都是需要考虑的问题。


以下为DeepMind David Silver 博士专访视频,中文字幕由Nature上海办公室制作:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多