发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
机器之心编辑部
让单个智能体完成尽可能多的任务是 DeepMind 一直以来的研究目标,也被该公司视为迈向通用人工智能的必经之路。去年,DeepMind 推出的 MuZero 在 51 款雅达利游戏中实现了超越人类的表现。时隔数月,DeepMind 在这一方向上更进一步,在 57 款雅达利游戏中全面超越人类,在这一领域尚属首次。
来自: 板桥胡同37号 > 《游戏》
0条评论
发表
请遵守用户 评论公约
DeepMind的人工智能现在可以玩全部57款雅达利游戏,但它还不够万能
DeepMind的人工智能现在可以玩全部57款雅达利游戏,但它还不够万能。由DeepMind开发的Agent57使用相同的深度强化学习算法,即使在以前的...
斯坦福提出无需人类示范的强化学习算法SOORL
斯坦福提出无需人类示范的强化学习算法SOORL.想达到人类学习的速率,斯坦福的研究人员们提出了一种基于目标的策略强化学习方法——SOORL...
DeepMind全能AI:完全自学规则,攻破多款游戏,表现碾压人类!
DeepMind公司在过去几年中陆续开发了AlphaGo、AlphaGo Zero、AlphaZero和MuZero。不像AlphaZero,不知道棋盘规则的MuZero不能预测棋盘的各种可能状态,因此,MuZero需要从零开始,创造自己对棋路的内部...
DeepMind回应一切:AlphaStar两百年相当于人类多长时间?
DeepMind回应一切:AlphaStar两百年相当于人类多长时间?编辑:小芹 元子【新智元导读】昨天DeepMind的AlphaStar横扫星际2职业玩家,项...
除了下棋打游戏,DeepMind开始研究如何让AI像人类大脑一样“预判未来”
除了下棋打游戏,DeepMind开始研究如何让AI像人类大脑一样“预判未来”最近,来自 Google AI 部门的研究团队在《自然·神经系统科学...
地表最强三大星际争霸AI“浅度”剖析 | 智能认知决策 | 算法前沿(31)
地表最强三大星际争霸AI“浅度”剖析 | 智能认知决策 | 算法前沿(31)2018年11月13-17日,在AAAI人工智能与交互式数字娱乐大会 (AI for...
从AlphaGo到AlphaStar:机器是如何思考的?
最终AlphaStar成为第一个打败《星际争霸2》顶级人类职业选手的AI。许多顶级《星际争霸》机器人的开发者都遵循实用主义理念,用能够赢得...
当AI开始“踢脏球”,你还敢信任强化学习吗?
当AI开始“踢脏球”,你还敢信任强化学习吗?如果说数据集被污染会让AI准确率下降,那么强化学习错误训练出的AI有可能将摄像头输入的信...
直接用人类神经元构建AI芯片,这家公司打造的无实体大脑可以玩雅达利游戏
直接用人类神经元构建AI芯片,这家公司打造的无实体大脑可以玩雅达利游戏。近日,一家初创公司竟直接用真正的神经元与计算机芯片相结合...
微信扫码,在手机上查看选中内容