分享

AI攻克Dota 2!5v5团战首次击败人类,已超90%人类玩家

 汐钰文艺范 2018-06-30


当深蓝、AlphaGo先后在国际象棋、围棋界杀遍强手孤独求败时,很多人觉得,人类在决策类游戏中已经无法抵挡AI的挑战了。不过,至少在电子竞技,尤其是多人在线战术竞技游戏(MOBA,例如Dota 2)这种需要团队配合的策略类游戏中,AI尚未攻克人类的堡垒。


6月25日,由埃隆·马斯克和Sam Altman创立的非营利AI研究公司OpenAI宣布,他们在该领域取得重要突破:通过强化学习训练出的OpenAI Five系统,在Dota 2的5v5团战中击败了业余高手。接下来,他们的目标是在今年的Dota 2界最重要赛事——The International大赛上挑战顶级职业战队。



来源 | OpenAI、the Verge等

编译 | 吴非 



视频来源:OpenAI


挑战机器协作难题


OpenAI公司的首席技术官Greg Brockman将其称作里程碑式的突破:“这项工作在实际应用中意义重大,当你能够模拟某个问题,你就能无障碍地将其应用于更大的场景中。”


去年8月,OpenAI就在Dota 2领域一展身手。他们设计的1v1 bot系统在1v1对战中击败了顶级职业高手。当然,相比于团战,1v1对战的实现要简单得多。作为一款MOBA,Dota 2的难点在于队友间的配合:双方各由五名队员组成,每人操控一位“英雄”,也就是游戏角色。在一张地图上,团队通过分工合作推倒对方的基地,从而赢得胜利。而团队协作,也是AI系统所面临的一项前所未有的挑战。


OpenAI团队的部分成员。去年,正是用这台笔记本,AI在1v1对战中战胜了顶级职业选手。


人工智能之所以难以攻克Dota 2等MOBA类游戏,除了需要系统间的团队协作,还因为这类游戏需要长期的决策——在45分钟的游戏时间内,玩家需要进行上万次操作,而其中一些决策的影响将贯穿全场;相比于棋类游戏的信息透明,每位玩家能够看到的信息,尤其是对方的信息是有限的;在游戏中,系统在一瞬间需要处理2万个数据点,并从1000种不同的操作中作出选择,远远超过棋类比赛中的数量。


面对这一系列难题,在1v1 bot的基础上,OpenAI的研究人员开发出了OpenAI Five算法。研究人员通过强化学习的方法,让AI系统在虚拟环境中,通过不断的自我对战进行学习。它们每天的自我对战量十分惊人,相当于180年的游戏量。也就是说,AI一天的训练量,相当于最具经验的职业玩家一生训练量的数十倍。


训练过程用到了256个GPU和128,000个CPU内核,与去年的1v1 bot系统相比有明显提升。每位英雄使用自己的长短期记忆网络,整个过程没有用到人类的数据。“最初几小时内,AI只会随机地在地图上乱走。但逐渐地,它能够掌握一些基本机能。”Brockman说。


Greg Brockman



战胜业余高手


AI系统拥有令人类玩家羡慕的特质。它的反应速度更快,只需80毫秒,比人类玩家快;每分钟可以完成150~170次操作,与人类的顶尖职业玩家相当,并且不会错失点击。AI的优势还体现在,它们能够随时准确获取角色间的距离、装备栏、英雄的健康状况等重要信息,并应用这些数据选择最佳策略。相比之下,人类玩家只能手动检查,或是根据经验及本能进行判断。


从今年5月起,OpenAI Five先后与五支水平不等的业余及半职业队伍进行了5v5团战较量,结果令研究团队感到欣喜:即使在与训练有素的半职业战队的对抗中,AI也在三场比赛中赢得两场胜利。而在与OpenAI员工战队的对战中,AI更是取得了完胜。OpenAI Five的平均天梯分数超过4200分。



值得一提的是,OpenAI Five在实战中展现出强大的团队意识。“为了最终的胜利,它们懂得牺牲一条线路或是一位英雄。”Brockman说道。AI的表现还得到了人类队友的称赞。在一轮测试中,一位人类玩家加入了AI战队。他说,四位AI队友给了他大量支持:“无论我想要什么,这些机器都能实现。”


赢得该系列测试后,研究团队将目标投向了更为强劲的对手。他们计划继续优化系统,并在今年7月28日的The International赛场上,与顶级职业战队进行较量。



更广阔的应用场景


虽然OpenAI Five已经在5v5实战中取得不错的成绩,但需要强调的是,目前其适用条件还较为有限。Dota 2玩家都知道,他们需要从115个英雄中选择5个英雄,但目前OpenAI Five还无法做到这一点,它只能用五位选定的英雄【瘟疫法师(Necrophos)、狙击手(Sniper)、冥界亚龙(Viper)、水晶室女(Crystal Maiden)和巫妖(Lich)】进行对战。不用对AI的英雄选择感到同情,因为人类玩家也被限定使用同样的角色;另外,这次“人机大战”在对战规则上也做了限定:不能插眼、没有肉山、没有隐身能力、不能使用召唤和幻象……如果你对这些名词摸不着头脑,记住,这些多为决策较为困难的操作。


虽然这项研究还有不足之处,在OpenAI团队看来,这项研究的意义远远超出了这款游戏本身。例如,在现实世界中,AI需要对随时发生的情况作出实时反馈,此类能力正是AI在Dota 2比赛中取胜的关键之一,但在回合制的棋类比赛中无法得到训练。此外,Dota 2需要AI在无法获取完整信息的情况下作出决策,这与大量实际应用场景十分相似。能够掌握Dota 2游戏,意味着AI将可能在城市交通系统、物流系统等现实场景中发挥更大的作用。


参考链接:

https://blog./openai-five/

https://www./2018/6/25/17492918/openai-dota-2-bot-ai-five-5v5-matches

https://www./article/2172612-ai-trained-on-3500-years-of-games-finally-beats-humans-at-dota-2/

https://www./2018/06/25/openai-bots-dota-2-the-invitational/


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多