分享

AI称霸围棋时我保持沉默,因为我是DotA玩家…然而现在DotA也陷落了

 王天神 2017-08-14

当 AI 称霸国际象棋时我保持沉默,因为我不是象棋手;当 AI 称霸围棋时我保持沉默,因为我不是围棋手;当 AI 进入《星际争霸》时我保持沉默,因为我不是星际玩家;当 AI 战胜 DotA2 世界冠军 Dendi 时,作为一个 DotA 玩家,我终于跪下了。

DotA2 年度最重要的赛事 The International DOTA2 Championships(简称 Ti)每年都会有彩蛋使全球玩家眼前一亮,这两年尤其贴近最新科技。比如去年的 Ti 6 上,DotA2 官方 V 社就在比赛现场采用了类AR的全息投影,至少从转播画面来看,可以说是非常狂拽酷炫吊炸天了。

而到了今年,全世界都在谈论、研究时下最流行的人工智能,Google 用 AlphaGo 这个科技概念普及到了几乎所有领域。DotA2 今年的比赛彩蛋也与人工智能(AI)直接相关。

在美西时间 8 月 11 日的正式比赛结束后,表演项目开始了。

首先,在现场一片欢呼声中,DotA2 的第一个战队和 Solo 双料世界冠军获得者,传奇中单 Dendi 身着拳击手的服装入场。当 Dendi 走到赛场中央,所有人都在好奇 Dendi 的对手将会是谁时,主持人突然出人意料地宣布,Dendi 的对手是一段程序,来自 OpenAI。

中央被高高举起的U盘里就是 OpenAI 的程序,身着白色拳击手袍的就是 Dendi。

OpenAI是一家不以盈利为目的的人工智能研究公司,由“钢铁侠”Elon Musk 联合 Y Combinator 的 CEO Sam Altman、LinkedIn 创始人 Reid Hoffman、畅销书《从零到一》的作者 Peter Thiel 等硅谷科技界的大佬们发起,背景即使在人工智能界也是“又红又专”。

尽管 Dendi 获得世界冠军已经是 6 年前的事,并且今年也没有进入正赛圈,但作为乌克兰老司机,Dendi 的个人实力仍然毋庸置疑,任何职业中单选手在面对 Dendi 时必须要全力以赴。

但是,另一边的 OpenAI 也丝毫不弱。在赛场播放的宣传片中可以看到,OpenAI 在此之前已经战胜了现役的 Arteezy、SumaiL 等多个世界冠军级的 Solo 选手,它与我们在 DotA2 里常见的电脑 Bot 机器人按程序按部就班地供玩家凌虐完全不同。包括 OpenAI CTO Greg Brockman 在内的核心团队成员也来到了现场。

被 OpenAI 击败时不敢相信的 SumaiL(右)。

比赛的规则设定是,不能出瓶子、不能出凝魂之泪、不能出灵魂之戒、不能使用神坛,并且没有中立生物、没有神符,双方选手都使用同一个英雄影魔(Shadow Fiend)。这些规则减少了游戏中的随机性,选手实力的因素将更加重要。

比赛开始,Dendi(天辉方,绿色)与 OpenAI(夜魇方,红色) 的出门装备完全一样,这倒没什么。开始出兵了,DotA2 的 Solo 比赛第一项要考验的就是双方对己方小兵的卡位能力,卡兵卡得位置好,对线期的补刀就会比较顺手。但是,在这一项技能中,OpenAI 就小胜一筹。

因为卡兵更加出色,OpenAI 能够在己方高地补刀。

随后,双方开始你来我往的补刀。但基本上很明显地,Dendi 一直被 OpenAI 按在地上摩擦,OpenAI 的补刀数一直领先于 Dendi。每次对点,OpenAI 也总能消耗掉 Dendi 更多生命值。并且,OpenAI 总能占据最有利的位置,让 Dendi 很难受。

Dendi 被消耗掉了更多生命值,吃下了第一个大药,但刚回复了四分之一左右,恢复效果就被 OpenAI 技能打断了。

OpenAI 对距离和时机的把控非常精准,总能以极限距离消耗或攻击到 Dendi,这也正是电脑程序的优势所在。但实际上根据 Brockman 的说法,OpenAI 在 DotA2 里的每分钟操作数仅相当于人类玩家的平均水平。

但同时令人没想到的是,OpenAI 会像人类高手一样,使用一些唬骗的假动作(释放技能,在技能前摇的短时间内按 S 键停止释放),干扰对手的判断力。这种欺骗性的“花招”技能一直被认为是人类面对人工智能时最大的优势,不过显然,OpenAI 至少在 DotA2 里也已经学会了。

“在 Dota 中取胜需要玩家基于对对手的直觉而采取相应操作。在上面的视频中你可以看到我们的 bot 已经学会了——完全通过自我对弈——预测其他玩家的下一步操作,在陌生的环境中随机应变,以及通过对其他玩家的友军施加影响而帮助前者成功。”Brockman 在 OpenAI 官方博客里写道。

随着细微的优势积累越来越大,OpenAI 最终战胜了 Dendi。

OpenAI 拿下了第一滴血,随后的比赛也失去了悬念。此时,OpenAI 的补刀数是 27/10,Dendi 则只有11/2。

此前,AlphaGo 战胜李世乭、柯杰称霸围棋项目时,还有相当多的电竞玩家认为,DotA2 或 LOL 这类游戏,即时性、随机性、策略性的特点,仍然是 AI 程序无法轻易模拟的。而围棋那种回合制的模式,拼计算可能性的时间快慢,人类当然会比不上 AI。几个月之前,开发 AlphaGo 的人工智能公司 DeepMind 选择了《星际争霸 2》作为围棋之后的下一个测试对象。

但事实证明,至少在 DotA2 的 1 对 1 的比赛上,OpenAI 可以说已经不输人类选手。

Brockman 说,OpenAI 下一步是明年将在 DotA2 的 5 对 5 团队模式中作战。届时,OpenAI 将会发布该 bot,从而人人可以与其对决,并且 V 社将为击败该 bot 的第一个人类玩家提供游戏币奖励。

赛后,Elon Musk 在推特上发布了这条消息,“OpenAI 第一次打败了世界上最好的电竞选手。电竞比象棋、围棋这样的传统棋盘游戏要复杂得多。”

中国电竞选手们不知道认不认可这个说法。然而,如果 OpenAI 明年真的做出了可以参加 5 VS 5 比赛的 AI,并且规则与人类比赛规则相同,AI 可以与人类作对手,也可以与人类作队友…那我真的不知道这个游戏该怎么玩了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多