AI称霸围棋时我保持沉默，因为我是DotA玩家…然而现在DotA也陷落了

王天神 2017-08-14

展开全文

当 AI 称霸国际象棋时我保持沉默，因为我不是象棋手；当 AI 称霸围棋时我保持沉默，因为我不是围棋手；当 AI 进入《星际争霸》时我保持沉默，因为我不是星际玩家；当 AI 战胜 DotA2 世界冠军 Dendi 时，作为一个 DotA 玩家，我终于跪下了。

DotA2 年度最重要的赛事 The International DOTA2 Championships（简称 Ti）每年都会有彩蛋使全球玩家眼前一亮，这两年尤其贴近最新科技。比如去年的 Ti 6 上，DotA2 官方 V 社就在比赛现场采用了类AR的全息投影，至少从转播画面来看，可以说是非常狂拽酷炫吊炸天了。

而到了今年，全世界都在谈论、研究时下最流行的人工智能，Google 用 AlphaGo 这个科技概念普及到了几乎所有领域。DotA2 今年的比赛彩蛋也与人工智能（AI）直接相关。

在美西时间 8 月 11 日的正式比赛结束后，表演项目开始了。

首先，在现场一片欢呼声中，DotA2 的第一个战队和 Solo 双料世界冠军获得者，传奇中单 Dendi 身着拳击手的服装入场。当 Dendi 走到赛场中央，所有人都在好奇 Dendi 的对手将会是谁时，主持人突然出人意料地宣布，Dendi 的对手是一段程序，来自 OpenAI。

中央被高高举起的U盘里就是 OpenAI 的程序，身着白色拳击手袍的就是 Dendi。

OpenAI是一家不以盈利为目的的人工智能研究公司，由“钢铁侠”Elon Musk 联合 Y Combinator 的 CEO Sam Altman、LinkedIn 创始人 Reid Hoffman、畅销书《从零到一》的作者 Peter Thiel 等硅谷科技界的大佬们发起，背景即使在人工智能界也是“又红又专”。

尽管 Dendi 获得世界冠军已经是 6 年前的事，并且今年也没有进入正赛圈，但作为乌克兰老司机，Dendi 的个人实力仍然毋庸置疑，任何职业中单选手在面对 Dendi 时必须要全力以赴。

但是，另一边的 OpenAI 也丝毫不弱。在赛场播放的宣传片中可以看到，OpenAI 在此之前已经战胜了现役的 Arteezy、SumaiL 等多个世界冠军级的 Solo 选手，它与我们在 DotA2 里常见的电脑 Bot 机器人按程序按部就班地供玩家凌虐完全不同。包括 OpenAI CTO Greg Brockman 在内的核心团队成员也来到了现场。

被 OpenAI 击败时不敢相信的 SumaiL（右）。

比赛的规则设定是，不能出瓶子、不能出凝魂之泪、不能出灵魂之戒、不能使用神坛，并且没有中立生物、没有神符，双方选手都使用同一个英雄影魔（Shadow Fiend）。这些规则减少了游戏中的随机性，选手实力的因素将更加重要。

比赛开始，Dendi（天辉方，绿色）与 OpenAI（夜魇方，红色）的出门装备完全一样，这倒没什么。开始出兵了，DotA2 的 Solo 比赛第一项要考验的就是双方对己方小兵的卡位能力，卡兵卡得位置好，对线期的补刀就会比较顺手。但是，在这一项技能中，OpenAI 就小胜一筹。

因为卡兵更加出色，OpenAI 能够在己方高地补刀。

随后，双方开始你来我往的补刀。但基本上很明显地，Dendi 一直被 OpenAI 按在地上摩擦，OpenAI 的补刀数一直领先于 Dendi。每次对点，OpenAI 也总能消耗掉 Dendi 更多生命值。并且，OpenAI 总能占据最有利的位置，让 Dendi 很难受。

Dendi 被消耗掉了更多生命值，吃下了第一个大药，但刚回复了四分之一左右，恢复效果就被 OpenAI 技能打断了。

OpenAI 对距离和时机的把控非常精准，总能以极限距离消耗或攻击到 Dendi，这也正是电脑程序的优势所在。但实际上根据 Brockman 的说法，OpenAI 在 DotA2 里的每分钟操作数仅相当于人类玩家的平均水平。

但同时令人没想到的是，OpenAI 会像人类高手一样，使用一些唬骗的假动作（释放技能，在技能前摇的短时间内按 S 键停止释放），干扰对手的判断力。这种欺骗性的“花招”技能一直被认为是人类面对人工智能时最大的优势，不过显然，OpenAI 至少在 DotA2 里也已经学会了。

“在 Dota 中取胜需要玩家基于对对手的直觉而采取相应操作。在上面的视频中你可以看到我们的 bot 已经学会了——完全通过自我对弈——预测其他玩家的下一步操作，在陌生的环境中随机应变，以及通过对其他玩家的友军施加影响而帮助前者成功。”Brockman 在 OpenAI 官方博客里写道。

随着细微的优势积累越来越大，OpenAI 最终战胜了 Dendi。

OpenAI 拿下了第一滴血，随后的比赛也失去了悬念。此时，OpenAI 的补刀数是 27/10，Dendi 则只有11/2。

此前，AlphaGo 战胜李世乭、柯杰称霸围棋项目时，还有相当多的电竞玩家认为，DotA2 或 LOL 这类游戏，即时性、随机性、策略性的特点，仍然是 AI 程序无法轻易模拟的。而围棋那种回合制的模式，拼计算可能性的时间快慢，人类当然会比不上 AI。几个月之前，开发 AlphaGo 的人工智能公司 DeepMind 选择了《星际争霸 2》作为围棋之后的下一个测试对象。

但事实证明，至少在 DotA2 的 1 对 1 的比赛上，OpenAI 可以说已经不输人类选手。

Brockman 说，OpenAI 下一步是明年将在 DotA2 的 5 对 5 团队模式中作战。届时，OpenAI 将会发布该 bot，从而人人可以与其对决，并且 V 社将为击败该 bot 的第一个人类玩家提供游戏币奖励。

赛后，Elon Musk 在推特上发布了这条消息，“OpenAI 第一次打败了世界上最好的电竞选手。电竞比象棋、围棋这样的传统棋盘游戏要复杂得多。”