靠着两个不公平优势，AI 玩《星际争霸》碾压了人类

发布时间：2019-02-20 22:48:47 所属栏目：教程来源：36氪

导读：编者按：继在最复杂的棋类游戏击败了人类世界冠军之后，Google的DeepMind又瞄准了最复杂的视频游戏——实时策略游戏《星际争霸》。经过短短两周的训练之后，前不久，其AI AlphaStar以两个5：0分别击败了两位顶级的人类职业玩家，令世人再度感到震惊。不过

比方说，如果人类玩家只引导一个游戏单位执行一项重要任务的话，他会沿着该游戏单位的当前轨迹发布一系列的“移动”命令。每一条命令几乎不会改变该单位的路径，但是如果人类玩家已经选择了该单位的话，他几乎不需要花时间再去点击一次。但这些命令严格来说大部分都不是必要的；而像AlphaStar这样的AI轻易就能找出该单位的最优路线，然后发布一系列数量要少得多的一点命令就能取得同样的结果。

所以限制AI可以执行的动作的裸数量为典型人类的水平未必意味着有意义的动作数量具有可比性。

而且AlphaStar在最初游戏中使用的API赋予了它对整个战场一个上帝视角（尽管只有在AlphaStar的一支部队范围内的一部分战场的）。而如果人类玩家想要在两个不同的地方采取行动的话，他首先需要将摄像头移到新的位置。

强迫AlphaStar使用摄像头可让游戏公平一点

值得称道的是，DeepMind意识到了这个问题。所以在回放部分AlphaZero背靠背5：0击败人类职业玩家的比赛之后，该公司筹划了一场最后一场AlphaStar跟Komincz直播比赛。这场比赛使用了新版的AlphaStar，这个版本被施加了一个重要的限制：它将被迫采用摄像头视图，从而模拟人类星际争霸界面的限制。新的节目只允许AlphaStar一次看到一小部分战场，而且只能发命令给处在当前视野内的游戏单位。

DeepMind有几周的时间去训练这一新版本，但跟前个月与Komincz比赛的那个版本相比似乎要弱很多。

在表演赛的最初几分钟里，Komincz稳稳地挡住了攻势，轻易就抵挡AlphaStar的攻击。然后他发动了狡猾的反击。

靠着两个不公平优势，AI 玩《星际争霸》碾压了人类

Komincz的2支不朽者部队（绿色）向AlphaStar的探测器开火，同时他的折跃棱镜在上方正在等待采取行动。AlphaStar的追猎者（红）正从西边赶过来救援，但还没等它们赶到Komincz就把不朽者弄进了折跃棱镜，并将其带到了水那头的东边——超出了追捕者武器的攻击范围。

Komincz把两支强大的不朽者部队装进了一个叫做折跃棱镜的运输船，然后将它们运到AlphaStar的基地，在那里脆弱的探测器正在采矿，这些矿石是AlphaStar的战争武器的动力来源。他把不朽者投放到基地里，开始炸毁探测器。

再次地，AlphaStar组建了一只庞大的追捕者部队，然后马上派遣去防御探测器。但在追捕者还没有进入到不朽者的范围之前，Komincz就已经把它们送回到折跃棱镜然后逃之夭夭了。折跃棱镜不见之后，AlphaStar就把追捕者派遣到Komincz的基地。

Komincz然后又故伎重施：投放不朽者，摧毁几个探测器，然后在追捕者赶过来之前再把不朽者送走。就这么反复这样的操作。当他这么做的时候，AlphaStar的追捕者因为徒劳地往返而浪费了宝贵的时间。

当Komincz第三次投放不朽者到AlphaStar的基地时，Stemkoski说：“这就是我经常看到的人机对战的情形。当你找到对方的一个漏洞时，你就会反复地抓住那个错误攻击，屡试不爽。”

折跃棱镜这个花招让AlphaStar的追捕者大部队疲于奔命的同时，Komincz一边也在聚集自己的大军。然后他指挥这支部队朝着AlphaStar的巢穴直捣黄龙，攻击为AlphaStar的战争机器采集资源的探测器。AlphaStar用追捕者骚扰Komincz的部队，但Komincz设法保持队伍的阵型，最后，AlphaStar没有办法阻止Komincz给自己的基地造成了严重破坏。

我们不知道Komincz在输掉之前的5场比赛之后究竟是如何赢得这场比赛的。似乎摄像头视图的限制无法直接解释AlphaStar不能对折跃棱镜的投放攻击做出有效响应。

但是合理的推断是，摄像头视图的限制全面降低了AlphaStar的表现，阻止了它有效地炮制游戏单位，或者以开局时同样致命的精度来管理部队。这样也许就给了Komincz足够的喘息之机，去寻找AlphaStar战略意图的漏洞然后加以利用。

最后看来，上次的演示引出的问题要比回答的要多。DeepMind称自己在短短一周的训练之后就看到AlphaStar的表现有了重大改良。如果这一进程延续下去的话，AlphaStar也许就能恢复对人类玩家的决定性优势，哪怕对其API施加新的限制。

另一方面，尚不清楚引入的这个摄像头限制是否足以保证比赛的公平性。AlphaStar仍然可以通过特殊API获取游戏信息，这个跟人类玩家获得的信息是不一样的。这个API也许能让软件收集更多的信息，从而比人类玩家更迅速、更精确地发布指令。

让比赛公平的终极方式是让AlphaStar使用跟人类玩家一样的用户界面。当然，这个界面可以是虚拟化的，但游戏应该是跟人类玩家一样的裸像素输入，而且应该要求利用一系列的鼠标移动和点击来输入指令——而且输入速度要限制到人类手的操作能达到的程度。这是唯一可以确保AlphaStar没有给予其软件不公平优势的办法。

原文链接：http://arstechnica.com/gaming/2019/01/an-ai-crushed-two-human-pros-at-starcraft-but-it-wasnt-a-fair-fight/

编译组出品。编辑：郝鹏程。

（编辑：温州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/2

首页

原版Ghost xp iso镜像	萝卜家园ghostxpsp3安
xp 激活系统方法	联想笔记本电脑xp系统