《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

时间:2020-05-27 作者:
《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

文/胖丁呷麵

既上次挑战职业围棋界的AlphaGo后,Google旗下人工智慧部门DeepMind再度推出「Alphastar」,这次宣示要来挑战知名战略游戏《星海争霸2》,在25日线上直播时,「AlphaStar」最终就以10比1大胜人类选手,唯一让人类胜的一盘还是初阶版AlphaStar,让许多人对于这消息感到绝望:

「难道人类从此注定输给电脑了吗?」

新闻一出后,在各大论坛都掀起了激烈的讨论,有部分玩家与评论者对于这样的结论有些质疑,甚至有很多人直接批判这样的比赛内容:

 

「AlphaStar没有比人类聪明,他们完全是靠高速操作来取胜。」

▼在直播影片的下方,很多人讨论AlphaStar不合理的高速操作

电脑操作本来就比人快啊?难道这场「人机大战」是一场不公平的对决吗?

事实上为了竞赛的公正性,以显示人工智慧可以在「纯思考」上胜过人类,DeepMind团队在AI代码上加入了一些与人类相近的限制,例如像是一样有战争迷雾(电脑不清楚玩家的资讯)、每秒操作指令限制(APM上限)、以及决策的反应延迟等等。但即使加上了这些条件,看到了AlphaStar以10比1的成绩血洗人类,我们仍不能说人工智能已经完全可以取代人类了,下面就整理出来了这次对决中,很多人会忽略的四大事实:

事实1:AlphaStar现在只会神族打神族

如果你仔细观察直播影片可以发现,比赛的场地都是一模一样,都是选用「汇龙岛」这张地图,然后不论是「Mana」还是「TLO」两位选手皆使用神族来对抗AlphaStar的神族。在直播中DeepMind的主讲者讲出了最重要的理由,那就是虽然有等同于人类200年的学习份量,但AlphaStar只有专精于神族对神族的对战方式。

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

要知道在《星海争霸2》所有1V1对战的排列组合中,这仅仅是6种组合的其中一种,相对来说选手在职业生涯中,几乎是必须从3~6种对战组合中「不挑食地」学习,甚至还要摸清楚各种地图的种族特性。

对像是专精虫族的「TLO」这样的玩家,在职业生涯时,大部分时间都是在练习虫族的各种打法,因此当DeepMind要求他玩神族时,我们必须知道,这并不能表现他真实的职业水準。

在这种对选手不利(不能选自己擅长的),AlphaStar又专挑他自己的最擅长的场地中,AI赢了并没有甚幺好说嘴的,除非你愿意让人类挑战使用他们擅长的种族,并且随机选地图,这样AlphaStar赢才是较有公信力的说法。

▼许多选手都有像「虫王」之类的称号,职业选手为了登峰造极,通常会特化训练一种类型(图为SEN)

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

事实2:AlphaStar没开图,但也不用切萤幕

一般玩家怎幺打星海的?由于游戏显示的区域只包含了大地图中的一小部分,所以要看到地图上的其他地方,要透过各种热键操作与小地图来回切换,这才能观察战场上的一举一动;

但是在这点上,AlphaStar却完全不同了,它们可以一次看到最远距离的视野,不用移动萤幕就能看到除了迷雾以外的所有地方。那这样的设计会造成什幺样的误差呢?

那就是人类在操作上需要频繁的视角切换,在AI身上是根本不需要的,它们大可以把这些操作「省下来」。但针对这点DeepMind也有作解释了,他们回覆说,AlphaStar在地图频率的关切度上也有所限制,跟职业选手一样是每分钟30次,也就是说,就算地图上发现了什幺新东西,AI也需要花0.05秒的时间来反映。

但跟人类必须小心翼翼的监控地图,这种AI可以一次看清游戏地图的感觉,令人感觉有作弊的嫌疑。

▼即使Google用热点图不断证明,查看地图有延迟,但仍然不免受到质疑《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

事实3:最后一场,需要切换画面的AI输了

DeepMind为了避免这种上述的「切画面」嫌疑,在第十一场就拿出了一支必须像人类那样切画面操作的AI,但跑运算的天数只有7天(前面让人类惨败的是14天),而结果就是这个年轻的AlphaStar被选手MANA辗压过去了。

我们不知道究竟是因为该版的AlphaStar强度不够,还是因为加入切画面的视角限制所导致,但结论就是,前面AlphaStar赢的10场并不能代表什幺,充其量只是展示在接近人类限制条件下,透过不断的深度学习,人工智慧能够作出很厉害的游戏博弈行为。

但根本没办法证明,人工智能在「纯思考」上能打败人类。

▼在第11场时,人类终于拿下首胜,但是是初阶AlphaStar

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

事实4:给AlphaStar的手速限制机制,反而让它透过深度学习来作弊

像是在星海这样需要大量群体控制的战略游戏,如果选手每秒能操作的次数越多,那幺控制精细度就能越扯,能大大增加游戏中的获胜机率。

因此在星海或是魔兽争霸等等的电竞比赛中,像是APM(每分钟操作数)这样都是业界长来叙述电竞选手程度的指标。

在人类世界里,顶尖职业选手的平均APM也就是300上下。2017年与2018年的《星海2》世界冠军Serral在比赛中甚至能提高到500以上,但也不能长时间维持,最高能爆发到800以上,但只有持续不到一秒的时间,而且该操作有可能是无效操作(瞎按、按了又取消,对游戏没帮助)。

 ▼Serral的手速令人眼花撩乱

但在AlphaStar的比赛影片中,我们却能看到它在某些时候维持在1000以上的APM,爆发时甚至来到了1500以上,这是人类完全无法企及的速度,你想想看APM1500代表什幺,就代表一秒钟25次的操作,这对人类来说根本不可能达成。

但讲到这也许就会有人说了,Deepmind团队不是有对AlphaStar限制手速吗?那为什幺允许AlphaStar作出这样的作弊行为?事实上与人很像,AlphaStar在操作游戏时,APM一样是会浮动的,就像人类那样无法每分每秒都用最快的速度操作,因此Deepmind团队实际上给AlphaStar的限制是在平均APM上。

在限制了平均APM之后,在经过多次的深度学习,AlphaStar就发展出了一套能飙APM又能符合规定的方式,那就是在平常时,尽可能地压低APM,然后在拉兵控资源、对战时,尽可能地爆发夸张的APM,也就是说,AlphaStar学到了如何把APM「额度」存起来了。

▼AlphaStar平常都很低调,但遇到战斗可以瞬间把APM拉起来,剎那间就能比人类还快

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

在对战中,那怕是某一场小战役,极高APM的爆发可能就是导致「少兵赢多兵」的关键,正是这点些微的设计失误,使得AlphaStar在前十场比赛中所向披靡,让星海选手都目瞪口呆「我有这幺多兵,为什幺却被一小堆追猎者打爆了?」Mana在访谈中如此说着。

这样讲起来,其实这场DeepMind举办的星海比赛,其实根本不能证明什幺吧?

但其实并不是这样的,撇开跟人类的胜负关係后,我们能看到AlphaStar作出了很多人类不会作的决策,例如一开始採矿单位生到了24个,或者生产战斗兵种几乎都是「追猎者」;就跟当年扫蕩围棋世界的AlphaGo一样,常常会下出当下不觉得怎样的一手,但往往发展到后面,那一子却成了非常重要的关键。

因此对于《星海争霸2》这个游戏来说,至少是拓展了人类思维上的不足之处,我们从没想过可以这样玩。而Deepmind的目的也不是要赢过人类,而是透过这样複杂的游戏,来研究类似「赛局理论」不透明状态下的博弈,藉此把AI的学习效果延伸到更複杂的领域。

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

正因为《星海争霸2》是如此複杂,所以DeepMind团队才需要如此简化AlphaStar的学习流程,证实透过这样的方式,可以改善出更强的思考能力。这场直播并不是告诉我们,人类从此就一败涂地了,反而完全相反,显示了AlphaStar的稚嫩,与人类思考模式的坚韧性。

在2月15日时,还会有另外一个人工智慧团队去挑战世界冠军Serral,但这次并不是来自于AI的自我学习,而是来自人工撰写的脚本。

至少我们可以说,像是围棋界柯洁与AlphaGo那样史诗级、毁天灭地的战斗还没有到来, AI目前还没有办法在同条件下,完全取代这些电竞选手。

《星海2》被AI屌虐了?四大理由告诉你:其实赢的是人类

    相关推荐