不靠手速，阿尔法狗的“弟弟”AlphaStar狂虐人类

Atom · 发表于 2019-1-28 16:11

继围棋之后，强大的人工智能（AI）在北京时间25日凌晨再次震撼世界：

仅仅5分钟，谷歌旗下的人工智能公司DeepMind开发的全新AI程序AlphaStar就让《星际争霸2》（以下简称星际2）职业选手MaNa投降。

DeepMind当天公布的录像显示，去年12月，AlphaStar分别以5-0战胜星际2的两位职业选手TLO和MaNa，成为第一个打败电竞职业选手的人工智能。在比赛之前，AlphaStar的训练量，相当于打了200年的星际2。

但在之后的现场比赛中，MaNa因为发现了AI操作上的缺陷，才成功为人类扳回一局。这同样也创造了历史——AlphaStar首次成为职业选手的手下败将。

每日经济新闻记者注意到，尽管10战连败，人类职业高手仍然对AlphaStar不吝称赞。

“AlphaStar在每局游戏中采用的操作和不同策略令人印象十分深刻，近乎人类选手般的游戏策略出乎我的意料，”MaNa说，“我这才意识到，自己之前的策略过分依赖对手失误和人类的反应力，因此这场比赛让我对游戏有了全新的认识。我们很期待未来的无限可能。”

而TLO的说法跟李世石输给AlphaGo后很像。他说：相信我，和AlphaStar比赛很难。不像和人在打，有种手足无措的感觉。他还说，每局比赛都是完全不一样的套路。

赛后，DeepMind在其官方博客上表示，实现最高水平的星际2对弈代表了人工智能在有史以来最复杂电子游戏中取得的重大突破。AlphaStar背后的技术可以用来解决其他的问题，比如天气预报、气候建模、语言理解等。

让AI玩星际争霸有多难？
暴雪出品的星际2近年来已被公认为AI研究的“大挑战（grand challenge）”。与下围棋相比，星际2可难得多——在围棋世界，动作空间只有361种，而星际2大约是10的26次方。

DeepMind也在其官方博客上解释了人工智能玩星际2的难点：

游戏理论：星际2是个游戏，就想剪刀石头布一样，没有单一最佳战略。因此人工智能训练过程中需不断探索和扩展最战略知识前沿。

瑕疵信息：不同于国际象棋或围棋那种一览无余的状态，星际玩家无法直接观察到重要信息，必须积极探索“探路”。

长期规划：和许多现实世界中的问题并非是从“因”立即生“果”一样，游戏是可以从任何一个地方开始，需要1个小时时间出结果，这意味着在游戏开始时的行动可能在很长一段时间不会有收效。

即时性：不像传统桌面游戏，玩家轮流行动，星际玩家必须在游戏时间内持续排兵布阵。

庞大的行动空间：要同时控制上百个单位及建筑，这就导致了大量的可能性，行动是分级别的，可以被修改和扩张。我们将游戏参数化后，每个时间步骤平均约有10到26个合理行为。

AlphaStar是如何做到跟星际2职业选手对战的呢？

DeepMind表示，对决时，AlphaStar借助原始界面与星际2游戏引擎交流，也就是说，它可以直接观察地图上的我方单位和敌方可见单位，不需要移动摄像头。如果是人类玩家，注意力有限，必须调整摄像头，让它瞄准应该关注的地方。分析AlphaStar游戏能发现，它有一个隐藏的注意力焦点。平均来说，游戏代理每分钟会切换环境约30次，和MaNa、TLO的频率差不多。

事实证明，AlphaStar与MaNa和TLO对决时之所以占据上风，主要是因为它的宏观战略、微观战略决策能力更强，靠的并不是超级点击率、超快响应时间。

DeepMind还表示，团队的一些训练方法或可有助于研究开发安全稳定的人工智能。人工智能的一大挑战是，系统出错的方式各种各样。先前，星际2的职业玩家可以通过各种新颖方式诱导代理失误，轻易击败AI系统。AlphaStar采用的基于league模式的创新训练方式，可以找到最可靠、最不容易出错的方式。这一创新方式对改进整体AI系统（尤其是在诸如能源等安全至上、且解决复杂边缘案例十分关键的领域）的安全性和稳定性的前景亦值得期待。

Atom · 发表于 2019-1-28 16:13

AI依靠宏观战略、微观战略决策能力击败人类，这就很可怕了

Atom · 发表于 2019-1-28 16:24

https://deepmind.com/blog/alphas ... -game-starcraft-ii/

wanfeng304 · 发表于 2019-1-28 17:35

虽然简单代码就能实现，但我还是希望能早日看到这样的场景：ai通过摄像头获取信息，指挥机械手臂操控鼠标和键盘，最后通过策略来取得胜利，甚至最终能研发出全新的策略取胜机制。

哆啦A梦 · 发表于 2019-1-28 22:26

wanfeng304 发表于 2019-1-28 17:35
虽然简单代码就能实现，但我还是希望能早日看到这样的场景：ai通过摄像头获取信息，指挥机械手臂操控鼠标和 ...

机械和光学部分配合好就行

红色狂想 · 发表于 2019-1-28 23:01

魔兽官方开放句柄了吗，可以让AlphaGo轻松通过外挂控制小人儿？赶紧去搞宜居带行星大数据分析呀，用于星际拓荒再合适不过了，AlphaStar作为元始天尊，整一堆火星狗改造行星

尊称 · 发表于 2019-1-29 02:18

本帖最后由尊称于 2019-1-29 03:36 编辑

Atom 发表于 2019-1-28 16:13
AI依靠宏观战略、微观战略决策能力击败人类，这就很可怕了

靠电子的神经网络，在短暂的时间段去“求真”，有解；这在很多的场合都有“用”；甚至可能已经静悄悄地在干活，如未成熟市场的股票交易中，成熟市场没用。

但用人类一词有点过，往往人类是不能求真的。

宇宙给与弱小的人类足够的时间在地球玩儿，但贪心不足蛇吞象，想多用“用”，想自宫，尽管来；昨晚看电视，感悟二战后五十年代至八十年代末以苏联解体为代表的冷战结束，是难得的时间窗，中国恰用对了（解决了土地问题、进而解决了旧思想问题、通过时间赢得了国际环境变化带来的和平环境，此三果种下千年的共和国基业；最近跟孩子学习地理，想象一下中国国界的划分，唯一一个毒瘤没有解决

朝鲜半岛顶多算小半个毒瘤，指萨德和HDR-H）；想象一下互联网为代表的信息时代来临，地球已经被各实力派瓜分到寸（海洋文化发展到极致）之后，何来一个不分裂的大国崛起？中东？想想当下的俄罗斯？！（苏联也是多民族联合体，甚至同根的乌克兰、白俄罗斯都不能笼络一块。为何不能有一个政治智慧？）

金三胖真能让朝族人民笼络的话，历史上绝对可记一笔

未来百年计，世界或许流行和的文化？反正你我都看不见了

哆啦A梦 · 发表于 2019-1-29 13:34

人类的APM高，但是有效的低。。。

红色狂想 · 发表于 2019-1-29 21:38

尊称发表于 2019-1-29 02:18
靠电子的神经网络，在短暂的时间段去“求真”，有解；这在很多的场合都有“用”；甚至可能已经静悄悄地在 ...

你这段时间老是三更半夜出没，说一些我听不懂的话，难道你不睡觉？

暴力SSD · 发表于 2019-1-29 22:44

ai要取代人类了

McLaren · 发表于 2019-1-30 15:37

第二轮干mana的AI是开放操作限制的极限型，AI的手速是EPM，全是有效操作。人类的180APM能有60EPM就不错了

Atom · 发表于 2019-1-30 16:20

McLaren 发表于 2019-1-30 15:37
第二轮干mana的AI是开放操作限制的极限型，AI的手速是EPM，全是有效操作。人类的180APM能有60EPM就不错了 ...

对地，人类的无效操作太多

暴疯狂笑 · 发表于 2019-1-30 19:29

很奇怪，为啥人类选手总是幻想能战胜AI

Atom · 发表于 2019-1-31 13:20

暴疯狂笑发表于 2019-1-30 19:29
很奇怪，为啥人类选手总是幻想能战胜AI

今后的世界将会是AI的

尊称 · 发表于 2019-2-1 09:52

红色狂想发表于 2019-1-29 21:38
你这段时间老是三更半夜出没，说一些我听不懂的话，难道你不睡觉？ ...

你改造这，拓荒那，目的不都是去获得更多，更多以有用的吗？这不都是跟着人家海洋文化跑？世界上和平路走多了，地球上没有寸了，自然某些人就开始没落了，自然某些文化就不行了。用句文革用语：拾人牙慧

你滴明白？