PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

不靠手速,阿尔法狗的“弟弟”AlphaStar狂虐人类

[复制链接]
跳转到指定楼层
1#
点击数:5563|回复数:14
继围棋之后,强大的人工智能(AI)在北京时间25日凌晨再次震撼世界:

仅仅5分钟,谷歌旗下的人工智能公司DeepMind开发的全新AI程序AlphaStar就让《星际争霸2》(以下简称星际2)职业选手MaNa投降。

DeepMind当天公布的录像显示,去年12月,AlphaStar分别以5-0战胜星际2的两位职业选手TLO和MaNa,成为第一个打败电竞职业选手的人工智能。在比赛之前,AlphaStar的训练量,相当于打了200年的星际2。

但在之后的现场比赛中,MaNa因为发现了AI操作上的缺陷,才成功为人类扳回一局。这同样也创造了历史——AlphaStar首次成为职业选手的手下败将。

每日经济新闻记者注意到,尽管10战连败,人类职业高手仍然对AlphaStar不吝称赞。

“AlphaStar在每局游戏中采用的操作和不同策略令人印象十分深刻,近乎人类选手般的游戏策略出乎我的意料,”MaNa说,“我这才意识到,自己之前的策略过分依赖对手失误和人类的反应力,因此这场比赛让我对游戏有了全新的认识。我们很期待未来的无限可能。”

而TLO的说法跟李世石输给AlphaGo后很像。他说:相信我,和AlphaStar比赛很难。不像和人在打,有种手足无措的感觉。他还说,每局比赛都是完全不一样的套路。

赛后,DeepMind在其官方博客上表示, 实现最高水平的星际2对弈代表了人工智能在有史以来最复杂电子游戏中取得的重大突破。AlphaStar背后的技术可以用来解决其他的问题, 比如天气预报、气候建模、语言理解等。

让AI玩星际争霸有多难?
暴雪出品的星际2近年来已被公认为AI研究的“大挑战(grand challenge)”。与下围棋相比,星际2可难得多——在围棋世界,动作空间只有361种,而星际2大约是10的26次方。

DeepMind也在其官方博客上解释了人工智能玩星际2的难点:

游戏理论:星际2是个游戏,就想剪刀石头布一样,没有单一最佳战略。因此人工智能训练过程中需不断探索和扩展最战略知识前沿。

瑕疵信息:不同于国际象棋或围棋那种一览无余的状态,星际玩家无法直接观察到重要信息,必须积极探索“探路”。

长期规划:和许多现实世界中的问题并非是从“因”立即生“果”一样,游戏是可以从任何一个地方开始,需要1个小时时间出结果,这意味着在游戏开始时的行动可能在很长一段时间不会有收效。

即时性:不像传统桌面游戏,玩家轮流行动,星际玩家必须在游戏时间内持续排兵布阵。

庞大的行动空间:要同时控制上百个单位及建筑,这就导致了大量的可能性,行动是分级别的,可以被修改和扩张。我们将游戏参数化后,每个时间步骤平均约有10到26个合理行为。



AlphaStar是如何做到跟星际2职业选手对战的呢?

DeepMind表示,对决时,AlphaStar借助原始界面与星际2游戏引擎交流,也就是说,它可以直接观察地图上的我方单位和敌方可见单位,不需要移动摄像头。如果是人类玩家,注意力有限,必须调整摄像头,让它瞄准应该关注的地方。分析AlphaStar游戏能发现,它有一个隐藏的注意力焦点。平均来说,游戏代理每分钟会切换环境约30次,和MaNa、TLO的频率差不多。






事实证明,AlphaStar与MaNa和TLO对决时之所以占据上风,主要是因为它的宏观战略、微观战略决策能力更强,靠的并不是超级点击率、超快响应时间。

DeepMind还表示,团队的一些训练方法或可有助于研究开发安全稳定的人工智能。人工智能的一大挑战是,系统出错的方式各种各样。先前,星际2的职业玩家可以通过各种新颖方式诱导代理失误,轻易击败AI系统。AlphaStar采用的基于league模式的创新训练方式,可以找到最可靠、最不容易出错的方式。这一创新方式对改进整体AI系统(尤其是在诸如能源等安全至上、且解决复杂边缘案例十分关键的领域)的安全性和稳定性的前景亦值得期待。
2#
Atom  楼主| 发表于 2019-1-28 16:13 | 只看该作者
AI依靠宏观战略、微观战略决策能力击败人类, 这就很可怕了
3#
Atom  楼主| 发表于 2019-1-28 16:24 | 只看该作者
4#
wanfeng304 发表于 2019-1-28 17:35 | 只看该作者
虽然简单代码就能实现,但我还是希望能早日看到这样的场景:ai通过摄像头获取信息,指挥机械手臂操控鼠标和键盘,最后通过策略来取得胜利,甚至最终能研发出全新的策略取胜机制。
来自苹果客户端来自苹果客户端
5#
哆啦A梦 发表于 2019-1-28 22:26 | 只看该作者
wanfeng304 发表于 2019-1-28 17:35
虽然简单代码就能实现,但我还是希望能早日看到这样的场景:ai通过摄像头获取信息,指挥机械手臂操控鼠标和 ...

机械和光学部分配合好就行
来自苹果客户端来自苹果客户端
6#
红色狂想 发表于 2019-1-28 23:01 | 只看该作者
魔兽官方开放句柄了吗,可以让AlphaGo轻松通过外挂控制小人儿?赶紧去搞宜居带行星大数据分析呀,用于星际拓荒再合适不过了,AlphaStar作为元始天尊,整一堆火星狗改造行星
7#
尊称 发表于 2019-1-29 02:18 | 只看该作者
本帖最后由 尊称 于 2019-1-29 03:36 编辑
Atom 发表于 2019-1-28 16:13
AI依靠宏观战略、微观战略决策能力击败人类, 这就很可怕了

靠电子的神经网络,在短暂的时间段去“求真”,有解;这在很多的场合都有“用”;甚至可能已经静悄悄地在干活,如未成熟市场的股票交易中,成熟市场没用。

但用人类一词有点过,往往人类是不能求真的。


宇宙给与弱小的人类足够的时间在地球玩儿,但贪心不足蛇吞象,想多用“用”,想自宫,尽管来;昨晚看电视,感悟二战后五十年代至八十年代末以苏联解体为代表的冷战结束,是难得的时间窗,中国恰用对了(解决了土地问题、进而解决了旧思想问题、通过时间赢得了国际环境变化带来的和平环境,此三果种下千年的共和国基业;最近跟孩子学习地理,想象一下中国国界的划分,唯一一个毒瘤没有解决 朝鲜半岛顶多算小半个毒瘤,指萨德和HDR-H);想象一下互联网为代表的信息时代来临,地球已经被各实力派瓜分到寸(海洋文化发展到极致)之后,何来一个不分裂的大国崛起?中东?想想当下的俄罗斯?!(苏联也是多民族联合体,甚至同根的乌克兰、白俄罗斯都不能笼络一块。为何不能有一个政治智慧?)

金三胖真能让朝族人民笼络的话,历史上绝对可记一笔  


未来百年计,世界或许流行和的文化?反正你我都看不见了   
8#
哆啦A梦 发表于 2019-1-29 13:34 | 只看该作者
人类的APM高,但是有效的低。。。
9#
红色狂想 发表于 2019-1-29 21:38 | 只看该作者
尊称 发表于 2019-1-29 02:18
靠电子的神经网络,在短暂的时间段去“求真”,有解;这在很多的场合都有“用”;甚至可能已经静悄悄地在 ...

你这段时间老是三更半夜出没,说一些我听不懂的话,难道你不睡觉?
10#
暴力SSD 发表于 2019-1-29 22:44 | 只看该作者
ai要取代人类了
来自苹果客户端来自苹果客户端
11#
McLaren 发表于 2019-1-30 15:37 | 只看该作者
第二轮干mana的AI是开放操作限制的极限型,AI的手速是EPM,全是有效操作。人类的180APM能有60EPM就不错了
12#
Atom  楼主| 发表于 2019-1-30 16:20 | 只看该作者
McLaren 发表于 2019-1-30 15:37
第二轮干mana的AI是开放操作限制的极限型,AI的手速是EPM,全是有效操作。人类的180APM能有60EPM就不错了 ...

对地,人类的无效操作太多
13#
暴疯狂笑 发表于 2019-1-30 19:29 | 只看该作者
很奇怪,为啥人类选手总是幻想能战胜AI
14#
Atom  楼主| 发表于 2019-1-31 13:20 | 只看该作者
暴疯狂笑 发表于 2019-1-30 19:29
很奇怪,为啥人类选手总是幻想能战胜AI

今后的世界将会是AI的
15#
尊称 发表于 2019-2-1 09:52 | 只看该作者
红色狂想 发表于 2019-1-29 21:38
你这段时间老是三更半夜出没,说一些我听不懂的话,难道你不睡觉?  ...

你改造这,拓荒那,目的不都是去获得更多,更多以有用的吗?这不都是跟着人家海洋文化跑?世界上和平路走多了,地球上没有寸了,自然某些人就开始没落了,自然某些文化就不行了。用句文革用语:拾人牙慧

你滴明白?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部