金沙js29992

Google死磕脸书_AI巨头为什么青眼于玩乐?

八月 2nd, 2019  |  金沙国际网址js

人工智能可以自如地驾驭象棋、扑克、国际跳棋、围棋之后,未来也有可能在竞技游戏中出现一个能战胜人类选手的
AI。

《星际争霸2》将成人工智能学习研究对象

来自 PingWest中文网 2016-11-07 资讯

阅读原文请点击

在 AlphaGo
征服围棋之后,即时战略游戏《星际争霸》已经成为各家科技巨头与大学的下一个目标。Facebook
在这一方面的研究似乎正处于领先地位。7
月初,田渊栋等人开源了基于星际争霸的人工智能游戏平台(Facebook
开源游戏平台 ELF)。

不久后, Google DeepMind在官方博客上宣布开源星际争霸2
研究训练平台SC2LE。DeepMind希望通过这一工具,加速AI在实时战略游戏“星际争霸2”上的研究。
SC2LE提供由Blizzard开发的机器学习API,使研究人员和开发人员参与到游戏中。

星际争霸和星际争霸2暴雪公司出品的最成功的游戏之一。
“星际争霸”长期受欢迎的原因一部分归功于丰富多层的游戏设计,这也是AI研究的理想环境。例如,虽然游戏的目的是打败对手,但玩家还必须执行并平衡一些子目标,包括收集资源或构建建筑等。此外,游戏可能需要几分钟到一个小时才能完成,这意味着游戏早期采取的行动可能很长一段时间无法获得收益。最后,游戏中玩家只能观察到部分地图,这意味着代理机器人必须结合历史的记忆,并做好未来的规划才能取得胜利。此外,星际争霸包含300多种基本操作,玩家在游戏中的动作又常常是分级的,这比围棋中的搜索空间更加的复杂。

DeepMind在他们的研究中发现,训练的代理机器人对迷你游戏表现良好。
但是,对于完整的游戏来说,即使面对的是最简单的内置AI,训练的代理机器人也无法赢得一场游戏的胜利。
例如,一个早期智能代理常常不能保持其工人采矿,这对于人类来说则是微不足道的任务。
经过多次训练后,智能代理将采取更有意义的行动,但如果要具有竞争力,我们将需要在深度强化学习和相关领域取得进一步的突破。

说了这么多,快来唠唠:

你觉得AI巨头为啥会如此钟情游戏?

相比其他更有意义的领域(如:无人驾驶、智能家居),游戏为什么成为AI战争的聚焦地?

AI在围棋游戏上已经击败人类最顶尖的选手,你认为是否有一天AI也会称霸实时战略游戏?

面对如此汹汹的AI浪潮,一个公司该如何定位才能走上巅峰?

去年底,Google 的 DeepMind
团队宣布将与游戏公司暴雪合作,做一个能玩《星际争霸
2》的人工智能,近日,Google 的 Deepmind 团队正式公开了这一项目的进展。

[ 转载自 PingWest中文网 ]

图片 1

年初,Google的阿尔法狗震惊了全世界,
关于人工智能的讨论也来到了顶峰,“击败最优秀的人类棋手”,这个充满了传奇色彩的事件其实让很多人高估了人工智能的威力。在那之后,就有很多消息称,阿尔法狗接下来要挑战《星际争霸2》,人工智能战胜职业选手指日可待。

今年3月,很多中国媒体更是报道,在WCS中国站决赛上,暴雪娱乐制作总监Tim
Morten亲自确认,AlphaGo确认将挑战《星际争霸2》。

这个新闻有两个疑点:第一,几乎没有国外媒体以“AlphaGo挑战《星际争霸2》”为标题进行报道;第二,AlphaGo的名字也显示了,这只是DeepMind为围棋项目专门训练的人工智能项目,如果挑战星际,应该不会是这个名字。更准确的是当时《财富》的报道:DeepMind的CEO,Demis
Hassabis表示,《星际争霸》是一个考虑中的有趣的挑战。

现在,DeepMind和星际的“绯闻”终于可以落实了。DeepMind的工程师Oriol
Vinyals在公司博客宣布,暴雪将和DeepMind展开合作,让《星际争霸2》成为人工智能和机器学习的研究环境,并在明年第一季度将这个环境开放给所有的人工智能研究者。也就是说,即使是DeepMind的人工智能,也刚开始学习《星际争霸2》。

Oriol
Vinyals少年时期曾是西班牙的顶级《星际争霸》玩家,他坦诚,“要打败人类职业选手,我们还有很长的路要走。”

和回合制的围棋不同,《星际争霸》是即时战略类游戏,游戏中,玩家需要从三个种族之中选择一个进行游戏,而每个种族都有不同的优缺点。针对不同的情况快速反应,同时有对战局的长期规划,这对人工智能程序来说是个非常艰巨的挑战。

在和李世石对弈时,AlphaGo借鉴了蒙特卡洛树搜索算法,评估下一步的可能最优解(可以排除一些对自己不那么有利的可能),以减少搜索深度。即便如此,拥有超强计算能力的AlphaGo落子前,还是需要很长的思考时间。

另外,和围棋不同,在《星际争霸》中,人工智能能获取的对手的信息是有限的(比如游戏中未探索地区的战争迷雾,其中的情况对手是看不到的)。

你可能想到了《星际争霸》中自带的AI,也就是电脑玩家。它的工作机制其实和现在的人工智能完全不同,因为游戏里的AI
是直接从游戏代码中获取信息的,而且,它可以同时对所有单位下达指令,即使有些单位不在屏幕中。和人类玩家相比,它其实是在作弊。

DeepMind和暴雪的目标是训练出遵守规则,同时可以和人类玩家一较高下的AI系统。

所以,DeepMind将和暴雪合作改进游戏环境,新的游戏界面将《星际争霸2》的游戏画面简化成基本的视觉图形,以供机器学习系统更好地学习,当然,这也就意味着,人工智能系统是以视觉而不是直接读取游戏数据为基础进行决策的,这和人类玩家完全一样。

另外,暴雪还会提供游戏回放,以供人工智能系统学习。

暴雪和DeepMind
都明白,让人工智能击败顶级的职业电竞玩家还非常遥远,不过就像AlphaGo
在很多人都不看好的情况下完胜李世石,这一天很可能会比大家想象中的早来一些。当然,DeepMind的终极目标是解决现实生活中的问题,而相比围棋,《星际争霸2》是一个和现实世界更接近的环境。

阅读原文请点击

不过放心,这并不意味在之后的《星际争霸》游戏中你会随机遇到机器人对手。DeepMind
团队现在提供的主要是一个用来加速人工智能研究的工具包,它有一个晦涩的名字叫做——SC2LE。

根据 DeepMind 团队的描述,这个工具包中有暴雪开发的机器学习
API,允许研究者和开发者通过在 Linux 系统中接入游戏的
API,来开展自己的人工智能研究。

此外还有用于训练人工智能的海量数据。包括新增的匿名游戏录像数据库,未来几周里,游戏录像数据将从
65000 份增加到 50 万份。

这篇 DeepMind 和暴雪的联合论文,这篇论文概述了《星际争霸 2
》作为人工智能研究环境的情况。

目前研究人员把游戏当中的一系列复杂操作分成了不同可控的片段,用来测试智能体在特定任务里的表现,比如采矿、切换角度、选择地点等。后续,研究者可以在《星际争霸
2》的游戏设定下,自建更多小游戏用来竞争和评估人工智能的训练进展。

标签:

Your Comments

近期评论

    功能


    网站地图xml地图