人工智能玩游戏DeepMind的AI代理比人类更好星际争霸和Dota也行

来源:本站 浏览

小编:  DeepMind 为人工智能程序开发了一种学习如何在简单的视频游戏中有效组合的方法

  DeepMind 为人工智能程序开发了一种学习如何在简单的视频游戏中有效组合的方法。最引人注目的是,AI代理商也可以与人类玩家合作 - 而且那些玩家说这些程序比大多数人都更好。

  团队成员: DeepMind的研究人员训练AI代理团队在第一人称射击游戏Quake III Arena的修改版中玩一个捕获旗帜的游戏。在AI计划中,团队合作极难有效发展,因为它涉及处理复杂且不断变化的情况。

  获胜公式:研究人员使用了一种名为“For the Win”的算法,该算法使用强化学习并行训练大量代理,这是一种以动物学习方式为蓝本的机器学习技术。一些技巧有助于优化和调整流程。

  改变游戏规则:这是一个很有希望的进步,因为AI程序需要彼此很好地协作。但值得注意的是,这些程序运行的世界非常简单。在现实世界中展示团队合作将更具挑战性 - 实现这一目标可能还有很长的路要走。

  人工智能的研究继续使视频游戏变得更好。该技术告知NPC可以更有说服力地移动和战斗,具有个性和更真实的视觉效果的兽人。现在,DeepMind的研究人员已经教过人工智能,像人类一样玩定制版的Quake III Arena。

  人工智能玩游戏,DeepMind的AI代理比人类玩Quake III Arena更好(趣说人工智能编译,来源DeepMind)。该团队专注于捕获标志模式,其中地图从匹配变为匹配。它的AI代理必须学习能够适应每个新地图的一般策略,人类很容易做到这一点。代理人还需要与团队成员合作以及与对方团队竞争,并能够适应不同的敌人游戏风格。

  “我们的经纪人必须从零开始学习如何在看不见的环境中观察,行动,合作和竞争,所有这些都来自每次比赛的单一强化信号:他们的团队是否获胜,”研究人员在一篇博文中写道。他们训练了一群人工智能代理人,通过玩游戏来学习,就像我们一样。每个个体经纪人都受到内部奖励信号的激励,这有助于实现他们的目标,例如夺旗。代理人在快速和慢速比赛中相互比赛和人类对手,以更好地改善他们的记忆并保持他们的行为一致。研究人员发现人工智能代理人比人类获胜更有意义,这是有道理的,但他们也比人更具协作性。这些特工还学会了类似人类的行为,比如跟随队友并在敌人基地露营。

  人工智能玩游戏,DeepMind的AI代理比人类玩Quake III Arena更好。研究人员说,如果不出意外,像这样的人工智能可以扩展到更复杂的游戏,如星际争霸II和Dota 2,导致盟友和对手更像其他人类。设想电子竞技团队使用技术改善其成果的未来并不难。

当前网址:http://www.sx-news.com/keji/2019-03-26/81708.html

免责声明:本文仅代表作者个人观点,与陕西新闻网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

你可能喜欢的: