DeepMindAI又一创举!玩《雷神之锤III》击败人类玩

  • 阅读(808)
  • 点赞(759)
  • 收藏(889)
  • 日期(2020-06-06)
DeepMindAI又一创举!玩《雷神之锤III》击败人类玩

Google 旗下人工智慧团队 DeepMind AI 在围棋界的惊人创举众所皆知,先前甚至投入了複杂性更高的游戏研究,例如与《星海争霸 2》和《刀塔 2》进行合作, 透过战术与团队游戏实现 AI 更高技术,不只击败人类,更以与人类合作为目标,近日,DeepMind 在 3D 游戏《雷神之锤 III》的 AI 完了将近 45 万场游戏,学习如何与人和其他的机器合作、竞争。在游戏训练过程中,研究人员限定 AI 在 5 分钟内极尽取得更多的旗子。至于对战的游戏地图为随机生成,每场地图不同之外,室内外的地形也不同,AI 可与其他 AI 组队,也可以与人类组队,对战模式则有慢速和高速两种形式。透过非监督式学习,团队建立了 AI 人类的典型行为 ,AI 学会防守、尾随队友偷袭敌军阵营等对战策略。

研究团队举行一场比赛找来 40 位真人玩家让他们随机和 AI 进行配对,和人类可能是对手或队友。比赛结束后发现,仅有 AI 的团队最成功,平均胜率为 74%。相比之下,普通人类玩家的胜率为 43%,顶尖人类玩家为 52%。 AI 在游戏内的部分表现行为比人类更高效,像是「tagging」成功率人类为 48%,AI 却可高达 80%,另外藉由与人类协同、对战比赛也发现,AI 的合作能力更强,是比人类更好的队友。

这项突破性的游戏对战研究结果得利于 Deepmind 在去年提出一种名为 PBT训练神经网路的新方法,藉此可同时训练和优化一系列网路,进而快速找到最佳的设定,透过强化学习的新发展,AI 进一步实现了人性化的表现。虽然此游戏在策略学习的难度还是比刀塔、星海等 RTS 游戏小很多,此类 CTF的游戏规则很简单,複杂之处在于动态,CTF 模型长期策略游戏上效仍可持续观察。

对团队来说,研究目标并非击败人类,而是寻找新的方法来训练 AI 在能在複杂的环境实现共同目标。 未来将能进一步改进目前的强化学习和群体训练方法,促进更强大的、甚至能与人类合作的智慧体的开发。

更多详细资讯可参照其 论文 。