编码中心
欢迎来稿
当前位置首页 > 科技新闻 > 正文

人工智能向电子游戏进军 已能在Dota2中击败业余玩家

2018-06-29 09:26 来源:经济日报-中国经济网
  谷歌的人工智能征服了围棋之后,就有人工智能公司表示,要让人工智能在即时战略游戏中战胜顶级人类玩家。这一想法在很多人眼中很难实现。在棋类游戏中形势的变化是很容易被量化的,即使是复杂的围棋也只是在19乘19的棋盘中进行的。像《星际争霸》这样的即时战略游戏,每个单位可能占据的位置远比这个数字多得多,而不同单位的性质又不像围棋那样,非黑即白。相比较而言,棋类游戏更加清晰和有跳跃性,而即时战略游戏更加混乱并有连续性,显然后者更接近于真实的世界。在真实世界中应用是人工智能发展的一大目标,所以用即时战略游戏作为跳板就显得理所应当了。

  2017年OpenAI就在Dota2游戏中一对一的规则下,击败了世界顶级玩家。经过了一年的发展,OpenAI于今日宣布他们在Dota2游戏中五对五的规则下击败了业余的人类玩家,并准备在之后的比赛中击败专业玩家团队。从OpenAI的博客中可以看到,击败业余Dota2团队是在有限制的情况下,而他们准备在8月份在有限英雄选择的情况下,击败一支顶级职业队伍。OpenAI的团队并不可能他们到时候可以做到这一点,并表示职业玩家非常有激情和创造力,Dota2也是最目前复杂的电子竞技游戏之一。

  据了解该人工智能系统通过自我对抗来学习,每天的游戏时间相当于180年。OpenAI为每一位英雄设置了一个单独的模型,这样就可以在没有人类数据的情况下学到可辨识的策略。

  从策略角度看,Dota2游戏一场平均为45分钟,每一秒大概有30帧,所以整个游戏大概有8万步。玩家的大部分操作仅仅会有局部的影响,但也有些情况会对全局产生影响。有些重大的决策会导致整个游戏走向结束。OpenAI每四帧评估一次局势,并产生2万个决策,这样的循环每场游戏平均会进行2万次。相比较而言,国际象棋一般仅需要40步,围棋仅需要150步,不过这两种游戏每一步的决策都很重要。

  从信息的角度看,棋类游戏的信息都是透明的,属于完全信息博弈。而在Dota2里,己方单位和建筑只有有限的视野,视野外区域的信息是不可知的。玩家需要根据不完整的信息做出推理,以揣测地方意图并加以针对。

  从可操作数来看,Dota2也与棋类游戏有很大的不同,每个英雄在任一瞬间都可以采取数十种行为。而结合在游戏中的位置,平均下来没一帧都有上千个可选的有效操作。对于国际象棋来说行为数约为35,围棋约为250。

  从待观察项来看,Dota2地图包括十个英雄、二十多个塔、数十个单位,此外游戏中还有其他可互动的物品和树木。OpenAI将Dota2游戏总结为2万个可获取的状态。国际象棋大约为70个,围棋大约为400个。

  Dota2的复杂程度给人工智能带来了极大的困难,开发人员在进行最初的设计时限制了游戏的复杂度。并让OpenAI通过自我对抗的方式从随机权重开始学习,人工智能在80%的游戏中通过自我对抗进行训练,在20%的游戏内与之前版本的人工智能对抗。随着训练的进行,英雄从漫步目的的在地图上闲逛,到出现规划、发育以及中期战斗的感念。几天之后,人工智能的策略就非常接近人类了,他们试图从对手手中夺取财富、推塔发育、获取线路优势。再进一步的训练后英雄之间甚至可以配合推塔了。

  OpenAI的训练达到了很好的效果,在有限制的规则下击败业余团队就是最好的证明,但是要击败顶尖人类选手还有很长的路要走。

(责任编辑:王蔚)

热点推荐

未来工厂的创新密码

未来工厂的创新密码

首届中国国际进口博览会智能及高端装备展区内,通...

南极科考,远洋运输 无人船时代“启航”

南极科考,远洋运输 无人船时代“启航”

英国东英吉利大学近日表示,该校团队正与一家公司...

冬日“体检”保畅通

冬日“体检”保畅通

11月7日是立冬节气,贵州铁路部门针对气温降低的情...

我国已掌握推力矢量关键技术

我国已掌握推力矢量关键技术

6日,中国航空工业自主研制的歼-10B推力矢量验证机...

量子互联网六阶段发展路线图出炉

量子互联网六阶段发展路线图出炉

利用量子物理学独特效应的量子互联网将与我们今天...

NASA拟派“露西”号拜访7颗小行星

NASA拟派“露西”号拜访7颗小行星

据美国趣味科学网站近日报道,美国国家航空航天局...

陀螺仪故障排除,哈勃望远镜复工

陀螺仪故障排除,哈勃望远镜复工

据美国太空网29日报道,美国国家航空航天局(NASA...