编码中心
欢迎来稿
当前位置首页 > 科技新闻 > 正文

人工智能向电子游戏进军 已能在Dota2中击败业余玩家

2018-06-29 09:26 来源:经济日报-中国经济网
  谷歌的人工智能征服了围棋之后,就有人工智能公司表示,要让人工智能在即时战略游戏中战胜顶级人类玩家。这一想法在很多人眼中很难实现。在棋类游戏中形势的变化是很容易被量化的,即使是复杂的围棋也只是在19乘19的棋盘中进行的。像《星际争霸》这样的即时战略游戏,每个单位可能占据的位置远比这个数字多得多,而不同单位的性质又不像围棋那样,非黑即白。相比较而言,棋类游戏更加清晰和有跳跃性,而即时战略游戏更加混乱并有连续性,显然后者更接近于真实的世界。在真实世界中应用是人工智能发展的一大目标,所以用即时战略游戏作为跳板就显得理所应当了。

  2017年OpenAI就在Dota2游戏中一对一的规则下,击败了世界顶级玩家。经过了一年的发展,OpenAI于今日宣布他们在Dota2游戏中五对五的规则下击败了业余的人类玩家,并准备在之后的比赛中击败专业玩家团队。从OpenAI的博客中可以看到,击败业余Dota2团队是在有限制的情况下,而他们准备在8月份在有限英雄选择的情况下,击败一支顶级职业队伍。OpenAI的团队并不可能他们到时候可以做到这一点,并表示职业玩家非常有激情和创造力,Dota2也是最目前复杂的电子竞技游戏之一。

  据了解该人工智能系统通过自我对抗来学习,每天的游戏时间相当于180年。OpenAI为每一位英雄设置了一个单独的模型,这样就可以在没有人类数据的情况下学到可辨识的策略。

  从策略角度看,Dota2游戏一场平均为45分钟,每一秒大概有30帧,所以整个游戏大概有8万步。玩家的大部分操作仅仅会有局部的影响,但也有些情况会对全局产生影响。有些重大的决策会导致整个游戏走向结束。OpenAI每四帧评估一次局势,并产生2万个决策,这样的循环每场游戏平均会进行2万次。相比较而言,国际象棋一般仅需要40步,围棋仅需要150步,不过这两种游戏每一步的决策都很重要。

  从信息的角度看,棋类游戏的信息都是透明的,属于完全信息博弈。而在Dota2里,己方单位和建筑只有有限的视野,视野外区域的信息是不可知的。玩家需要根据不完整的信息做出推理,以揣测地方意图并加以针对。

  从可操作数来看,Dota2也与棋类游戏有很大的不同,每个英雄在任一瞬间都可以采取数十种行为。而结合在游戏中的位置,平均下来没一帧都有上千个可选的有效操作。对于国际象棋来说行为数约为35,围棋约为250。

  从待观察项来看,Dota2地图包括十个英雄、二十多个塔、数十个单位,此外游戏中还有其他可互动的物品和树木。OpenAI将Dota2游戏总结为2万个可获取的状态。国际象棋大约为70个,围棋大约为400个。

  Dota2的复杂程度给人工智能带来了极大的困难,开发人员在进行最初的设计时限制了游戏的复杂度。并让OpenAI通过自我对抗的方式从随机权重开始学习,人工智能在80%的游戏中通过自我对抗进行训练,在20%的游戏内与之前版本的人工智能对抗。随着训练的进行,英雄从漫步目的的在地图上闲逛,到出现规划、发育以及中期战斗的感念。几天之后,人工智能的策略就非常接近人类了,他们试图从对手手中夺取财富、推塔发育、获取线路优势。再进一步的训练后英雄之间甚至可以配合推塔了。

  OpenAI的训练达到了很好的效果,在有限制的规则下击败业余团队就是最好的证明,但是要击败顶尖人类选手还有很长的路要走。

(责任编辑:王蔚)

热点推荐

iPhoneXS/XSMax即将上市 记者抢先体验

iPhoneXS/XSMax即将上市 记者抢先体验

苹果最新款手机iPhoneXS/XSMax将于9月21日全球同步...

盖亚望远镜发现搅动银河系的“小碰撞”

盖亚望远镜发现搅动银河系的“小碰撞”

英国《自然》杂志19日发表的一篇天文学论文称,通...

首辆碳纤维复合材料地铁车辆亮相柏林

首辆碳纤维复合材料地铁车辆亮相柏林

全球首辆全碳纤维结构的轻量化地铁车辆18日在柏林...

达沃斯上的科技感

达沃斯上的科技感

9月18日,第十二届夏季达沃斯论坛(2018年世界经济...

离地球最近系外行星可能宜居

离地球最近系外行星可能宜居

据美国太空网近日报道,美国国家航空航天局(NASA...

炫酷 “科学之夜”

炫酷 “科学之夜”

由中国科技馆主办的“科学之夜”大型活动17日拉开...

山东:依海而兴 向海图强

山东:依海而兴 向海图强

“鱼、虾、贝、藻、参”五次产业浪潮,发源于山东...