编码中心
欢迎来稿
当前位置首页 > 科技新闻 > 正文

人工智能向电子游戏进军 已能在Dota2中击败业余玩家

2018-06-29 09:26 来源:经济日报-中国经济网
  谷歌的人工智能征服了围棋之后,就有人工智能公司表示,要让人工智能在即时战略游戏中战胜顶级人类玩家。这一想法在很多人眼中很难实现。在棋类游戏中形势的变化是很容易被量化的,即使是复杂的围棋也只是在19乘19的棋盘中进行的。像《星际争霸》这样的即时战略游戏,每个单位可能占据的位置远比这个数字多得多,而不同单位的性质又不像围棋那样,非黑即白。相比较而言,棋类游戏更加清晰和有跳跃性,而即时战略游戏更加混乱并有连续性,显然后者更接近于真实的世界。在真实世界中应用是人工智能发展的一大目标,所以用即时战略游戏作为跳板就显得理所应当了。

  2017年OpenAI就在Dota2游戏中一对一的规则下,击败了世界顶级玩家。经过了一年的发展,OpenAI于今日宣布他们在Dota2游戏中五对五的规则下击败了业余的人类玩家,并准备在之后的比赛中击败专业玩家团队。从OpenAI的博客中可以看到,击败业余Dota2团队是在有限制的情况下,而他们准备在8月份在有限英雄选择的情况下,击败一支顶级职业队伍。OpenAI的团队并不可能他们到时候可以做到这一点,并表示职业玩家非常有激情和创造力,Dota2也是最目前复杂的电子竞技游戏之一。

  据了解该人工智能系统通过自我对抗来学习,每天的游戏时间相当于180年。OpenAI为每一位英雄设置了一个单独的模型,这样就可以在没有人类数据的情况下学到可辨识的策略。

  从策略角度看,Dota2游戏一场平均为45分钟,每一秒大概有30帧,所以整个游戏大概有8万步。玩家的大部分操作仅仅会有局部的影响,但也有些情况会对全局产生影响。有些重大的决策会导致整个游戏走向结束。OpenAI每四帧评估一次局势,并产生2万个决策,这样的循环每场游戏平均会进行2万次。相比较而言,国际象棋一般仅需要40步,围棋仅需要150步,不过这两种游戏每一步的决策都很重要。

  从信息的角度看,棋类游戏的信息都是透明的,属于完全信息博弈。而在Dota2里,己方单位和建筑只有有限的视野,视野外区域的信息是不可知的。玩家需要根据不完整的信息做出推理,以揣测地方意图并加以针对。

  从可操作数来看,Dota2也与棋类游戏有很大的不同,每个英雄在任一瞬间都可以采取数十种行为。而结合在游戏中的位置,平均下来没一帧都有上千个可选的有效操作。对于国际象棋来说行为数约为35,围棋约为250。

  从待观察项来看,Dota2地图包括十个英雄、二十多个塔、数十个单位,此外游戏中还有其他可互动的物品和树木。OpenAI将Dota2游戏总结为2万个可获取的状态。国际象棋大约为70个,围棋大约为400个。

  Dota2的复杂程度给人工智能带来了极大的困难,开发人员在进行最初的设计时限制了游戏的复杂度。并让OpenAI通过自我对抗的方式从随机权重开始学习,人工智能在80%的游戏中通过自我对抗进行训练,在20%的游戏内与之前版本的人工智能对抗。随着训练的进行,英雄从漫步目的的在地图上闲逛,到出现规划、发育以及中期战斗的感念。几天之后,人工智能的策略就非常接近人类了,他们试图从对手手中夺取财富、推塔发育、获取线路优势。再进一步的训练后英雄之间甚至可以配合推塔了。

  OpenAI的训练达到了很好的效果,在有限制的规则下击败业余团队就是最好的证明,但是要击败顶尖人类选手还有很长的路要走。

(责任编辑:王蔚)

热点推荐

SpaceX今年第7次发射  共向国际空间站运2.63吨物资

SpaceX今年第7次发射 共向国际空间站运2.63吨物资

据国外媒体报道,美国当地时间4月2日,SpaceX已成...

携手世界 为破解人类科学难题贡献中国智慧

携手世界 为破解人类科学难题贡献中国智慧

在蔚蓝的大海中,国际大洋钻探计划正在钻探地球的...

苹果允许用户彻底删除ID 重隐私者得天下

苹果允许用户彻底删除ID 重隐私者得天下

北京时间3月30日,据彭博社报道,苹果公司表示将在...

eSIM时代,运营商的末日还是新生

eSIM时代,运营商的末日还是新生

自近日中国联通宣布在国内首发Apple Watch Series ...

首枚会变色的“心脏芯片”问世

首枚会变色的“心脏芯片”问世

东南大学生物医学工程学院生物电子学国家重点实验...

“科学”号调查麦哲伦海山

“科学”号调查麦哲伦海山

海山是世界海洋生物多样性研究的热点地区。在国家...

别了,“天宫” 你是永远的“一号”

别了,“天宫” 你是永远的“一号”

2011年9月29日,你乘坐长征二号F运载火箭离我们而...