@ 2018.06.27 , 10:00

AI组成的DOTA战队战胜了人类高分选手

过去在电子竞技项目中与人类争锋的AI选手其实通常会使用相当于作弊的方式。

曾在即时战略游戏《星际争霸》中战胜人类的AI可以直接以内部调用的方式操作单位,实现真正的多线操作,这对于使用鼠标键盘实现输入的人类选手来说,是不可能做到的。而在moba对战类游戏里,如DOTA,AI可以读取对方的操作指令集,能实现对人类来说极其不可思议的躲避瞬时法术的惊人操作。(AI能用隐刀躲掉红杖……)

这些看似有利的情况其实削弱了AI的存在价值,毕竟,人们制造出人工智能是希望它们能以正面的方式超越人类,突破思想上的极限。

AI组成的DOTA战队战胜了人类高分选手

OpenAI ——Elon Musk和Sam Altman 合作创立的非商业AI研究组织——向世人宣布,他们研发的算法,在公平环境下,战胜了五位DOTA2高分段人类玩家,平均天梯分数超过4200分。

秋天,Dota 2世界冠军赛The International就将拉开战幕,OpenAI将派出5个运行不同算法的AI组成战队报名参赛。 通过和顶级选手同场较量,实地检验AI的性能。

AI参加并赢得了去年大赛中的1v1solo游戏环节,职业选手说,看比赛回放,他们发现机器人有值得他们借鉴之处。但是,作为一个团队来进行游戏引入了不同类型的复杂性, OpenAI必须教会AI机器人进行协作。

在任何时候,英雄(或角色)可以从1000个动作中选择出一个来执行;机器人必须做出有效的判断,同时处理大约20000个值,这些数值代表特定时间游戏时刻正在发生的事情。国际象棋中可能采取的行动的平均数量为35,因此它比在90年代击败国际象棋特级大师加里·卡斯帕罗夫的超级电脑深蓝还要来得稍微复杂点。

OpenAI使用强化学习算法。这基本上是一种试错法,随着时间的推移,人工智能从完全随机的行为发展出有方向性的游戏风格。 OpenAI在超过100000个CPU上运行Dota 2,并且AI每天的训练量大概相当于人类180年的游戏时间,给AI提供充足的学习机会。此处链接为此前AI学习dota的画面。

处理河道刷出的神符对AI来说是一个挑战,因为它们可以改变游戏的走向。由于不允许作弊,AI的视野也被限制在一屏上的内容,人工智能需要推断对手正在做的事情,并根据推断做出后续决定。所以,在前面提到的团队测试中,人类玩家不能购买水瓶和真假眼一类的物品,以及双方可选的对战阵容也相对狭窄——以免游戏走向对程序来说过于复杂的局面。

但我们有理由相信这仅仅是个开始。

机器人具有先天优势,例如80ms的反应时间,这比人类更快。他们每分钟执行150-170次动作,这与顶级人类选手相当。而随着游戏时间累积,程序开发出的战术思想与人类玩家越来越接近,比如打野、pick游戏中特定的核心战略角色,合理分路,Gank 和支援队友等。

当然,OpenAI的目标不是打造一支无与伦比的Dota 2战队,在把1500万美元的大赛奖金带回家,而是尝试训练AI解决各种复杂的问题。与此同时,在保留部分限制的条件下,吊打Dota人类冠军团队也足以令OpenAI的科学家感到心满意足。

本文译自 engadget,由译者 majer 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力 !
支付宝打赏 [x]
您的大名: 打赏金额:

4.7
赞一个 (9)

24H最赞