AI组成的DOTA战队战胜了人类高分选手

过去在电子竞技项目中与人类争锋的AI选手其实通常会使用相当于作弊的方式。

曾在即时战略游戏《星际争霸》中战胜人类的AI可以直接以内部调用的方式操作单位，实现真正的多线操作，这对于使用鼠标键盘实现输入的人类选手来说，是不可能做到的。而在moba对战类游戏里，如DOTA，AI可以读取对方的操作指令集，能实现对人类来说极其不可思议的躲避瞬时法术的惊人操作。(AI能用隐刀躲掉红杖……)

这些看似有利的情况其实削弱了AI的存在价值，毕竟，人们制造出人工智能是希望它们能以正面的方式超越人类，突破思想上的极限。

AI组成的DOTA战队战胜了人类高分选手

OpenAI ——Elon Musk和Sam Altman 合作创立的非商业AI研究组织——向世人宣布，他们研发的算法，在公平环境下，战胜了五位DOTA2高分段人类玩家，平均天梯分数超过4200分。

秋天，Dota 2世界冠军赛The International就将拉开战幕，OpenAI将派出5个运行不同算法的AI组成战队报名参赛。通过和顶级选手同场较量，实地检验AI的性能。

AI参加并赢得了去年大赛中的1v1solo游戏环节，职业选手说，看比赛回放，他们发现机器人有值得他们借鉴之处。但是，作为一个团队来进行游戏引入了不同类型的复杂性， OpenAI必须教会AI机器人进行协作。

在任何时候，英雄(或角色)可以从1000个动作中选择出一个来执行;机器人必须做出有效的判断，同时处理大约20000个值，这些数值代表特定时间游戏时刻正在发生的事情。国际象棋中可能采取的行动的平均数量为35，因此它比在90年代击败国际象棋特级大师加里·卡斯帕罗夫的超级电脑深蓝还要来得稍微复杂点。

OpenAI使用强化学习算法。这基本上是一种试错法，随着时间的推移，人工智能从完全随机的行为发展出有方向性的游戏风格。 OpenAI在超过100000个CPU上运行Dota 2，并且AI每天的训练量大概相当于人类180年的游戏时间，给AI提供充足的学习机会。此处链接为此前AI学习dota的画面。

处理河道刷出的神符对AI来说是一个挑战，因为它们可以改变游戏的走向。由于不允许作弊，AI的视野也被限制在一屏上的内容，人工智能需要推断对手正在做的事情，并根据推断做出后续决定。所以，在前面提到的团队测试中，人类玩家不能购买水瓶和真假眼一类的物品，以及双方可选的对战阵容也相对狭窄——以免游戏走向对程序来说过于复杂的局面。

但我们有理由相信这仅仅是个开始。

机器人具有先天优势，例如80ms的反应时间，这比人类更快。他们每分钟执行150-170次动作，这与顶级人类选手相当。而随着游戏时间累积，程序开发出的战术思想与人类玩家越来越接近，比如打野、pick游戏中特定的核心战略角色，合理分路，Gank 和支援队友等。

当然，OpenAI的目标不是打造一支无与伦比的Dota 2战队，在把1500万美元的大赛奖金带回家，而是尝试训练AI解决各种复杂的问题。与此同时，在保留部分限制的条件下，吊打Dota人类冠军团队也足以令OpenAI的科学家感到心满意足。

本文译自 engadget，由 majer 编辑发布。

王摸鱼2025秋款拉链卫衣