自动驾驶
为无法定义最优解的博弈赋予意义:拓展了微分博弈论的基础
为了让无人驾驶车辆可以适用于真实路况,研究人员经常使用博弈论——代表理性主体为实现其目标而采取战略行动的数学模型。
Dejan Milutinovic 是加州大学圣克鲁兹分校的电气和计算机工程学教授,长期以来一直与同事研究博弈论的一个分支——微分博弈,这与运动中的玩家相关。
微分博弈里有一个重要的课题,称为追墙游戏。这是一种相对简单的模型:一个速度更快的鬼,试图去抓速度较慢的一个人,而后者只能沿着某形状(指的是墙作为界线分割出的形状,或干脆理解成只能在特定的曲线上移动)的墙奔跑。
自近60年前首次描述这个游戏以来,博弈论专家就意识到一个问题——有一组被认为不存在最优解的位置。
但现在,Milutinovic 和同事在 IEEE Transactions on Automatic Control 期刊上发表的一篇新论文中证明,这个长期存在的困境实际上并不存在,并引入了一种新的分析方法,证明总有一个确定性的最优解。这一发现为解决微分博弈领域中存在的其他类似挑战打开了大门,并能够更好地为无人驾驶汽车等自主系统提供底层算法。
追墙博弈里,鬼和人两方玩家的经典纳什均衡点,可以描述他们在几乎所有位置上的最佳策略。然而,在追击者和逃避者之间存在一组位置, 这组位置被称为奇异曲面,类比于几何上的尖点,导致附近的微分没有定义,所以其上的最优解在数学上毫无意义——多年来,研究界已经自行吞下了这枚苦果,把它作为必须接受的现实。
但Milutinovic和他的合著者不愿意接受这样的现实。
“这让我们很困扰,因为我们认为,如果逃脱者知道存在这样的奇异曲面,那么就有可能进入曲面并滥用它。逃避者可以迫使去到你不知道如何采取最佳行动的奇异表面里——然后博弈在数学上就无法分析了。”
因此,他们想出了一种解决方案,使用了当年还不存在的数学概念。通过引入 Hamilton-Jacobi-Isaacs 方程的粘性解并引入损失率分析来求解奇异曲面,他们能够发现可以在所有情况下确定博弈最优解并解决困境。
偏微分方程的粘性解是直到 1980 年代才发明出来的数学概念。现在众所周知,这个概念与最优控制和博弈论相关。
最好的一点是,把这套技术用于经典场合,得到的最优解和使用传统方法推出的最优解是一致的。所以,他们在奇异曲面里引入的最优解可以看作是传统最优解的自然延拓。新的定义是有意义的。
为了找到玩家如何最大限度地减少损失,作者分析了 Hamilton-Jacobi-Isaacs 方程在导数未明确定义的奇异曲面周围的粘性解。 然后,他们对方程的奇异面状态引入了损失率分析。 他们发现,当每个参与者试图将其损失率降至最低时,他们在奇异表面上的行动就有明确的博弈策略。
“当我们采用损失率分析并将其应用于其他场合时,经典分析给出的最优解不会受到影响。因此这是一个重要的结果,表明这是一项博弈论领域里的基本贡献 。”
Milutinovic等人有兴趣探索其他博弈论问题。他们在论文里还公开呼吁学界对其他困境引入他们的分析工具。
https://phys.org/news/2023-03-year-old-game-theory-dilemma.html