@ 2023.02.19 , 13:55

15:0,大逆转?人类业余棋手完胜围棋AI

大家或许知道,自那场著名的人机围棋大战——阿尔法狗vs李世石——以后,顶尖的人类职业棋手面对训练成型的AI,已经毫无胜算。

现在国内商用的弈棋AI,如绝艺,如果把性能开到最大,基本上要让人类两子,才能打的有来有回。

但是,不久前,一位美国业余(是指由业余段位的)围棋选手Kellin Pelrine,在与名为LeelaZero的AI公平对弈的情况下,连胜15盘。(实质上是14盘,有1盘作为测试,借助了电脑)

LeelaZero的棋力基本与绝艺、星阵相当。

所以,这位Pelrine是人类围棋史上前无古人的棋圣?

好吧,实际上他找到了当前围棋AI的一个bug。

甚至这个漏洞也不是他自己找到的,而是通过AI。研究团队开发了一个专门找bug的围棋AI,让它与另一款商用围棋AI KataGo(棋力高于LeelaZero) 下了上百万盘棋,有目的地找漏洞,结果被他们找到了。

他们猜测,因为现在的围棋AI的底层架构全来自DeepMind Alpha那一系列,所以这处bug,应该是普遍的。

具体漏洞是什么?文章没有细说。按照Kellin Pelrine的说法,漏洞不是那么明显,但知道后操作起来也不是很难(至少业余中级棋手就可以做到)。

设计该项目的加利福尼亚研究公司Far AI的首席执行官Adam Gleave说:“针对系统,很容易找到人类玩家可利用的盲点。”

Pelrine使用的策略,大致上是慢慢将一块大的“死棋”串在一起,同时用在其他角落的动作分散AI的注意力。 Pelrine说,在包围圈近乎完成之前,AI都没有意识到危机。

“但作为人类,很容易就能发现。”

加利福尼亚大学伯克利分校的计算机科学教授Stuart Russell说,在最先进的机器学习-神经网络里发现了盲点,这揭示了深度学习系统的基本缺陷。

“这再次表明,我们太仓促了,不能将超人的智力赋予机器。”

Gleave说,可能是AI很少使用Pelrine所利用的战术。

他补充说,当AI系统暴露于针对算法的“对抗性攻击”时,通常可找到缺陷。 尽管如此,“我们看到非常大的[AI]系统正在大规模部署,几乎没有安全验证”。

https://www.ft.com/content/175e5314-a7f7-4741-a786-273219f433a1

有一说一,deepmind那一系下棋AI,从深度学习+对抗性网络到监督学习再到强化学习,它最终是能“意识”到bug的。本质上就是为一个搜索树剪枝的过程,如果连续几千次都导向失败的结果,它早晚能逐步回溯,找到剪错的那一枝。如果当前商用的棋类AI已经定型,不再“学习”了,那就另说了。

赞一个 (31)