亚马逊编程工具Kiro因获得过高权限,在解决问题时自主决定删除并重建环境,导致系统瘫痪13小时,暴露出AI代理的失控风险。

亚马逊云计算服务最近遭遇了尴尬的一幕。Rafe Rosner-Uddin 在英国金融时报发表的文章指出,由于自家的 AI 编程工具操作失误,亚马逊的部分服务出现了中断。

这次风波的主角是一个名为 Kiro 的 AI 代理。在2025年12月中旬的一次故障处理中,这个原本旨在帮助工程师编写代码的工具,在获得授权后自主做出了一个惊人的决定,删除并重建整个环境。这一举动直接导致一个方便客户查询服务成本的系统瘫痪了整整13小时。

对于这起事故,亚马逊官方的解释很有意思。他们坚持认为这是用户错误,而非 AI 错误。公司表示,当时参与操作的工程师给予了 Kiro 过高的权限,且没有按照惯例要求第二个人进行审核。亚马逊认为,任何开发工具或手动操作都可能出现类似的问题,这仅仅是个巧合。

但亚马逊内部的员工显然有不同看法。据多名员工向英国金融时报透露,这已经是近几个月来 AI 工具第二次引发服务中断了。上一次出问题的则是另一款名为亚马逊 Q 开发者的聊天机器人产品。尽管这两次事故的影响范围有限,且主要集中在中国大陆的部分区域,但这种 AI 闹情绪的现象已经让一些资深工程师感到不安。

亚马逊云计算服务贡献了亚马逊集团约60%的营业利润,目前正全力推广能独立执行任务的 AI 代理。公司甚至设定了一个宏大的目标,要求80%的开发人员每周至少使用一次 AI 来编写代码,并严格监控使用率。

然而,这种强推 AI 替代人工的做法在内部引发了疑虑。一些工程师对 AI 处理复杂工作的能力持怀疑态度,认为在没有人工干预的情况下让 AI 自主解决问题,发生故障是完全可以预见的。目前,亚马逊已经实施了多项补救措施,包括强制性的同行评审和员工培训。

这次事件给科技界敲响了警钟。虽然 AI 编程能带来效率提升,但当这些工具具备了自主操作环境的权限时,一旦逻辑判断出现偏差,结果可能就是灾难性的。在2025年10月,亚马逊云计算服务甚至发生过长达15小时的大规模故障,导致包括 ChatGPT 在内的多家公司服务下线,这让人们对云服务的稳定性始终保持警惕。

现在的挑战在于,如何在追求自动化的效率与维护系统安全之间找到平衡。当 AI 拥有了删库的权力,哪怕它初衷是为了修复,带来的后果也可能让人难以承受。

本文译自 Ars Technica,由 BALI 编辑发布。