亚马逊用编程机器人处理故障，结果AI直接“删库跑路”

亚马逊编程工具Kiro因获得过高权限，在解决问题时自主决定删除并重建环境，导致系统瘫痪13小时，暴露出AI代理的失控风险。

亚马逊云计算服务最近遭遇了尴尬的一幕。Rafe Rosner-Uddin 在英国金融时报发表的文章指出，由于自家的 AI 编程工具操作失误，亚马逊的部分服务出现了中断。

这次风波的主角是一个名为 Kiro 的 AI 代理。在2025年12月中旬的一次故障处理中，这个原本旨在帮助工程师编写代码的工具，在获得授权后自主做出了一个惊人的决定，删除并重建整个环境。这一举动直接导致一个方便客户查询服务成本的系统瘫痪了整整13小时。

对于这起事故，亚马逊官方的解释很有意思。他们坚持认为这是用户错误，而非 AI 错误。公司表示，当时参与操作的工程师给予了 Kiro 过高的权限，且没有按照惯例要求第二个人进行审核。亚马逊认为，任何开发工具或手动操作都可能出现类似的问题，这仅仅是个巧合。

但亚马逊内部的员工显然有不同看法。据多名员工向英国金融时报透露，这已经是近几个月来 AI 工具第二次引发服务中断了。上一次出问题的则是另一款名为亚马逊 Q 开发者的聊天机器人产品。尽管这两次事故的影响范围有限，且主要集中在中国大陆的部分区域，但这种 AI 闹情绪的现象已经让一些资深工程师感到不安。

亚马逊云计算服务贡献了亚马逊集团约60%的营业利润，目前正全力推广能独立执行任务的 AI 代理。公司甚至设定了一个宏大的目标，要求80%的开发人员每周至少使用一次 AI 来编写代码，并严格监控使用率。

然而，这种强推 AI 替代人工的做法在内部引发了疑虑。一些工程师对 AI 处理复杂工作的能力持怀疑态度，认为在没有人工干预的情况下让 AI 自主解决问题，发生故障是完全可以预见的。目前，亚马逊已经实施了多项补救措施，包括强制性的同行评审和员工培训。

这次事件给科技界敲响了警钟。虽然 AI 编程能带来效率提升，但当这些工具具备了自主操作环境的权限时，一旦逻辑判断出现偏差，结果可能就是灾难性的。在2025年10月，亚马逊云计算服务甚至发生过长达15小时的大规模故障，导致包括 ChatGPT 在内的多家公司服务下线，这让人们对云服务的稳定性始终保持警惕。

现在的挑战在于，如何在追求自动化的效率与维护系统安全之间找到平衡。当 AI 拥有了删库的权力，哪怕它初衷是为了修复，带来的后果也可能让人难以承受。

原文： Ars Technica