@ 2024.07.22 , 07:03

全球CrowdStrike中断证明了IT系统变得多么脆弱

全球性软件故障通常由普通技术问题引发,而非AI或黑客攻击。

近几年来,人工智能社区一直在警告,他们的工作有可能失控,导致人类面临类似超级英雄电影般的灾难场景。

然而,周五的事件提醒我们,灾难更可能悄然来临,或许是因为某个平凡得几乎无人知晓的技术故障。

我们的生活建立在层层系统之上。我们登机、过桥、支付账单、下载更新、追踪孩子在夏令营的活动,所有这些都依赖这些系统,直到它们失灵。

本周的全球性软件故障,被立即称为历史上最大的故障,并非由恐怖分子、AI或要求巨额赎金的流氓黑客引起。甚至不是某个超聪明的青少年的恶作剧。事实是,这是一次常规升级出了问题。

CrowdStrike是一家位于德克萨斯州的公司,专门保护企业客户免受网络威胁。它在这方面非常成功。然而,这次威胁却来自于CrowdStrike自身,这是它似乎没有准备好的问题。

麻烦始于周四晚上CrowdStrike向客户发送的一小部分Windows软件更新。不知何故,这次更新使每台被接触的计算机崩溃。用户收到的信息是“您的PC遇到了问题”,“看起来Windows没有正确加载”。背景是晴空万里的蓝色屏幕,也就是所谓的“蓝屏死机”。

任何系统都可能失败,而且通常是以意想不到的方式。1965年的大停电,另一个有力的技术失误候选,关闭了东海岸3000万人的电网。那时硅谷几乎不存在,所以不能怪罪硅谷,但罪魁祸首——一个加拿大发电站的坏继电器引发的一连串问题——同样是平凡无奇的。

生活在现代世界是一个信仰的行为。大多数时候我们不会想到这些。直到我们乘坐的飞机遇到气流震荡。或者我们读到一扇门飞掉了的消息。或者飞机坠毁的消息。又或者——这周五确实发生了——我们根本无法登上飞机。全球一片混乱。

飞机显然是技术故障时焦虑的主要场所。但即使是那些没有试图旅行的人周五也感到沮丧。计算机无法通过被动语态来确定责任,更不用说自我修复了,而人类,至少在最初,也没有表现得好多少。

CrowdStrike的执行官Brody Nisbet在X上写道,“这是个混乱”,并建议了一个可能的解决办法:“我目前没有更多的可行帮助。”他还加了一个失望的表情符号:😞。随后,这条消息被删除了。

程序员表示,CrowdStrike可能没有尽到应有的责任。在将补丁发送给客户之前,应该在各种Windows机器上进行测试以发现问题。

“他们应该有一台测试机器来模拟一些客户的旧机器,这样他们就会看到蓝屏死机,”CryptoHarlem的黑客和创始人Matt Mitchell说。

CrowdStrike不是一家小型初创公司。成立于2011年,拥有8000名员工,市值正向1000亿美元迈进,至少在这次故障之前,导致一些投资者退出。CrowdStrike的股票周五收盘下跌11%。

尽管这家公司不如一些大科技公司知名,但它也有自傲的一面。其网站的一部分内容专门用来攻击竞争对手。CrowdStrike质问:“微软的安全产品连微软自己都保护不了,怎么能保护你?”并要求避开Palo Alto Networks:“不要选择一个难用、难部署、难管理的高成本平台。”

周五,首席执行官George Kurtz发出的信息似乎在淡化故障,称其为“单个Windows主机内容更新中发现的一个缺陷”。人们抱怨Kurtz道歉的速度太慢。(几小时后他说:“我想向所有人真诚地道歉,今天的故障对大家造成了影响。”)CrowdStrike没有回应进一步评论的请求。

受影响公司的IT人员面临着选择:走到每台离线机器前,移除有缺陷的代码,或者等待CrowdStrike的解决方案。

WithSecure公司的安全专家兼首席研究官Mikko Hypponen说:“这个解决办法如果你能走到每台笔记本电脑前,手动在键盘上输入并重新启动它就行。” “问题是,通常大型企业——这就是CrowdStrike的客户——用集中控制来维护他们的设备。”

换句话说,传统的解决计算机故障的方法——关闭再重新启动——仍然是唯一的解决方案,即使这些计算机现在越来越紧密地交织在全球网络中。但被困在机场的旅客无法重新启动那些阻止他们登机的屏幕。

Kurtz所称的“单个内容更新中发现的缺陷”是现代威胁。仅仅几年前,软件更新更加复杂、更加繁琐。每个计算机系统并不是相互连接的,这意味着故障更加局限。

“在网络安全方面,我们谈论的是深度防御——有护城河,然后是弓箭手和城门。我们谈论的是设置没有单点故障的系统。但我们正在创建一个有单点故障的局面,”黑客Mitchell说。

人们对1965年的大停电处之泰然。CrowdStrike的故障造成了干扰,但目前尚未与任何死亡联系起来。人们有周末的时间完成被打断的旅程。如果CrowdStrike幸运的话,这个麻烦将在几天甚至几个小时内被遗忘。

然而,总有一天,我们可能没有这么幸运,一些普通的技术——过载、忽视或安装不当——将引发真正的灾难。一个导致社会崩溃的软件故障可能比AI带来世界和平更有可能。世界越是联网,危险就越大。

正如诗人很久以前预见的那样,这将是一种愚蠢的方式结束。“世界就是这样结束的,不是轰然作响,而是悄然无声,”T.S. Eliot写道。当然,这些天他还会加上一个大拇指向下的表情符号。

本文译自 The New York Times,由 BALI 编辑发布。

赞一个 (6)