CrowdStrike归咎测试软件缺陷导致全球850万台Windows计算机崩溃
来源:环球网
【环球网科技综合报道】7月25日,据外媒报道,在近期的一次重大技术失误中,CrowdStrike将其导致全球范围内850万台Windows计算机崩溃的错误更新归咎于测试软件的缺陷。据CrowdStrike在事后回顾(PIR)中所述,此次问题的根源在于内容验证器的错误,使得包含有问题的数据的更新仍然通过了验证流程。
资料图
这次大规模蓝屏死机(BSOD)中断对全球多家公司造成了严重影响,包括航空公司、广播公司以及伦敦证券交易所等。该问题迫使Windows机器陷入启动循环,需要技术人员本地访问才能恢复,而Apple和Linux机器则未受影响。许多公司,如达美航空,至今仍在努力恢复中。
CrowdStrike推出的Falcon Sensor工具旨在防止DDoS和其他类型的攻击。该工具包含在内核级别运行的内容,并使用“模板类型”来定义威胁防御策略。然而,在2024年7月19日发布的两个新模板实例中,一个仅40KB大小的实例尽管数据存在问题,却仍然通过了验证。当传感器接收到该模板实例并将其加载到内容解释器中时,导致了越界内存读取并触发了异常,进而引发了Windows操作系统的崩溃。
为了防止类似事件再次发生,CrowdStrike承诺将采取多项措施,包括对快速响应内容进行更彻底的测试,增加验证检查并增强错误处理。此外,该公司还计划采用快速响应内容的交错部署策略,以避免全球中断重演,并为客户提供对此类内容交付的更大控制权以及更新的发布说明。
然而,一些分析师和工程师对CrowdStrike的应对措施提出了质疑。工程师Florian Roth在社交媒体上发帖称,CrowdStrike应该从一开始就意识到这些更新可能会被驱动程序解读并导致问题,因此他们应该更早地实施快速响应内容的交错部署策略。