当地时间10月20日,亚马逊云服务(AWS)发生重大中断,导致互联网出现大面积瘫痪——全球数百万用户使用的应用程序、网站和在线工具瘫痪,但服务最终得以恢复。
从银行应用程序和航空公司到智能家居设备和游戏平台,这场持续数小时的中断事件揭示了现代生活对云基础设施的依赖程度。
以下是我们所了解的信息:
发生了什么以导致亚马逊云服务中断?
格林威治标准时间当日07:11,亚马逊云服务发生严重中断,部分系统停止运行,从而导致许多热门应用和网站中断,包括银行、游戏平台和娱乐服务。
问题始于亚马逊云服务位于弗吉尼亚州的一个主要数据中心,也是其历史最悠久、规模最大的数据中心。此次故障发生在其数据库服务DynamoDB的API(不同计算机程序之间的连接)技术更新之后。DynamoDB是一项重要的云数据库服务,为许多在线平台存储用户信息和其他重要数据。
根本原因似乎是更新当中出现的一个错误,它影响了域名系统(DNS)——该系统帮助应用找到正确的服务器地址。域名系统的工作原理类似于互联网的电话簿,以将网站名称转换为计算机用来连接服务器的数字IP地址。
由于域名系统问题,应用无法找到DynamoDB API的IP地址,从而无法连接。
随着DynamoDB的宕机,亚马逊云服务的其他服务也开始出现故障。总共有113项服务受到了此次中断的影响。截至格林威治标准时间当天10:11,亚马逊表示其所有云服务已恢复正常运行,但仍有“大量消息需要处理,并将在接下来的几个小时内完成”。
截至本文发布时,用户报告追踪互联网中断的“Downdetector”网站仍然显示OpenAI、ESPN和Apple Music等平台存在问题。
“Downdetector”网站显示OpenAI、ESPN和Apple Music等平台存在问题。
亚马逊云服务究竟是什么?
“云服务”是一种通过互联网(而不是在您的计算机或其他物理存储设备上)存储和使用数据或程序的方式。
当人们说某个东西“在云端”时,指的是文件、应用程序或系统运行在亚马逊云服务、谷歌或微软等公司数据中心的强大计算机(也称为“服务器”)上,而不是在您的个人设备上。
在这样的情况下,亚马逊云服务允许公司租用计算能力和存储空间。而它提供在后台运行网站、应用程序和许多在线服务的技术。
DynamoDB是亚马逊云服务的核心服务之一,它是一个用于存储公司重要信息(例如客户记录)的数据库。本周一,亚马逊报告称客户无法访问其DynamoDB数据。
亚马逊云服务是全球最大的云服务提供商。
云服务的中断并不罕见,但随着越来越多的公司每天依赖这些服务,这类问题变得越来越引人关注。
“此次事件影响了许多领域内的人们”,Scope Markets首席市场分析师乔书亚·马奥尼这样告诉半岛电视台,“但是对于科技公司来说,这当然是理所当然的;关键在于他们能够迅速解决问题,而且不会花费太多金钱。”
他还表示,亚马逊很可能会安然度过此次事件带来的风暴。
他说,“你们看到的是一个相对可控的东西”,“亚马逊云服务已经占据了30%的市场份额。他们的用户不会突然跳槽。他们的业务根深蒂固。”
互联网
全球最大的云服务提供商
2025年第二季度,全球云市场季度收入接近1000亿美元。其中,亚马逊云服务(AWS)以30%的市场份额领先,其次是微软 Azure(20%)和谷歌云(11%),三者合计占据了超过60%的市场份额 (半岛电视台)
哪些服务和应用崩溃了?
据“Downdetector”网站称,此次中断影响到了数十个网站,包括Snapchat、Pinterest和Apple TV。
其他通讯应用也受到了影响,包括:WhatsApp、Signal、Zoom和Slack;Roblox、Fortnite和Xbox等游戏服务也受到了影响;以及像星巴克等实体店。此外,Etsy也遇到了问题。
在美国,包括Venmo在内的金融应用也出现了问题。
一些用户表示,他们的Ring门铃和Alexa音箱停止了工作,而其他用户则无法访问亚马逊网站或在Kindle上下载书籍。
在网站上报告出现错误的程序还包括语言应用Duolingo和创意工具Canva等,此外,还有多家媒体机构受到影响,包括美联社、《纽约时报》和《华尔街日报》。
银行、加密货币交易所Coinbase、人工智能公司Perplexity以及达美航空和联合航空等美国航空公司也报告出现了问题。
为什么这么多主要应用程序同时瘫痪?
当亚马逊云服务发生故障时,受到影响的将不仅仅是亚马逊的工具。另外数千家使用该服务进行存储、数据库或网络托管的公司也会受到影响。这些公司包括许多依赖亚马逊云服务运行其系统关键部分的主要应用程序。
网络安全公司Scythe的首席执行官布赖森·博特告诉半岛电视台记者:“每当我们看到这类头条新闻,每个人脑子里冒出的第一个念头就是——‘这是又一次网络攻击吗?是军方或情报部门主导的行动导致了这次破坏吗?’而这一次,事实并非如此。”
“事实上,在大多数情况下并非如此。通常都是人为错误导致的。”
亚马逊如何回应?
亚马逊云服务承认了中断事件,并表示其工程师“已立即参与”并修复问题。
亚马逊云服务表示,它正在“并行处理多条路径以加速恢复服务”。它还报告称,主要问题已被完全解决,尽管一些用户在系统恢复的过程中仍然遇到了轻微的延迟。
该公司还表示,将会发布一份详细的事后总结,以解释这起事件的经过。