亚马逊云宕机引发“全球网络地震”!上千网站集体瘫痪(美中報道)
周一,美国乃至全球范围内的众多网站和在线服务陷入瘫痪。原因是亚马逊云计算服务(AWS)出现故障,导致数以百万计用户无法使用多个主要游戏、媒体平台、串流服务及其他应用程序。
亚马逊表示,这家支撑着互联网大部分基础设施及日常在线工具的云服务提供商,由于其一项核心数据库产品出现问题而离线。截至周一上午,公司称相关问题仍在持续。
这次宕机事件波及范围极广,从 Snapchat、麦当劳App、亚马逊的Ring门铃摄像头,到游戏平台Roblox和Fortnite,均受到影响。事件凸显出依赖云端服务器托管数据的企业(包括金融服务机构)在面对突发性技术故障时的脆弱性。一次意外中断,就可能让全球范围内的业务陷入停摆。
亚马逊网络服务公司(AWS)表示,最早在美东时间凌晨3点11分发现问题,当时其位于美国东部弗吉尼亚北部(US-East-1)数据中心的14项服务出现“运营故障”。根据网站DownDetector的统计,全球超过1000个网站和服务一度离线,共收到650万份用户报告。
此外,美联航(United Airlines)、T-Mobile、星巴克(Starbucks)和麦当劳(McDonald’s)也受到了波及。达美航空(Delta Air Lines)表示宕机导致小部分航班出现延误。美国联邦医保计划Medicare的网站似乎同样受影响,正在参与开放注册期的用户周一下午无法登录系统。英国政府的税务与海关总署(HMRC)网站也出现故障,部分用户无法访问。
到美东时间早上6点35分,AWS称导致宕机的数据库问题已“完全缓解”,但警告可能仍会出现延迟。然而在早上10点14分,AWS又确认“US-East-1区域多个服务出现严重的API错误与连接问题”,并表示正在调查。
公司指出,问题源自亚马逊EC2内部网络的错误,波及多项AWS服务,包括DynamoDB、SQS与Amazon Connect。AWS在美东时间上午11点43分的声明中解释称:“根本原因在于我们内部的一个底层子系统出现异常,该系统负责监控网络负载均衡器的运行状况。”负载均衡器是一种用于在多台服务器之间分配流量的关键技术。
AWS表示,目前正在限制客户的新请求活动,以便尽快恢复服务的全部功能。
AWS此前也曾出现类似事故,2023年曾短暂宕机,而2021年的那次中断更是持续了超过5小时,导致用户无法访问航空订票系统和支付应用。
这一次,社交媒体上充斥着关于宕机的投诉:从云端游戏、社交平台,到亚马逊旗下的Prime Video和Kindle等服务,全都受到影响。
连加密通讯应用Signal也一度瘫痪。非政府组织Article19(致力于推动言论自由)因此警告称,这类大规模宕机不仅是技术问题,更是民主层面的隐忧。
Article19数字事务负责人科琳·卡斯-斯佩斯(Corinne Cath-Speth)表示:“这些中断不只是技术故障,它们是民主体系的失败。当一家云服务提供商‘熄灯’时,关键服务也随之下线,媒体网站无法访问,像Signal这样的安全通讯应用停止运行,我们数字社会赖以运转的基础设施顷刻间崩塌。”
此外,美国最大加密货币交易所Coinbase也表示,其服务因AWS宕机而暂时无法使用。
根据监测网站DownDetector的数据,交易平台Robinhood、支付应用Venmo以及语言学习应用Duolingo等,也都在周一出现了不同程度的服务异常。
多家媒体机构同样受到波及,包括迪士尼(Disney)、纽约时报(The New York Times)和华尔街日报(The Wall Street Journal)。美联社(Associated Press)表示,其新闻系统也受到影响,已启用备用系统“AP Backup”,以便用户仍能访问突发新闻。
更棘手的是,AWS的自动客户支持工单系统也随之宕机,导致用户一度无法上报问题。
AWS不仅为客户提供数据存储,还支撑着各种在线业务,是全球云计算领域的主要参与者之一。近年来,亚马逊也在该部门积极投资人工智能产品。在2024财年,AWS创下1070亿美元的营收,占亚马逊总收入的17%,是公司最赚钱的业务板块之一。(信息来源:NBC)