亞馬遜一聲咳嗽,半個互聯網都地震了。
由於亞馬遜AWS服務器宕機,大量互聯網服務被迫中斷,ChatGPT也被殃及。
故障發生在美國東部us-east-1區域,是AWS全球服務最核心的一塊。
根據故障追蹤平臺Downdetector的數據,當天累計收到超過650萬份用戶故障報告。
非完全列舉
AWS這波事故,也讓Reddit在內的社交平臺服務崩潰,人們差點連吐槽都沒法吐。
而且連AWS自己的客戶支持提單系統都掛了,想報個錯同樣找不到門路。
不過好在馬斯克的X沒用AWS,也就沒受影響,才給了網友們機會討論AWS的這波故障。
有網友用表情包調侃,馬斯克才是這波事件的最大贏家。
但玩笑歸玩笑,被這件事波及的人,可能一點也笑不出來……
亞馬遜服務故障波及各行各業
亞馬遜的這次宕機波及面究竟有多廣?先來看開發者群體的情況。
Docker是一個重要的應用容器引擎,有開發者發現Docker全線癱瘓了,多個核心服務集體中斷。
除了Docker,另一個重要開發工具npm也出現了同樣的問題,還有備受青睞的AI編程工具Cursor、Vercel一樣未能倖免。
除了開發者,其他打工人也受到影響——視頻會議軟件Zoom、OpenAI同款辦公平臺Slack,全都崩了。
抓馬的是,據說今年亞馬遜內部開會開始改用Zoom,這樣一來,沒有Zoom的話AWS就開不了線上會議,但AWS不修復Zoom就用不了……
既然工作幹不了,那乾脆直接摸魚呢?
也不行,因為遊戲平臺Epic、索尼PlayStation,還有Reddit等社交平臺以及Netflix、Disney+、Max等流媒體視頻網站也宕機了。
那我學習總行了吧?對不起,多鄰國也崩了,還有學生群體也登錄不了作業平臺Canvas。
AI工具方面,最著名的ChatGPT也被認為受到波及,還有著名AI搜索工具Perplexity也榜上有名。
而且影響也從線上蔓延到了線下,打車軟件崩了,麥當勞星巴克崩了,日常生活中的叫車、點餐都無法進行。
還有航空公司,美聯航和達美航空都受到了影響,無法給乘客辦理值機和行李託運。
比上不了飛機更慘的是在飛機上下不去,小紅書上就有網友現身說法,表示自己乘坐的達美航空班機落地後無法停靠,一飛機的人只能在跑道等待,機長廣播通知原因正是亞馬遜宕機。
更慘的是智能門鎖用戶,受網絡影響無法解鎖,但門鎖的報警功能卻是好的,引來了警察上門。
當然像Alexa等亞馬遜自家其他的智能家居,更是因為沒有網絡服務全面罷工。
事情甚至影響到了大西洋另一邊的英國。
比如英超官方宣佈,由於受到AWS故障的影響,西漢姆聯對陣布倫特福德的比賽當中半自動越位系統故障,將比賽中若有需要,將採用以往的人工畫線方式來輔助判定。
當然,除此之外“受害者”名單還有很長……
互聯網為何如此脆弱
這次發生問題的是AWS的us-east-1服務器,直接原因是DNS(Domain Name System)解析問題。
AWS的說法則是,問題起源於EC2內部網絡的一個子系統,該子系統用於監控和管理網絡負載均衡器的健康狀態。
該監控系統的異常導致了網絡連接不穩定、數據庫訪問延遲以及部分API請求失敗。在連鎖反應下,多項核心雲服務出現大範圍故障。
us-east-1是AWS最早建立的區域,基礎設施歷史最長,服務種類最多,大量企業都在us-east-1部署核心服務。
us-east-1不僅是計算/存儲資源的大本營,也是許多全球控制面服務的集中託管區域,這意味著其他區域即便本地運行正常,部署、身份驗證、權限變更等控制層操作仍需依賴us-east-1。
這也就導致了us-east-1相比亞馬遜其他服務器與眾不同,其故障能夠影響全球。
而且這也不是us-east-1第一次崩了,過去幾年(2020、2021、2023年)也發生過類似的“大範圍癱瘓”事件,每次都會影響一大批線上服務。
故障本身在所難免,但故障的波及面,揭示了互聯網存在的問題——
像亞馬遜這樣的大型雲服務的確提升了全球網絡安全和穩定性,但成也蕭何,這種標準、集中化的服務,意味著任何一個小故障,都有可能造成災難性的後果。
為了避免這種情況,網站開發者需要設置一種彈性機制。
Hacker News上就有網友表示,其靜態站點通過CloudFront連接多個區域,沒有全部押注us-east-1,因此在這次事件中沒有受到影響。
而且這種原生多區域、故障轉移的部署方式,技術上並不複雜,成本也不會顯著增加。
網絡服務開發者們,是時候重新審視一下自己的部署策略了。
參考鏈接:
[1]https://www.theverge.com/news/802486/aws-outage-alexa-fortnite-snapchat-offline#comments
[2]https://www.wired.com/story/what-that-huge-aws-outage-reveals-about-the-internet/
[3]https://www.businessinsider.com/ring-starbucks-alexa-app-down-aws-outage-issues-2025-10
[4]https://www.cnbc.com/2025/10/20/amazon-web-services-outage-hits-airline-websites-other-major-sites.html
[5]https://news.ycombinator.com/item?id=45640838
本文來自微信公眾號“量子位”,作者:克雷西,36氪經授權發佈。