ChatGPT cũng bị ảnh hưởng, máy chủ Amazon bị lỗi, một nửa Internet bị sập

Bài viết này được dịch máy
Xem bản gốc

Khi Amazon ho, một nửa Internet sẽ rung chuyển.

Do máy chủ Amazon AWS ngừng hoạt động , lượng lớn dịch vụ Internet buộc phải gián đoạn và ChatGPT cũng bị ảnh hưởng.

Sự cố xảy ra ở vùng us-east-1 ở miền đông Hoa Kỳ, đây là trung tâm dịch vụ toàn cầu của AWS.

Theo dữ liệu từ nền tảng theo dõi lỗi Downdetector, hơn 6,5 triệu báo cáo lỗi của người dùng đã được nhận vào ngày hôm đó.

Danh sách không đầy đủ

Sự cố AWS này cũng khiến các dịch vụ của nền tảng xã hội bao gồm Reddit bị sập và mọi người gần như không thể phàn nàn.

Hơn nữa, ngay cả hệ thống hỗ trợ khách hàng của AWS cũng ngừng hoạt động và không có cách nào để báo cáo lỗi.

May mắn thay, X của Musk không sử dụng AWS nên không bị ảnh hưởng, điều này tạo cơ hội cho cư dân mạng thảo luận về làn sóng thất bại của AWS này.

Một số cư dân mạng đã sử dụng biểu tượng cảm xúc để nói đùa rằng Musk là người chiến thắng lớn nhất trong làn sóng sự kiện này.

Nhưng nói đùa thôi, những người bị ảnh hưởng bởi sự việc này có thể sẽ không thể cười được nữa...

Sự cố ngừng hoạt động của dịch vụ Amazon ảnh hưởng đến nhiều ngành công nghiệp

Lần của Amazon lan rộng đến mức nào? Trước tiên, hãy xem xét tình hình của các nhà phát triển.

Docker là một công cụ chứa ứng dụng quan trọng. Một số nhà phát triển nhận thấy Docker bị tê liệt hoàn toàn và nhiều dịch vụ cốt lõi bị gián đoạn đồng loạt.

Ngoài Docker, một công cụ phát triển quan trọng khác là npm cũng gặp phải vấn đề tương tự và các công cụ lập trình AI phổ biến là Cursor và Vercel cũng không thoát khỏi vấn đề.

Ngoài các nhà phát triển, nhiều nhân viên khác cũng bị ảnh hưởng - phần mềm hội nghị truyền hình Zoom và nền tảng văn phòng Slack của OpenAI đều bị sập.

Điều thú vị là Amazon được cho là đã chuyển sang sử dụng Zoom cho các cuộc họp nội bộ trong năm nay. Điều này có nghĩa là AWS không thể tổ chức các cuộc họp trực tuyến mà không có Zoom, nhưng AWS cũng không thể sử dụng Zoom trừ khi họ khắc phục được lỗi này...

Vì tôi không thể làm công việc của mình, tại sao không lười biếng đi?

Cách đó cũng không hiệu quả, vì các nền tảng trò chơi Epic , Sony PlayStation , các nền tảng xã hội như Reddit và các trang web phát video trực tuyến như Netflix, Disney+ và Max cũng ngừng hoạt động.

Vậy là mình có thể học được rồi phải không? Xin lỗi, Duolingo bị sập rồi, và nhóm học sinh không thể đăng nhập vào Canvas, nền tảng làm bài tập về nhà.

Về mặt công cụ AI, ChatGPT nổi tiếng nhất cũng cho rằng là bị ảnh hưởng và công cụ tìm kiếm AI nổi tiếng Perplexity cũng nằm trong danh sách.

Hơn nữa, tác động đã lan rộng từ trực tuyến sang ngoại tuyến. Các ứng dụng gọi taxi bị sập, McDonald's và Starbucks cũng sập, và mọi người không thể gọi taxi hay gọi đồ ăn trong cuộc sống hàng ngày.

Các hãng hàng không như United Airlines và Delta Airlines cũng bị ảnh hưởng và không thể làm thủ tục cho hành khách và xử lý hành lý.

Điều tệ hơn cả việc không thể lên máy bay là không thể xuống máy bay. Một cư dân mạng đã chia sẻ trải nghiệm của mình trên Xiaohongshu, cho biết chuyến bay của hãng Delta Airlines mà anh ta đi không thể cập bến sau khi hạ cánh, và mọi người trên máy bay chỉ có thể chờ trên đường băng. Cơ trưởng thông báo rằng nguyên nhân là do sự cố ngừng hoạt động của Amazon.

Tệ hơn nữa là người dùng khóa cửa thông minh không thể mở khóa cửa do sự cố mạng, nhưng chức năng báo động của khóa cửa lại hoạt động bình thường, khiến cảnh sát phải đến nhà họ.

Tất nhiên, các sản phẩm nhà thông minh khác của Amazon, chẳng hạn như Alexa , đã ngừng hoạt động hoàn toàn do thiếu dịch vụ mạng.

Tình hình này thậm chí còn ảnh hưởng đến nước Anh ở phía bên kia Đại Tây Dương.

Ví dụ, Giải Ngoại hạng Anh chính thức thông báo rằng do ảnh hưởng của sự cố AWS, hệ thống việt vị bán tự động đã gặp trục trặc trong trận đấu giữa West Ham United và Brentford. Nếu cần thiết trong trận đấu, phương pháp vẽ đường biên thủ công trước đó sẽ được sử dụng để hỗ trợ phán quyết.

Tất nhiên, danh sách “nạn nhân” còn rất dài…

Tại sao Internet lại mong manh như vậy?

Lần, sự cố xảy ra trên máy chủ us-east-1 của AWS và nguyên nhân trực tiếp là do sự cố giải quyết DNS (Hệ thống tên miền).

AWS cho biết sự cố bắt nguồn từ một hệ thống mạng nội bộ của EC2, nơi theo dõi và quản lý tình trạng của bộ cân bằng tải mạng.

Sự cố bất thường của hệ thống giám sát đã gây ra kết nối mạng không ổn định, chậm trễ truy cập cơ sở dữ liệu và một số lỗi yêu cầu API. Hậu quả là nhiều dịch vụ đám mây cốt lõi đã bị ngừng hoạt động trên diện rộng.

us-east-1 là khu vực được AWS thành lập sớm nhất, với lịch sử cơ sở hạ tầng lâu đời nhất và dịch vụ đa dạng nhất. Lượng lớn công ty triển khai các dịch vụ cốt lõi tại us-east-1.

us-east-1 không chỉ là cơ sở cho các tài nguyên tính toán và lưu trữ mà còn đóng vai trò là vùng lưu trữ tập trung cho nhiều dịch vụ mặt phẳng điều khiển toàn cầu. Điều này có nghĩa là ngay cả khi các vùng khác hoạt động bình thường cục bộ, các hoạt động của mặt phẳng điều khiển như triển khai, xác thực và thay đổi quyền vẫn dựa vào us-east-1 .

Điều này khiến us-east-1 khác biệt so với các máy chủ Amazon khác và lỗi của nó có thể ảnh hưởng đến thế giới.

Và đây không phải là lần us-east-1 gặp sự cố. Những sự cố "tê liệt quy mô lớn" tương tự đã xảy ra trong vài năm qua (2020, 2021 và 2023), lần đều ảnh hưởng đến một lượng lớn dịch vụ trực tuyến.

Thất bại là điều không thể tránh khỏi, nhưng mức độ thất bại cho thấy những vấn đề tồn tại trên Internet.

Các dịch vụ đám mây lớn như Amazon thực sự đã cải thiện an ninh và tính ổn định của mạng lưới toàn cầu, nhưng thành công cũng đến từ những hạn chế riêng. Dịch vụ tập trung và chuẩn hóa này đồng nghĩa với việc bất kỳ lỗi nhỏ nào cũng có thể gây ra hậu quả thảm khốc.

Để tránh tình trạng này, các nhà phát triển trang web cần thiết lập cơ chế phục hồi .

Một số cư dân mạng trên Hacker News cho biết các trang web tĩnh của họ được kết nối với nhiều khu vực thông qua CloudFront và không đặt cược hoàn toàn vào us-east-1, do đó họ không bị ảnh hưởng trong sự cố lần.

Hơn nữa, phương pháp triển khai dự phòng đa vùng gốc này không phức tạp về mặt kỹ thuật và không làm tăng đáng kể chi phí.

Các nhà phát triển dịch vụ web, đã đến lúc xem xét lại chiến lược triển khai của bạn.

Liên kết tham khảo:

[1]https://www.theverge.com/news/802486/aws-outage-alexa-fortnite-snapchat-offline#comments

[2]https://www.wired.com/story/what-that-huge-aws-outage-reveals-about-the-internet/

[3]https://www.businessinsider.com/ring-starbucks-alexa-app-down-aws-outage-issues-2025-10

[4]https://www.cnbc.com/2025/10/20/amazon-web-services-outage-hits-airline-websites-other-major-sites.html

[5]https://news.ycombinator.com/item?id=45640838

Bài viết này trích từ tài khoản công khai WeChat "Quantum Bit" , tác giả: Cressey và được 36Kr cho phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận