Tiết lộ: Quan điểm và ý kiến nêu ở đây hoàn toàn thuộc về tác giả và không đại diện cho quan điểm và ý kiến của ban biên tập crypto.news.
Sự cố ngừng hoạt động của AWS là lời nhắc nhở về sự mong manh của các hệ thống kỹ thuật số hiện đại khi quá nhiều thứ phụ thuộc vào một nhà cung cấp duy nhất. Một lỗi trong bản ghi hệ thống tên miền (DNS) đã gây ra sự cố hàng loạt trên toàn bộ cơ sở hạ tầng của Amazon Web Services, khiến hơn 14.000 trang web bị sập và gây thiệt hại hơn 1 tỷ đô la chỉ trong vòng hai giờ, bao gồm cả Coinbase, MetaMask và Robinhood. Khi các chức năng hoạt động trở lại, việc đồng bộ hóa dữ liệu đã gây ra hiệu ứng domino khiến tình trạng gián đoạn tiếp tục diễn ra.
- Sự cố ngừng hoạt động của AWS đã phơi bày việc quá phụ thuộc vào một số nhà cung cấp dịch vụ đám mây siêu lớn tạo ra sự mong manh về mặt hệ thống, khi một lỗi DNS duy nhất có thể lan rộng sang hàng nghìn dịch vụ và cơ sở hạ tầng quan trọng.
- Việc tập trung hóa mang lại hiệu quả nhưng lại tập trung các điểm yếu, ràng buộc chính phủ, hệ thống tài chính và khuôn khổ nhận dạng kỹ thuật số với những rủi ro mà tự động hóa và quy mô chỉ khuếch đại thêm.
- Khả năng phục hồi thực sự đòi hỏi các kiến trúc phân tán — thông tin xác thực có thể xác minh, sổ đăng ký tin cậy và xác minh phi tập trung — giúp giảm các điểm lỗi đơn lẻ và cho phép hệ thống lỗi một cách an toàn thay vì lỗi thảm khốc.
AWS đã cố gắng bảo vệ điều này bằng nhiều điểm lỗi cục bộ, nhưng lại không tính đến sự gián đoạn DNS khu vực. Là nhà cung cấp dịch vụ đám mây cho hơn 90% các công ty trong danh sách Fortune 100, sự kiện này cho thấy ngay cả những nhà cung cấp dịch vụ tập trung lớn nhất cũng không thể hoàn toàn phòng ngừa những rủi ro tập trung hóa này. Sự kiện này phơi bày những hậu quả khi chúng ta quá phụ thuộc vào cơ sở hạ tầng thiết yếu mà thiếu các biện pháp bảo vệ phù hợp.
Trong khi các công ty tư nhân đang loay hoay tìm cách khôi phục quyền truy cập, các chính phủ lại đang xây dựng cơ sở hạ tầng công cộng quan trọng như AI và ID kỹ thuật số quốc gia dựa trên cùng những giả định sai lầm và thường được lưu trữ trên cùng một nhà cung cấp. Khi những cơ sở hạ tầng này gặp sự cố, việc xác minh, thanh toán và truy cập vào các dịch vụ thiết yếu có thể bị đình trệ cùng một lúc. Sự cố này đã phơi bày một sự thật đơn giản: Khi cơ sở hạ tầng thiết yếu tập trung ở một nơi, khả năng phục hồi sẽ biến mất, và ngay cả những nhà cung cấp đám mây lớn nhất cũng không thể hoàn toàn phòng ngừa rủi ro tập trung hóa.
Câu hỏi không nên là liệu một sự cố ngừng hoạt động lớn khác có xảy ra nữa hay không, mà là khi nào và làm thế nào để thiết kế cho rủi ro tập trung như vậy. Cơ sở hạ tầng phân tán và phi tập trung, thông tin xác thực có thể xác minh và sổ đăng ký tin cậy là một số công nghệ được triển khai trên toàn thế giới để đảm bảo xác suất lỗi tập trung thấp nhất có thể. Cho phép dữ liệu được lưu trữ trong các kho dữ liệu riêng biệt của từng phòng ban trong khi việc xác minh có thể được tách khỏi cơ sở dữ liệu tập trung để mặc định bảo mật danh tính.
Tập trung hóa là một rủi ro về mặt cấu trúc, không phải là một lỗi kỹ thuật
Sự cố ngừng hoạt động của AWS đã phơi bày lỗ hổng sâu xa hơn trong nền tảng mà internet hiện đại được xây dựng. Phần lớn xương sống của internet hiện phụ thuộc vào một nhóm nhỏ các nhà cung cấp đám mây, CDN và DNS. Ba nhà cung cấp dịch vụ siêu quy mô, AWS, Microsoft Azure và Google Cloud, hiện kiểm soát gần 70% thị trường cơ sở hạ tầng đám mây toàn cầu. Khi một trong số họ gặp sự cố, như đã thấy gần đây, hậu quả sẽ lan rộng vượt xa mạng lưới của chính họ. Nói một cách đơn giản, hệ thống của chúng tôi được thiết kế để hoạt động liên tục không bị gián đoạn giống như các nhà máy sản xuất tinh gọn — tinh gọn về đầu ra nhưng dễ bị hỏng khi dây chuyền sản xuất ngừng hoạt động.
Vấn đề này lan rộng khắp mọi ngành; các tổ chức công cũng sử dụng cùng một nhà cung cấp đám mây để vận hành các khuôn khổ nhận dạng kỹ thuật số quốc gia, thanh toán và mô hình AI ngày càng mở rộng. Khởi đầu là việc theo đuổi khả năng mở rộng liền mạch, giờ đây đã phát triển thành một sự phụ thuộc ngày càng tăng, gắn kết các hệ thống quan trọng lại với nhau.
Khi phần lớn cuộc sống hàng ngày phụ thuộc vào một vài nền tảng, thất bại không còn có thể được coi là những sự kiện riêng lẻ nữa. Chúng trở thành những rủi ro hệ thống, lan tỏa đến mọi thứ liên quan.
Sự thoải mái giả tạo của quy mô
Tập trung hóa hoạt động hiệu quả nhất khi nó dễ dàng. Hứa hẹn tốc độ, hiệu quả và chi phí thấp hơn — ai mà không chọn những điều này, nhưng chúng cũng ẩn chứa những chi phí tiềm ẩn. Khi mọi thứ đều đi qua cùng một xương sống, chỉ còn là vấn đề thời gian cho đến khi khả năng phục hồi nhường chỗ cho sự mong manh.
Các hệ thống tập trung, ngay cả khi được tích hợp sẵn tính năng dự phòng như AWS, vẫn có chung những điểm yếu. Chỉ cần một thiết lập sai, một lỗ hổng bảo mật hoặc một vấn đề khác, chẳng hạn như lỗi DNS quá phổ biến, cũng có thể khiến toàn bộ sector bị sập cùng một lúc.
Khi sử dụng tự động hóa, rủi ro đó sẽ tăng lên và khi các hệ thống này bị hỏng, mọi người sẽ bị khóa khỏi internet và tài khoản, cũng như các khoản thanh toán, dịch vụ công hoặc danh tính quốc gia của họ.
Trớ trêu thay, chính những hệ thống được thiết kế để loại bỏ thời gian chết thông qua hiệu suất tự động hóa lại tạo ra một môi trường mà ngay cả một khoảnh khắc lỗi cũng không còn được chấp nhận. Mỗi lớp tự động hóa mang lại sự tiện lợi nhưng lại loại bỏ sự giám sát của con người, làm tăng thêm rủi ro khi sự cố xảy ra. Cho đến khi khả năng phục hồi được coi trọng ngang bằng với hiệu suất, mỗi sự cố ngừng hoạt động sẽ nhắc nhở chúng ta rằng mình thực sự có rất ít quyền kiểm soát.
Hệ thống phân tán là nền tảng của khả năng phục hồi
Khả năng phục hồi thực sự không đến từ việc bổ sung thêm máy chủ dự phòng. Nó đến từ việc loại bỏ nhu cầu về một điểm kiểm soát duy nhất. Các hệ thống phi tập trung làm được điều này một cách tự nhiên.
Trong một mạng lưới hoặc hệ thống phi tập trung, các nút độc lập chia sẻ quyền ra quyết định và xác minh một cách độc lập. Việc áp dụng điều này vào các hệ thống thực tế cần có các cơ chế cho phép bạn xác minh thông tin mà không cần lưu trữ dữ liệu gốc. Các công nghệ như thông tin xác thực, sổ đăng ký tin cậy dựa trên blockchain và danh tính tự chủ đã thực thi các nguyên tắc này. Thay vì yêu cầu dữ liệu phải được lưu trữ và kiểm tra trong một hệ thống duy nhất, việc xác minh có thể được thực hiện bằng mật mã trên một mạng lưới phân tán.
Điều này có nghĩa là dữ liệu có thể được lưu trữ tại nơi nó đang tồn tại, bên trong các hệ thống phòng ban hoặc tổ chức vận hành nó, trong khi việc xác minh có thể được tách khỏi việc tập trung hóa dữ liệu. Việc xác minh có thể diễn ra mà không cần phải kéo hoặc phơi bày dữ liệu cơ bản được tập trung tại một nơi, loại bỏ điểm lỗi đơn lẻ lớn nhất trong khi vẫn duy trì dữ liệu ở đúng vị trí của nó, với cá nhân hoặc tổ chức sở hữu nó. Việc tái cấu trúc toàn bộ cơ sở hạ tầng của chúng ta là không cần thiết; thay vào đó, việc này nhằm giảm thiểu quy mô và tác động của các lỗi.
Áp dụng cho AI, điều này có nghĩa là các mô hình có thể trích xuất dữ liệu đã được xác minh từ nhiều nguồn đáng tin cậy mà không cần dựa vào một trung tâm duy nhất. Việc kiểm tra tuân thủ trong tài chính có thể được thực hiện trên các hệ thống phân tán, xác minh giao dịch mà không cần thông qua từng nhà cung cấp. Nhìn chung, điều này tạo ra một cơ sở hạ tầng có thể bị lỗi một cách an toàn thay vì bị lỗi thảm khốc.
Cơ sở hạ tầng quan trọng không nhất thiết phải tập trung như thế này
Cơ sở hạ tầng quan trọng không nhất thiết phải nằm trong một cơ sở dữ liệu tập trung khổng lồ, nơi mở rộng kiến thức của các tập đoàn và chính phủ, đồng thời tạo ra một bẫy mật luôn hấp dẫn cho những kẻ lừa đảo và sự cố nghiêm trọng. Chúng ta không cần một xương sống kỹ thuật số duy nhất để các hệ thống thiết yếu hoạt động hiệu quả cùng nhau. Khả năng tương tác có thể đạt được thông qua các hệ thống phân tán, các tiêu chuẩn mở và dữ liệu có thể xác minh, giúp phối hợp dữ liệu mà không cần kiểm soát tập trung.
Chúng ta đã có khả năng — công nghệ blockchain và web3 cho phép các lĩnh vực như tài chính, nhận dạng và AI phối hợp an toàn trên các mạng độc lập thay vì phụ thuộc vào một nhà cung cấp trung tâm.
Cơ sở hạ tầng được thiết kế theo cách này tự động thiết lập các ranh giới, bằng cách giới hạn dữ liệu được chia sẻ, cách lưu trữ và đối tượng có thể truy cập, đồng thời vẫn tạo điều kiện cho sự hợp tác giữa các hệ thống vốn không được thiết kế để hoạt động cùng nhau. Hiệu quả đến từ sự phân bổ, chứ không phải sự phụ thuộc.
Chi phí thực sự không chỉ nằm ở việc các dịch vụ tập trung quan trọng lại ngừng hoạt động, mà còn ở việc liệu thế hệ cơ sở hạ tầng kỹ thuật số tiếp theo cho AI, Nhận dạng Quốc gia và máy chủ đám mây có thể được xây dựng để chống chịu được sự cố hay không. Bằng cách áp dụng xác minh phân tán và khuôn khổ tin cậy dựa trên blockchain, chúng ta có thể tạo ra các hệ thống tăng cường khả năng phục hồi thay vì thay thế sự mong manh hiện tại của nó.
Fraser Edwards là người tiên phong trong việc phát triển mạng lưới cheqd, giúp các doanh nghiệp tạo và tận dụng thông tin xác thực kỹ thuật số, đồng thời giải quyết những thách thức thương mại của danh tính tự chủ (SSI). Dưới sự lãnh đạo của ông, cheqd đang đi đầu trong việc chuyển đổi các giải pháp nhận dạng kỹ thuật số, giúp chúng dễ tiếp cận và khả thi hơn cho các tổ chức trên toàn cầu. Fraser là diễn giả thường xuyên tại các hội nghị về blockchain và nhận dạng, bao gồm Messari Mainnet, Web Summit, Zebu Live, Nebular Summit, Money 20/20, RWOT, European Blockchain Convention và nhiều hội nghị khác. Sự lãnh đạo của ông đã đưa cheqd tham gia vào các chương trình khởi nghiệp uy tín tại các sự kiện như Tuần lễ Blockchain Paris, ETHCC, v.v.



