Do Coinbase phát triển, giải pháp mở rộng Layer 2 của Ethereum là Base đã xảy ra tình trạng ngừng hoạt động khoảng 33 phút vào chiều hôm qua (5) theo giờ Đài Loan, việc sản xuất block hoàn toàn dừng lại. Mặc dù dịch vụ nhanh chóng được khôi phục và không có thiệt hại về tài sản của người dùng, nhưng sự kiện này một lần nữa đánh chuông cảnh báo: cấu trúc Layer 2 hiệu quả vẫn còn mỏng manh, phụ thuộc vào các nút tập trung.
Base công bố báo cáo sự cố gián đoạn
Theo báo cáo phân tích sự kiện được Base công bố, lưu lượng trên chuỗi tăng vọt vào lúc 6 giờ 07 phút UTC, trình sắp xếp hiện tại bị chậm trễ tích lũy, hệ thống quản lý tự động Conductor kích hoạt chuyển đổi dự phòng, chuyển quyền lãnh đạo cho một trình sắp xếp dự phòng vẫn đang triển khai và chưa hoàn tất cài đặt. Do nút này không thể tạo block, mạng bị kẹt.
Các kỹ sư can thiệp sau vài phút, trước tiên dừng thủ công Conductor để tránh chuyển đổi lỗi liên tục, sau đó chuyển quyền lãnh đạo trở lại trình sắp xếp khỏe mạnh, cuối cùng khôi phục hoàn toàn vào lúc 6 giờ 40 phút, đồng bộ hóa việc gửi tiền, rút tiền và Flashblocks.
Đội ngũ Base sau đó nhấn mạnh lại rằng tính toàn vẹn dữ liệu không bị ảnh hưởng, tài sản của người dùng an toàn. Đội ngũ trong báo cáo cho biết:
Sự kiện không gây mất mát tài sản của người dùng, tính toàn vẹn dữ liệu vẫn giữ nguyên.
Điểm đơn tiềm ẩn của Conductor và trình sắp xếp
Trong hầu hết các cấu trúc Rollup, trình sắp xếp chịu trách nhiệm đóng gói, sắp xếp và gửi dữ liệu giao dịch đến Layer 1. Base sử dụng Conductor của OP Stack kết hợp với giao thức đồng thuận Raft, về lý thuyết có thể cho phép nhiều trình sắp xếp dự phòng lẫn nhau. Nhưng sự kiện này cho thấy, chỉ cần tiêu chuẩn kiểm tra sức khỏe không đủ, một nút có trạng thái không rõ ràng vẫn có thể được đẩy lên vị trí lãnh đạo, làm trầm trọng thêm sự cố.
Nói ngắn gọn, trình sắp xếp được thiết kế là "một số ít các nút mạnh mẽ", đổi lấy Số lượng giao dịch trên mỗi giây cao hơn và phí giao dịch thấp hơn, nhưng đồng thời cũng làm suy yếu tính linh hoạt do phi tập trung mang lại. Một khi nút trung tâm ngừng hoạt động, toàn bộ chuỗi sẽ giống như lối ra cao tốc bị phong tỏa, lưu lượng xe chỉ có thể đứng yên.
Sự kéo giãn giữa hiệu quả và phi tập trung
Thực tế, sự kiện này không phải là trường hợp đơn lẻ. Từ khi ra mắt vào năm 2023, Base đã hai lần gặp sự gián đoạn nghiêm trọng do vấn đề trình sắp xếp. Xét một cách rộng hơn, hầu hết các giải pháp Layer 2 phổ biến đều sử dụng mô hình tương tự, sử dụng một nhóm nút rất nhỏ để đổi lấy trải nghiệm người dùng ổn định.
Cách làm này tương phản rõ rệt với mạng chủ Ethereum dựa vào các trình xác thực trên toàn cầu: mạng chủ tuy chậm nhưng khó có thể khiến toàn bộ chuỗi ngừng hoạt động cùng một lúc; Layer 2 tuy nhanh nhưng tập trung rủi ro vào một số ít máy móc và quản trị viên.
Sửa chữa lời hứa và khởi nguồn của ngành
Sau đó, đội ngũ Base hứa sẽ nâng cấp quy trình Conductor, đảm bảo bất kỳ trình sắp xếp nào trước khi được chọn làm lãnh đạo đều hoàn tất cấu hình, và tăng cường kiểm tra và triển khai. Trong tương lai, họ cũng xem xét việc đưa thêm nhiều trình sắp xếp hoạt động độc lập, cho phép bên ngoài tham gia sắp xếp hoặc đưa ra thách thức, giảm thiểu rủi ro điểm lỗi đơn và rủi ro kiểm duyệt.
Đây không chỉ là thách thức của Base, mà còn liên quan đến toàn bộ hệ sinh thái Layer 2. Làm thế nào để cân bằng giữa tốc độ, chi phí và phi tập trung, đồng thời thiết kế một cơ chế chuyển đổi dự phòng có khả năng tự sửa chữa, sẽ quyết định kết quả của vòng cạnh tranh tiếp theo. Chỉ khi tăng cường cả hiệu quả và khả năng chống chịu, Layer 2 mới thực sự có thể hỗ trợ các ứng dụng Web3 quy mô lớn, thay vì bị phơi bày điểm yếu chỉ vì một lần ngừng hoạt động 33 phút.




