Tóm tắt các sự cố ngừng hoạt động đầu tiên của Sui mainnet

avatar
Chainfeeds
một ngày trước
Bài viết này được dịch máy
Xem bản gốc

Chainfeeds tóm tắt:

Khi vấn đề xảy ra, đội kỹ thuật Sui nhanh chóng chẩn đoán và phát hành bản sửa lỗi, sau đó được các nút xác thực triển khai, giảm thiểu thời gian ngừng hoạt động của mạng lưới.

Nguồn bài viết:

https://mp.weixin.qq.com/s/6ycV6FKCL26Qu3NiM29jRw

Tác giả bài viết:

Sui


quan điểm:

Sui: Kiến trúc dựa trên đối tượng của mạng Sui hỗ trợ xử lý song song quy mô lớn các giao dịch của người dùng khác nhau, điều này không thể thực hiện được trên hầu hết các mạng khác. Tuy nhiên, nếu nhiều giao dịch được ghi vào cùng một đối tượng chia sẻ đồng thời, thì các giao dịch này phải được thực hiện theo thứ tự và có giới hạn về lượng giao dịch liên quan đến đối tượng chia sẻ cụ thể đó. Hệ thống kiểm soát chặn bằng cách giới hạn tốc độ ghi các giao dịch vào cùng một đối tượng chia sẻ, ngăn chặn mạng bị quá tải do kiểm tra điểm kiểm tra kéo dài. Chúng tôi vừa nâng cấp hệ thống kiểm soát chặn để tăng cường sử dụng các đối tượng chia sẻ thông qua việc ước tính chính xác hơn về độ phức tạp của giao dịch. Tuy nhiên, có một lỗi trong mã của chế độ mới TotalGasBudgetWithCap đã dẫn đến sự cố này. Sau khi xác định vấn đề, việc sửa lỗi code rất trực tiếp (xem PR #20365). Bản sửa lỗi này đã được triển khai trên mainnet (v1.37.4) và mạng thử nghiệm (v1.38.1). Với sự phản hồi tích cực từ cộng đồng các nút xác thực, chỉ mất 15 phút từ khi phát hành bản sửa lỗi đến khi mạng Sui hoạt động trở lại bình thường. Trong quá trình này, chúng tôi đã học được: 1) Hệ thống phát hiện và phản hồi sự kiện hoạt động tốt: Cảnh báo tự động và báo cáo từ cộng đồng gần như đồng thời kích hoạt, chúng tôi nhanh chóng huy động nguồn lực của đội để chẩn đoán và sửa lỗi. 2) Cộng đồng các nút xác thực thể hiện xuất sắc: Ngay sau khi phát hành bản sửa lỗi, mạng Sui gần như ngay lập tức hoạt động trở lại bình thường. Các biện pháp phòng ngừa bao gồm: 1) Cải thiện hệ thống kiểm tra: Thêm nhiều loại giao dịch đối kháng tương tự như giao dịch gây ra sự cố này để phát hiện các vấn đề tiềm ẩn; 2) Tối ưu hóa quy trình xây dựng: Tăng tốc độ gỡ lỗi và tạo tệp nhị phân phát hành, tiếp tục giảm thời gian phản hồi sự kiện. Một phần thời gian trong quá trình gián đoạn này là do chờ đợi bản dựng phát hành.

Nguồn nội dung

https://chainfeeds.substack.com

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận