Chainfeeds 요약:
문제가 발생했을 때 수이(SUI) 엔지니어링 팀은 신속하게 문제를 진단하고 수정 방안을 발표했으며, 검증 노드가 이를 배포하여 네트워크 중단 시간을 최소화했습니다.
출처:
https://mp.weixin.qq.com/s/6ycV6FKCL26Qu3NiM29jRw
저자:
수이(SUI)
관점:
수이(SUI):수이(SUI) 네트워크의 객체 기반 아키텍처는 다른 대부분의 네트워크에서 구현할 수 없는 대규모 병렬 처리를 지원합니다. 그러나 여러 거래가 동시에 동일한 공유 객체에 기록되는 경우 이러한 거래는 순차적으로 실행되어야 하며, 해당 객체와 관련된 거래 처리량에 상한이 있습니다. 블록 제어 시스템은 동일한 공유 객체에 대한 거래 속도를 제한하여 네트워크가 실행 시간이 긴 체크포인트로 인해 과부하되는 것을 방지합니다. 최근 우리는 거래 복잡도를 더 정확하게 추정하여 공유 객체의 활용도를 높이기 위해 블록 제어 시스템을 업그레이드했습니다. 그러나 새로운 모델 TotalGasBudgetWithCap의 코드에 버그가 있어 이번 문제가 발생했습니다. 문제가 확인된 후 코드 수정은 매우 직접적이었습니다(PR #20365 참조). 이 수정 사항은 메인넷(v1.37.4)과 테스트넷(v1.38.1)에 배포되었습니다. 검증 노드 커뮤니티의 적극적인 대응 덕분에 수정 발표부터 수이(SUI) 네트워크 정상화까지 15분밖에 걸리지 않았습니다. 이 과정에서 우리는 다음을 배웠습니다: 1) 이벤트 감지 및 대응 시스템이 잘 작동했습니다: 자동 경보와 커뮤니티 보고가 거의 동시에 발생했으며, 우리는 신속하게 팀 자원을 동원하여 진단 및 수정을 수행했습니다. 2) 검증 노드 커뮤니티가 훌륭하게 대응했습니다: 수정 사항 발표 후 수이(SUI) 네트워크가 거의 즉시 정상화되었습니다. 예방 조치에는 다음이 포함됩니다: 1) 테스트 시스템 개선: 이번 장애를 유발한 유사한 대립적 거래 유형을 더 많이 추가하여 잠재적 문제를 발견합니다. 2) 빌드 프로세스 최적화: 디버깅 및 바이너리 파일 릴리스 속도를 높여 이벤트 대응 시간을 더 줄입니다. 이번 중단 과정의 일부 시간은 릴리스 버전 빌드를 기다리는 데 소요되었습니다.
출처