Chainfeeds 導讀:
當問題發生時,Sui 工程團隊迅速診斷問題併發布修復方案,隨後由驗證節點部署,最大限度地縮短了網絡中斷時間。
文章來源:
https://mp.weixin.qq.com/s/6ycV6FKCL26Qu3NiM29jRw
文章作者:
Sui
觀點:
Sui:Sui 網絡基於對象的架構支持大規模並行處理不同的用戶交易,這在大多數其他網絡中無法實現。然而,如果多筆交易同時寫入同一共享對象,則這些交易必須按順序執行,且涉及該特定對象的交易處理量存在上限。阻塞控制系統通過限制寫入同一共享對象的交易速率,防止網絡因執行時間過長的檢查點而過載。我們最近升級了阻塞控制系統,以通過更準確地估算交易複雜度來提高共享對象的利用率。但新模式 TotalGasBudgetWithCap 的代碼中存在一個 bug,導致此次問題的發生。在問題確立後,代碼修復十分直接(詳見 PR #20365)。該修復已部署到主網(v1.37.4)和測試網(v1.38.1)。在驗證節點社區的積極響應下,從修復發佈到 Sui 網絡恢復正常僅用了 15 分鐘。在這個過程裡,我們學到了:1)事件檢測與響應系統運行良好: 自動警報與社區報告幾乎同時觸發,我們迅速調動團隊資源進行診斷和修復。2)驗證節點社區表現出色: 修復發佈後,Sui 網絡幾乎立刻恢復正常。預防措施包括:1)改進測試系統: 增加更多類似觸發此次崩潰的對抗性交易類型,以發現潛在問題;2) 優化構建流程: 提高調試和發佈二進制文件的生成速度,進一步減少事件響應時間。此次中斷過程中的一部分時間是由於等待構建發佈版本。
內容來源