以太坊 3.0“Beam Chain” 共識層升級提案提出,如何破局性能門檻成難題。零知識證明技術減負增效的能力成致勝關鍵。AntChain OpenLabs ZK 加速技術業界領先
作者:ZAN Team
封面:Photo by Shubham’s Web3 on Unsplash
Beam Chain: “以太坊 3.0”
剛剛結束的 2024 Devcon 大會,熱鬧非凡,以太坊生態齊聚曼谷,以太坊及相關生態項目在此期間重磅發佈最新進展及動態,一系列的新觀點、新趨勢、新計劃點燃全球 Web3。
尤其讓人印象深刻的,要屬以太坊基金會研究員 Justin Drake 發佈的 “以太坊 3.0” 提案計劃。
他提出了一項被社區稱為 “以太坊 3.0” 的共識層升級提案 -- Beam Chain [1]。其核心觀點是:用零知識證明減少 Validator 的計算和通信負擔,降低成為 Validator 所需的門檻,使得更多的 Validator 可以加入網絡以增加安全性、減少計算的冗餘、提高網絡整體的效率。此外,Justin 還想要藉著對共識層 Snark 化改造的機會,解決 Beacon 鏈中由於時代限制留下的技術債,併為未來的抗量子安全需求做準備。
在 Vitalik 的 The Verge 路線圖裡,將以太坊 Snark 化(SNARKification)本就是其中一項重要工作,其包含對共識層和執行層進行零知識證明改造。在 Vitalik 最新的解讀裡 [2],Vitalik 坦言對共識層的改造工作是一個挑戰,需要在後續工作中持續地考慮並優化。Beam Chain 的提議,正好可以看作是 Vitalik 對共識層如何 Snark 化的一個回應。
Beam Chain 僅關注共識層。但將共識層 Snark 化並不代表著將所有部分都進行改造。區塊鏈的核心是狀態轉換函數(State Transition Function),所以對其改造僅需將狀態轉換函數 Snark 化即可,這也正好是 ZK 所擅長的地方。對於共識層,狀態轉換函數主要包含三個部分,即 per-slot transition function、per-block transition function 和 per-epoch transition function。在這三個狀態轉換函數中,包含著共識算法和 Staking 邏輯的執行、區塊提議、執行層結果正確性的驗證、Merkle Tree Root 驗證、共識簽名的驗證/聚合、哈希函數的計算、涉及到賬戶存儲狀態訪問的質押和贖回操作等。要將共識層 Snark 化,其實就是將如上操作 Snark 化。值得注意的是,在將共識層 Snark 化的路線中,以太坊仍然將去中心化和多樣性的目標放在首位,所以並不會強制要求 ZK 算法和協議,而是由 Proposer 自己選擇。
核心難點:Realtime Proving
要實現 Beam Chain 的構想,最核心的難點就是證明效率的提升,既如何將目前幾十甚至上百秒的證明時間壓縮到秒級。在今年 9 月 24 日由 AntChain OpenLabs、ZAN 和 Pharos 共同舉辦的 ZK Workshop II [3] 上,嘉賓 Justin 分享了題為 “Realtime Proving” 的報告,彼時他提出的核心觀點與 “以太坊 3.0” 設想一脈相承,提出瞭解決性能瓶頸的解決方案。其鼓勵社區使用 ASIC 加速方法,在芯片上完成零知識證明虛擬機從證據生成到證明的全流程,在未來幾年內將證明生成的時間提升十倍以上,真正能夠實現 Realtime Proving。
為零知識證明技術的性能與應用助力:我們一直在路上
AntChain OpenLabs 一直致力於利用 GPU、FPGA、ASIC 等硬件平臺對 ZK 證明進行加速,加速了包括 Polygon ZKEVM Prover、Stone Prover、Halo2 和 Plonky2 在內的多種 ZK 系統,形成了多個 FPGA IP 和 GPU 加速解決方案,部分核心算子達到百倍以上加速比。
AntChain OpenLabs 基於 CUDA 加速的部分算子的相對 CPU 獲得的加速比,如表 (一)。
AntChain OpenLabs 實現的 GPU 加速的 MSM 與開源 ICICLE 的性能對比(均為 4090GPU),如表(二)。
AntChain OpenLabs 實現的 GPU 加速的 Circle FFT 與在 16 核 CPU 上開源 Stwo Prover 的性能對比,如表(三)。
此外,AntChain OpenLabs 還致力於零知識證明的應用探索,在 AI+ZK 方向的大模型可驗證計算上,使用自主設計的矩陣乘法 Folding、Sumcheck 協議的 GPU+CPU 協同優化、橢圓曲線高效實現等技術,在 4 個 GPU 下將 zkLLM [4][5](原實現不包括承諾和打開,性能為加入承諾和打開之後測試,針對 LLama-7B 模型)的首 token 生成時間由 4 小時降低到約 18 分鐘。
AntChain OpenLabs 基於 GPU 方面的積累不斷優化大模型可驗證計算的性能和可用性,並在承諾方案替換和優化、多實例 Folding、多 token 證明生成方面持續發力,目標構建一個高效、易用、AI 生態友好的可驗證計算服務,為零知識證明技術的大規模應用探明可能方向,構建 Web3 和 AI 應用鏈接的橋樑。
同時面對量子計算機的威脅,AntChain OpenLabs 也進行了積極探索,基於 OpenSSL [6] 改造了一個後量子版本密碼庫,支持多個 NIST 標準後量子算法。同時面對後量子簽名較 ECDSA 有 40 倍以上存儲膨脹的問題,通過共識流程以及低延遲內存讀取優化,使得抗量子區塊鏈 TPS 可達原鏈的 50% 左右。
值得關注的是,上述技術探索已在 ZAN 推出的軟硬一體加速方案——Power Zebra (https://zan.top/home/power-zebra?chInfo=ch_wxdyh) 中應用落地,該方案針對零知識證明常用的算子進行加速和優化,包括多標量點乘 MSM、數論變換 NTT、H 多項式求解、多項式打開證明等多個關鍵組件,充分利用了 GPU 的計算資源、存儲帶寬和 PCIe 帶寬,使得運算效率顯著提升。此前 zkWASM 開源社區 Delphinus Lab 在引入 ZAN 的軟硬一體加速方案 Power Zebra 後,GPU 運算性能提升超 20%,創造社區同類服務最高記錄。
預見
長久以來,以太坊社區主要聚焦於執行層的各項優化,包括提高 BlockGasLimit、L2s 等策略。在這其中,執行層的 Snark 化早已在「Rollup Centric」的路線圖中藉助 L2 完成了大部分工作,收穫頗豐。Beam Chain 的想法,則打開了共識層 Snark 化的大門。相信隨著 Beam Chain 的提出,會引導和激發社區將目光投入共識層的改造中,帶來更多令人激動的想法。
可以預想到,共識層和執行層的 Snark 化,將一起完成 Ethereum Snark 化的最終拼圖,為以太坊的擴展性、去中心化作出巨大貢獻。同時,隨著 Beam Chain 提案的推進,基於零知識證明技術的虛擬機將在以太坊生態中扮演核心角色。通過引入 SNARK 證明和後量子密碼學,結合更低的質押門檻以及更快的區塊確認時間,Beam Chain 將為以太坊帶來更強的去中心化和更高的性能。
參考文獻
[1] https://www.youtube.com/watch?v=rGE_RDumZGg[2] https://vitalik.eth.limo/general/2024/10/23/futures4.html[3] https://x.com/zan_team/status/1844947080642539752[4] https://github.com/jvhs0706/zkllm-ccs2024
[5] https://arxiv.org/abs/2404.16109[6] https://www.openssl.org/免責聲明:作為區塊鏈信息平臺,本站所發佈文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。文章內的信息僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。
歡迎加入 Web3Caff 官方社群:X(Twitter)賬號丨微信讀者群丨微信公眾號丨Telegram訂閱群丨Telegram交流群