ETH 3.0 如何破局性能難題?一文揭秘背後的 ZK 技術突破與升級方案

avatar
Web3Caff
7 小時前

以太坊 3.0“Beam Chain” 共識層升級提案提出,如何破局性能門檻成難題。零知識證明技術減負增效的能力成致勝關鍵。AntChain OpenLabs ZK 加速技術業界領先

作者:ZAN Team

封面:Photo by Shubham’s Web3 on Unsplash

Beam Chain: “以太坊 3.0”

剛剛結束的 2024 Devcon 大會,熱鬧非凡,以太坊生態齊聚曼谷,以太坊及相關生態項目在此期間重磅發佈最新進展及動態,一系列的新觀點、新趨勢、新計劃點燃全球 Web3。

尤其讓人印象深刻的,要屬以太坊基金會研究員 Justin Drake 發佈的 “以太坊 3.0” 提案計劃。

他提出了一項被社區稱為 “以太坊 3.0” 的共識層升級提案 -- Beam Chain [1]。其核心觀點是:用零知識證明減少 Validator 的計算和通信負擔,降低成為 Validator 所需的門檻,使得更多的 Validator 可以加入網絡以增加安全性、減少計算的冗餘、提高網絡整體的效率。此外,Justin 還想要藉著對共識層 Snark 化改造的機會,解決 Beacon 鏈中由於時代限制留下的技術債,併為未來的抗量子安全需求做準備。

在 Vitalik 的 The Verge 路線圖裡,將以太坊 Snark 化(SNARKification)本就是其中一項重要工作,其包含對共識層和執行層進行零知識證明改造。在 Vitalik 最新的解讀裡 [2],Vitalik 坦言對共識層的改造工作是一個挑戰,需要在後續工作中持續地考慮並優化。Beam Chain 的提議,正好可以看作是 Vitalik 對共識層如何 Snark 化的一個回應。

Beam Chain 僅關注共識層。但將共識層 Snark 化並不代表著將所有部分都進行改造。區塊鏈的核心是狀態轉換函數(State Transition Function),所以對其改造僅需將狀態轉換函數 Snark 化即可,這也正好是 ZK 所擅長的地方。對於共識層,狀態轉換函數主要包含三個部分,即 per-slot transition function、per-block transition function 和 per-epoch transition function。在這三個狀態轉換函數中,包含著共識算法和 Staking 邏輯的執行、區塊提議、執行層結果正確性的驗證、Merkle Tree Root 驗證、共識簽名的驗證/聚合、哈希函數的計算、涉及到賬戶存儲狀態訪問的質押和贖回操作等。要將共識層 Snark 化,其實就是將如上操作 Snark 化。值得注意的是,在將共識層 Snark 化的路線中,以太坊仍然將去中心化和多樣性的目標放在首位,所以並不會強制要求 ZK 算法和協議,而是由 Proposer 自己選擇。

圖片來源:https://www.youtube.com/watch?v=rGE_RDumZGg&t=8257s

核心難點:Realtime Proving

要實現 Beam Chain 的構想,最核心的難點就是證明效率的提升,既如何將目前幾十甚至上百秒的證明時間壓縮到秒級。在今年 9 月 24 日由 AntChain OpenLabs、ZAN 和 Pharos 共同舉辦的 ZK Workshop II [3] 上,嘉賓 Justin 分享了題為 “Realtime Proving” 的報告,彼時他提出的核心觀點與 “以太坊 3.0” 設想一脈相承,提出瞭解決性能瓶頸的解決方案。其鼓勵社區使用 ASIC 加速方法,在芯片上完成零知識證明虛擬機從證據生成到證明的全流程,在未來幾年內將證明生成的時間提升十倍以上,真正能夠實現 Realtime Proving。

為零知識證明技術的性能與應用助力:我們一直在路上

AntChain OpenLabs 一直致力於利用 GPU、FPGA、ASIC 等硬件平臺對 ZK 證明進行加速,加速了包括 Polygon ZKEVM Prover、Stone Prover、Halo2 和 Plonky2 在內的多種 ZK 系統,形成了多個 FPGA IP 和 GPU 加速解決方案,部分核心算子達到百倍以上加速比。

AntChain OpenLabs 基於 CUDA 加速的部分算子的相對 CPU 獲得的加速比,如表 (一)。

(表一)

AntChain OpenLabs 實現的 GPU 加速的 MSM 與開源 ICICLE 的性能對比(均為 4090GPU),如表(二)。

(表二)

AntChain OpenLabs 實現的 GPU 加速的 Circle FFT 與在 16 核 CPU 上開源 Stwo Prover 的性能對比,如表(三)。

(表三)

此外,AntChain OpenLabs 還致力於零知識證明的應用探索,在 AI+ZK 方向的大模型可驗證計算上,使用自主設計的矩陣乘法 Folding、Sumcheck 協議的 GPU+CPU 協同優化、橢圓曲線高效實現等技術,在 4 個 GPU 下將 zkLLM [4][5](原實現不包括承諾和打開,性能為加入承諾和打開之後測試,針對 LLama-7B 模型)的首 token 生成時間由 4 小時降低到約 18 分鐘。

AntChain OpenLabs 基於 GPU 方面的積累不斷優化大模型可驗證計算的性能和可用性,並在承諾方案替換和優化、多實例 Folding、多 token 證明生成方面持續發力,目標構建一個高效、易用、AI 生態友好的可驗證計算服務,為零知識證明技術的大規模應用探明可能方向,構建 Web3 和 AI 應用鏈接的橋樑。

同時面對量子計算機的威脅,AntChain OpenLabs 也進行了積極探索,基於 OpenSSL [6] 改造了一個後量子版本密碼庫,支持多個 NIST 標準後量子算法。同時面對後量子簽名較 ECDSA 有 40 倍以上存儲膨脹的問題,通過共識流程以及低延遲內存讀取優化,使得抗量子區塊鏈 TPS 可達原鏈的 50% 左右。

值得關注的是,上述技術探索已在 ZAN 推出的軟硬一體加速方案——Power Zebra (https://zan.top/home/power-zebra?chInfo=ch_wxdyh) 中應用落地,該方案針對零知識證明常用的算子進行加速和優化,包括多標量點乘 MSM、數論變換 NTT、H 多項式求解、多項式打開證明等多個關鍵組件,充分利用了 GPU 的計算資源、存儲帶寬和 PCIe 帶寬,使得運算效率顯著提升。此前 zkWASM 開源社區 Delphinus Lab 在引入 ZAN 的軟硬一體加速方案 Power Zebra 後,GPU 運算性能提升超 20%,創造社區同類服務最高記錄。

預見

長久以來,以太坊社區主要聚焦於執行層的各項優化,包括提高 BlockGasLimit、L2s 等策略。在這其中,執行層的 Snark 化早已在「Rollup Centric」的路線圖中藉助 L2 完成了大部分工作,收穫頗豐。Beam Chain 的想法,則打開了共識層 Snark 化的大門。相信隨著 Beam Chain 的提出,會引導和激發社區將目光投入共識層的改造中,帶來更多令人激動的想法。

可以預想到,共識層和執行層的 Snark 化,將一起完成 Ethereum Snark 化的最終拼圖,為以太坊的擴展性、去中心化作出巨大貢獻。同時,隨著 Beam Chain 提案的推進,基於零知識證明技術的虛擬機將在以太坊生態中扮演核心角色。通過引入 SNARK 證明和後量子密碼學,結合更低的質押門檻以及更快的區塊確認時間,Beam Chain 將為以太坊帶來更強的去中心化和更高的性能。

參考文獻

[1] https://www.youtube.com/watch?v=rGE_RDumZGg[2] https://vitalik.eth.limo/general/2024/10/23/futures4.html[3] https://x.com/zan_team/status/1844947080642539752

[4] https://github.com/jvhs0706/zkllm-ccs2024

[5] https://arxiv.org/abs/2404.16109[6] https://www.openssl.org/

免責聲明:作為區塊鏈信息平臺,本站所發佈文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。文章內的信息僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
1
評論