ETH 3.0 如何破局性能难题?一文揭秘背后的 ZK 技术突破与升级方案

avatar
Web3Caff
12 小时前

以太坊 3.0“Beam Chain” 共识层升级提案提出,如何破局性能门槛成难题。零知识证明技术减负增效的能力成致胜关键。AntChain OpenLabs ZK 加速技术业界领先

作者:ZAN Team

封面:Photo by Shubham’s Web3 on Unsplash

Beam Chain: “以太坊 3.0”

刚刚结束的 2024 Devcon 大会,热闹非凡,以太坊生态齐聚曼谷,以太坊及相关生态项目在此期间重磅发布最新进展及动态,一系列的新观点、新趋势、新计划点燃全球 Web3。

尤其让人印象深刻的,要属以太坊基金会研究员 Justin Drake 发布的 “以太坊 3.0” 提案计划。

他提出了一项被社区称为 “以太坊 3.0” 的共识层升级提案 -- Beam Chain [1]。其核心观点是:用零知识证明减少 Validator 的计算和通信负担,降低成为 Validator 所需的门槛,使得更多的 Validator 可以加入网络以增加安全性、减少计算的冗余、提高网络整体的效率。此外,Justin 还想要借着对共识层 Snark 化改造的机会,解决 Beacon 链中由于时代限制留下的技术债,并为未来的抗量子安全需求做准备。

在 Vitalik 的 The Verge 路线图里,将以太坊 Snark 化(SNARKification)本就是其中一项重要工作,其包含对共识层和执行层进行零知识证明改造。在 Vitalik 最新的解读里 [2],Vitalik 坦言对共识层的改造工作是一个挑战,需要在后续工作中持续地考虑并优化。Beam Chain 的提议,正好可以看作是 Vitalik 对共识层如何 Snark 化的一个回应。

Beam Chain 仅关注共识层。但将共识层 Snark 化并不代表着将所有部分都进行改造。区块链的核心是状态转换函数(State Transition Function),所以对其改造仅需将状态转换函数 Snark 化即可,这也正好是 ZK 所擅长的地方。对于共识层,状态转换函数主要包含三个部分,即 per-slot transition function、per-block transition function 和 per-epoch transition function。在这三个状态转换函数中,包含着共识算法和 Staking 逻辑的执行、区块提议、执行层结果正确性的验证、Merkle Tree Root 验证、共识签名的验证/聚合、哈希函数的计算、涉及到账户存储状态访问的质押和赎回操作等。要将共识层 Snark 化,其实就是将如上操作 Snark 化。值得注意的是,在将共识层 Snark 化的路线中,以太坊仍然将去中心化和多样性的目标放在首位,所以并不会强制要求 ZK 算法和协议,而是由 Proposer 自己选择。

图片来源:https://www.youtube.com/watch?v=rGE_RDumZGg&t=8257s

核心难点:Realtime Proving

要实现 Beam Chain 的构想,最核心的难点就是证明效率的提升,既如何将目前几十甚至上百秒的证明时间压缩到秒级。在今年 9 月 24 日由 AntChain OpenLabs、ZAN 和 Pharos 共同举办的 ZK Workshop II [3] 上,嘉宾 Justin 分享了题为 “Realtime Proving” 的报告,彼时他提出的核心观点与 “以太坊 3.0” 设想一脉相承,提出了解决性能瓶颈的解决方案。其鼓励社区使用 ASIC 加速方法,在芯片上完成零知识证明虚拟机从证据生成到证明的全流程,在未来几年内将证明生成的时间提升十倍以上,真正能够实现 Realtime Proving。

为零知识证明技术的性能与应用助力:我们一直在路上

AntChain OpenLabs 一直致力于利用 GPU、FPGA、ASIC 等硬件平台对 ZK 证明进行加速,加速了包括 Polygon ZKEVM Prover、Stone Prover、Halo2 和 Plonky2 在内的多种 ZK 系统,形成了多个 FPGA IP 和 GPU 加速解决方案,部分核心算子达到百倍以上加速比。

AntChain OpenLabs 基于 CUDA 加速的部分算子的相对 CPU 获得的加速比,如表 (一)。

(表一)

AntChain OpenLabs 实现的 GPU 加速的 MSM 与开源 ICICLE 的性能对比(均为 4090GPU),如表(二)。

(表二)

AntChain OpenLabs 实现的 GPU 加速的 Circle FFT 与在 16 核 CPU 上开源 Stwo Prover 的性能对比,如表(三)。

(表三)

此外,AntChain OpenLabs 还致力于零知识证明的应用探索,在 AI+ZK 方向的大模型可验证计算上,使用自主设计的矩阵乘法 Folding、Sumcheck 协议的 GPU+CPU 协同优化、椭圆曲线高效实现等技术,在 4 个 GPU 下将 zkLLM [4][5](原实现不包括承诺和打开,性能为加入承诺和打开之后测试,针对 LLama-7B 模型)的首 token 生成时间由 4 小时降低到约 18 分钟。

AntChain OpenLabs 基于 GPU 方面的积累不断优化大模型可验证计算的性能和可用性,并在承诺方案替换和优化、多实例 Folding、多 token 证明生成方面持续发力,目标构建一个高效、易用、AI 生态友好的可验证计算服务,为零知识证明技术的大规模应用探明可能方向,构建 Web3 和 AI 应用链接的桥梁。

同时面对量子计算机的威胁,AntChain OpenLabs 也进行了积极探索,基于 OpenSSL [6] 改造了一个后量子版本密码库,支持多个 NIST 标准后量子算法。同时面对后量子签名较 ECDSA 有 40 倍以上存储膨胀的问题,通过共识流程以及低延迟内存读取优化,使得抗量子区块链 TPS 可达原链的 50% 左右。

值得关注的是,上述技术探索已在 ZAN 推出的软硬一体加速方案——Power Zebra (https://zan.top/home/power-zebra?chInfo=ch_wxdyh) 中应用落地,该方案针对零知识证明常用的算子进行加速和优化,包括多标量点乘 MSM、数论变换 NTT、H 多项式求解、多项式打开证明等多个关键组件,充分利用了 GPU 的计算资源、存储带宽和 PCIe 带宽,使得运算效率显著提升。此前 zkWASM 开源社区 Delphinus Lab 在引入 ZAN 的软硬一体加速方案 Power Zebra 后,GPU 运算性能提升超 20%,创造社区同类服务最高记录。

预见

长久以来,以太坊社区主要聚焦于执行层的各项优化,包括提高 BlockGasLimit、L2s 等策略。在这其中,执行层的 Snark 化早已在「Rollup Centric」的路线图中借助 L2 完成了大部分工作,收获颇丰。Beam Chain 的想法,则打开了共识层 Snark 化的大门。相信随着 Beam Chain 的提出,会引导和激发社区将目光投入共识层的改造中,带来更多令人激动的想法。

可以预想到,共识层和执行层的 Snark 化,将一起完成 Ethereum Snark 化的最终拼图,为以太坊的扩展性、去中心化作出巨大贡献。同时,随着 Beam Chain 提案的推进,基于零知识证明技术的虚拟机将在以太坊生态中扮演核心角色。通过引入 SNARK 证明和后量子密码学,结合更低的质押门槛以及更快的区块确认时间,Beam Chain 将为以太坊带来更强的去中心化和更高的性能。

参考文献

[1] https://www.youtube.com/watch?v=rGE_RDumZGg[2] https://vitalik.eth.limo/general/2024/10/23/futures4.html[3] https://x.com/zan_team/status/1844947080642539752

[4] https://github.com/jvhs0706/zkllm-ccs2024

[5] https://arxiv.org/abs/2404.16109[6] https://www.openssl.org/

免责声明:作为区块链信息平台,本站所发布文章仅代表作者及嘉宾个人观点,与 Web3Caff 立场无关。文章内的信息仅供参考,均不构成任何投资建议及要约,并请您遵守所在国家或地区的相关法律法规。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
1
评论