핵심 과제: Realtime Proving
Beam Chain의 구상을 실현하기 위해서는 증명 효율 향상이 가장 핵심적인 과제입니다. 즉, 현재 수십 초에서 수백 초가 걸리는 증명 시간을 초 단위로 단축하는 것입니다. 2022년 9월 24일 AntChain OpenLabs, ZAN, Pharos가 공동 주최한 ZK Workshop II [3]에서 Justin은 "Realtime Proving"이라는 주제로 발표했습니다. 그는 이더리움 3.0의 구상과 맥락을 같이하며, 성능 병목 문제를 해결할 수 있는 방안을 제시했습니다. 그는 커뮤니티가 ASIC 가속 방식을 활용하여 칩 단계에서 영지식 증명 가상 머신의 증거 생성부터 증명까지 전 과정을 수행함으로써, 향후 수년 내에 증명 생성 시간을 10배 이상 단축하여 Realtime Proving을 실현할 수 있다고 제안했습니다.
영지식 증명 기술의 성능과 응용 지원: 우리는 계속 전진하고 있습니다
AntChain OpenLabs는 GPU, FPGA, ASIC 등 하드웨어 플랫폼을 활용하여 ZK 증명을 가속화하는 데 힘써왔습니다. Polygon ZKEVM Prover, Stone Prover, Halo2, Plonky2 등 다양한 ZK 시스템의 가속화를 이루었으며, 여러 FPGA IP와 GPU 가속 솔루션을 개발했습니다. 일부 핵심 연산자의 경우 100배 이상의 가속 효과를 달성했습니다.
AntChain OpenLabs가 CUDA 가속을 통해 CPU 대비 달성한 일부 연산자의 가속 비율은 다음 표(일)와 같습니다.
AntChain OpenLabs가 구현한 GPU 가속 MSM과 오픈소스 ICICLE의 성능 비교(모두 4090GPU 기준)는 다음 표(이)와 같습니다.
AntChain OpenLabs가 구현한 GPU 가속 Circle FFT와 16코어 CPU 상의 오픈소스 Stwo Prover의 성능 비교는 다음 표(삼)과 같습니다.
또한 AntChain OpenLabs는 영지식 증명의 응용 탐구에도 힘써왔습니다. AI+ZK 분야의 대규모 모델 검증 가능 계산 분야에서는 자체 설계한 행렬 곱셈 Folding, Sumcheck 프로토콜의 GPU+CPU 협업 최적화, 타원 곡선 고효율 구현 등의 기술을 활용하여 4개의 GPU에서 zkLLM [4][5](원 구현에는 약정과 공개가 포함되지 않았으며, 약정과 공개를 포함한 성능 측정 결과, LLama-7B 모델 대상)의 첫 토큰 생성 시간을 4시간에서 약 18분으로 단축했습니다.
AntChain OpenLabs는 GPU 분야의 축적된 경험을 바탕으로 대규모 모델 검증 가능 계산의 성능과 활용성을 지속적으로 최적화하고 있습니다. 약정 방식 대체 및 최적화, 다중 인스턴스 Folding, 다중 토큰 증명 생성 등에서 계속해서 노력하고 있으며, 효율적이고 사용이 편리하며 AI 생태계와 친화적인 검증 가능 계산 서비스를 구축하여 영지식 증명 기술의 대규모 응용을 위한 가능성을 모색하고 있습니다.
동시에 양자 컴퓨팅의 위협에 대응하기 위해 AntChain OpenLabs는 적극적인 탐구를 진행했습니다. OpenSSL [6]을 개조하여 후량자 버전 암호 라이브러리를 개발했으며, NIST 표준 후량자 알고리즘을 지원합니다. 또한 후량자 서명이 ECDSA에 비해 40배 이상의 저장 공간 팽창 문제에 대해, 합의 프로세스와 저지연 메모리 읽기 최적화를 통해 양자 내성 블록체인의 TPS를 원 체인의 약 50% 수준까지 달성할 수 있었습니다.
주목할 만한 것은, 이러한 기술 탐구가 ZAN이 출시한 소프트웨어-하드웨어 일체형 가속 솔루션인 Power Zebra (https://zan.top/home/power-zebra?chInfo=ch_wxdyh)에 적용되어 구현되었다는 점입니다. 이 솔루션은 다중 스칼라 점곱 MSM, 수론 변환 NTT, H 다항식 해결, 다항식 공개 증명 등 영지식 증명에 널리 사용되는 연산자들을 가속하고 최적화했습니다. GPU의 계산 자원, 저장 대역폭, PCIe 대역폭을 충분히 활용하여 연산 효율을 크게 향상시켰습니다. 이전에 zkWASM 오픈소스 커뮤니티 Delphinus Lab이 Power Zebra의 소프트웨어-하드웨어 일체형 가속 솔루션을 도입한 후, GPU 연산 성능이 20% 이상 향상되어 커뮤니티 내 유사 서비스 중 최고 기록을 달성했습니다.
전망
그동안 이더리움 커뮤니티는 주로 실행 레이어의 다양한 최적화에 초점을 맞추어왔습니다. 여기에는 BlockGasLimit 상향, L2 등의 전략이 포함됩니다. 그 과정에서 실행 레이어의 Snark화는 이미 "Rollup Centric" 로드맵 하에 L2를 통해 상당 부분 완성되었고, 많은 성과를 거두었습니다. 이제 Beam Chain의 아이디어는 컨센서스 레이어의 Snark화를 열어젖히고 있습니다. 이를 계기로 커뮤니티가 컨센서스 레이어의 개선에 관심을 기울이게 되어, 더욱 흥미로운 아이디어들이 나올 것으로 기대됩니다.
컨센서스 레이어와 실행 레이어의 Snark화가 함께 이루어진다면, 이더리움의 Snark화를 완성하는 마지막 퍼즐이 완성될 것입니다. 이는 이더리움의 확장성과 탈중앙화에 큰 기여를 할 것입니다. 또한 Beam Chain 제안이 진전됨에 따라, 영지식 증명 기술 기반의 가상 머신이 이더리움 생태계의 핵심 역할을 하게 될 것입니다. SNARK 증명과 후량자 암호학을 도입하고, 더 낮은 스테이킹 진입장벽과 더 빠른 블록 확인 시간을 결합하여, Beam Chain은 이더리움에 더 강력한 탈중앙화와 높은 성능을 제공할 것입니다.
참고 문헌
[1] https://www.youtube.com/watch?v=rGE_RDumZGg[2] https://vitalik.eth.limo/general/2024/10/23/futures4.html[3] https://x.com/zan_team/status/1844947080642539752[4] https://github.com/jvhs0706/zkllm-ccs2024
[5] https://arxiv.org/abs/2404.16109[6] https://www.openssl.org/면책 조항: 본 사이트는 블록체인 정보 플랫폼으로, 게시된 기사는 저자 및 연사 개인의 견해를 나타내며 Web3Caff의 입장과 무관합니다. 기사 내용은 참고용으로만 활용하시기 바라며, 관련 법규를 준수하시기 바랍니다.
Web3Caff 공식 커뮤니티에 가입하세요: X(Twitter) 계정 | WeChat 독자 그룹 | WeChat 공식 계정 | Telegram 구독 그룹 | Telegram 토론 그룹