4조 달러 규모의 TPU(기술 혁신 플랫폼)를 목표로 하는 구글은 어떻게 블록체인 분야에 의미 있는 영향을 미칠 수 있을까요?

이 기사는 기계로 번역되었습니다
원문 표시

현대 컴퓨팅의 하드웨어 역사는 GPU의 등장으로 크게 좌우되었습니다.

원문: GPU를 넘어서: TPU가 양자 후 블록체인의 숨겨진 엔진인 이유 (x)

저자: Eli5DeFi

작성: 팀, PANews

PANews 편집자 주: 11월 25일, 구글의 시총 3조 9600억 달러라는 역대 신고점 경신했습니다. 이러한 주가 급등에는 최근 출시된 최강 AI 칩인 제미니 3와 자체 개발 TPU 칩이 주요 요인으로 작용했습니다. TPU는 AI 분야뿐 아니라 블록체인 기술에서도 중요한 역할을 할 것으로 예상됩니다.

현대 컴퓨팅의 하드웨어 역사는 GPU의 등장으로 크게 좌우되었습니다.

게임부터 딥러닝에 이르기까지, NVIDIA의 병렬 아키텍처는 업계에서 인정받는 표준이 되었으며, 이로 인해 CPU는 점차 공동 관리 역할을 수행하게 되었습니다.

하지만 AI 모델이 확장성 병목 현상에 직면하고 블록체인 기술이 복잡한 암호화 애플리케이션으로 발전함에 따라 새로운 경쟁자인 텐서 프로세서(TPU)가 등장했습니다.

TPU는 종종 구글의 AI 전략의 프레임 안에서 논의되지만, 그 아키텍처는 뜻밖에도 블록체인 기술의 다음 이정표인 양자 후 암호화 의 핵심 요구 사항과 일치합니다.

이 글에서는 하드웨어의 발전 과정을 살펴보고 아키텍처적 특징을 비교함으로써, 양자 공격에 강한 탈중앙화 네트워크를 구축할 때 양자 후 암호화 에 필요한 고강도 수학 연산을 처리하는 데 GPU보다는 TPU가 더 적합한 이유를 설명합니다.

하드웨어의 진화: 직렬 처리에서 펄스형 아키텍처로

TPU의 중요성을 이해하려면 먼저 TPU가 해결하는 문제점을 이해해야 합니다.

  • 중앙 처리 장치(CPU): 다재다능한 장치로서 직렬 처리 및 논리 분기 연산에 탁월하지만, 대규모 수학 연산을 동시에 수행해야 할 때는 그 역할이 제한적입니다.
  • 그래픽 처리 장치(GPU): 병렬 처리 전문가인 GPU는 원래 픽셀 렌더링을 위해 설계되었으며, 따라서 동일한 작업을 대량 으로 동시에 실행하는 데 탁월합니다(SIMD: 단일 명령어 다중 데이터). 이러한 특징 덕분에 GPU는 인공지능의 초기 폭발적인 성장에 핵심적인 역할을 했습니다.
  • 텐서 프로세서(TPU): 구글이 신경망 컴퓨팅 작업을 위해 특별히 설계한 칩.

맥동형 건축의 장점

GPU와 TPU의 근본적인 차이점은 데이터 처리 방식에 있습니다.

GPU는 연산을 위해 메모리(레지스터, 캐시)에 반복적으로 접근해야 하는 반면, TPU는 맥동하는 아키텍처를 사용합니다. 이 아키텍처는 마치 심장이 혈액을 펌핑하는 것처럼 대규모 컴퓨팅 그리드를 통해 데이터가 규칙적이고 맥동하는 방식으로 흐르도록 합니다.

https://www.ainewshub.org/post/ai-inference-costs-tpu-vs-gpu-2025

계산 결과는 메모리에 다시 기록할 필요 없이 다음 연산 장치로 직접 전달됩니다. 이러한 설계는 메모리와 프로세서 간의 데이터 반복 이동으로 인한 지연 시간인 폰 노이만 병목 현상을 크게 완화하여 특정 수학 연산의 처리량을 10배 이상 향상시킵니다.

양자 후 암호화의 핵심: 블록체인에 TPU가 필요한 이유는 무엇일까요?

블록체인 분야에서 TPU의 가장 중요한 응용 분야는 채굴 아니라 암호화 보안입니다.

현재 블록체인 시스템은 타원 곡선 암호화 또는 RSA 암호화를 사용하는데, 이는 쇼어 알고리즘에 대응하는 데 치명적인 약점을 가지고 있습니다. 즉, 충분히 강력한 양자 컴퓨터가 개발되면 공격자는 공개 키로부터 개인 키를 추론하여 비트코인이나 이더 의 모든 암호화 자산을 완전히 파괴할 수 있습니다.

해결책은 양자 후 암호화에 있습니다. 현재 주류 양자 후 암호화 표준 알고리즘(예: Kyber 및 Dilithium)은 모두 격자 암호화를 기반으로 합니다.

TPU의 수학적 적합성

이것이 바로 TPU가 GPU보다 우월한 점입니다. 격자 암호화는 대규모 행렬 및 벡터에 대한 집중적인 연산에 크게 의존하며, 주로 다음과 같은 연산을 포함합니다.

  • 행렬-벡터 곱셈: A + e (여기서 A는 행렬이고, s와 e는 벡터입니다).
  • 다항식 연산: 환을 기반으로 하는 대수 연산으로, 일반적으로 정수론 변환을 사용하여 구현됩니다.

기존 GPU는 이러한 계산을 범용 병렬 작업으로 처리하는 반면, TPU는 하드웨어 수준의 고정 행렬 연산 장치를 통해 전용 가속을 구현합니다. Lattice 암호화의 수학적 구조와 TPU의 펄스형 어레이의 물리적 구조는 거의 완벽한 위상적 대응 관계를 형성합니다.

TPU와 GPU 간의 기술적 경쟁

GPU가 여전히 업계의 보편적인 왕좌를 차지하고 있지만, TPU는 특정 수학 집약적인 작업을 처리할 때 분명한 이점을 가지고 있습니다.

결론: GPU는 다용도성과 생태계 측면에서 뛰어나지만, TPU는 인공지능과 현대 고급 암호화 기술의 핵심 수학 연산인 선형 대수 연산의 효율성 측면에서 우위를 점합니다.

TPU가 담론을 확장합니다: 영지식 증명과 탈중앙화 AI

TPU는 양자 후 암호화 외에도 웹3의 두 가지 핵심 영역에서 응용 가능성을 보여주었습니다.

영지식 증명

이더 확장을 위한 솔루션인 ZK-Rollups(예: Starknet 또는 zkSync)는 증명 생성 과정에서 막대한 연산량을 필요로 하며, 주요 연산량은 다음과 같습니다.

  • 고속 푸리에 변환(FFT): 데이터 표현 형식의 빠른 변환을 가능하게 합니다.
  • 다중 스칼라 곱셈: 타원 곡선 상의 점 연산 구현.
  • FRI 프로토콜: 다항식 검증을 위한 암호화 증명 시스템

이러한 유형의 연산은 ASIC이 탁월한 해시 계산이 아니라 다항식 연산입니다. 범용 CPU와 비교했을 때 TPU는 FFT 및 다항식 커밋먼트 연산을 크게 가속화할 수 있으며, 이러한 알고리즘은 데이터 흐름 특성이 예측 가능하기 때문에 일반적으로 GPU보다 더 높은 효율의 가속을 달성할 수 있습니다.

Bittensor와 같은 탈중앙화 AI 네트워크가 등장함에 따라 네트워크 노드는 AI 모델 추론을 실행할 수 있는 능력을 갖춰야 합니다. 범용 대규모 언어 모델을 실행하는 것은 본질적으로 엄청난 행렬 곱셈 연산을 수행하는 것과 같습니다.

GPU 클러스터와 비교했을 때, TPU는 탈중앙화 노드가 더 낮은 에너지 소비로 AI 추론 요청을 처리할 수 있도록 하여 탈중앙화 AI의 상업적 타당성을 향상시킵니다.

TPU 생태계 경관

CUDA의 광범위한 도입으로 인해 대부분의 프로젝트가 여전히 GPU에 의존하고 있지만, 특히 양자 후 암호학 및 영지식 증명과 프레임 분야에서 TPU 통합이 유망합니다.

영지식 증명 및 확장성 솔루션

TPU를 선택해야 하는 이유는 무엇일까요? ZK 증명 생성에는 다항식 연산의 대규모 병렬 처리가 필요하며, 특정 아키텍처 구성에서는 TPU가 이러한 작업을 처리하는 데 있어 일반 GPU보다 훨씬 효율적이기 때문입니다.

  • Starknet(2계층 확장 방식): STARK 증명은 고속 푸리에 변환(FFT)과 고속 리드-솔로몬 대화형 오라클 증명에 크게 의존하며, 이러한 계산 집약적인 연산은 TPU의 계산 논리와 매우 잘 호환됩니다.
  • zksync(2계층 확장 솔루션): 이 솔루션의 Airbender 증명기 대규모 FFT 및 다항식 연산을 처리해야 하는데, 이는 TPU가 해결할 수 있는 핵심 병목 현상입니다.
  • 스크롤(2층 확장 방식): Halo2 및 Plonk 검증 시스템을 채택했으며, 핵심 연산인 KZG 커밋먼트 검증과 멀티스칼라 곱셈은 TPU의 펄스 아키텍처와 완벽하게 호환됩니다.
  • Aleo(개인정보 보호 퍼블릭 체인): zk-SNARK 영지식 증명 생성에 초점을 맞추고 있으며, 핵심 연산은 TPU의 전용 컴퓨팅 처리량과 매우 잘 호환되는 다항식 수학적 특성을 활용합니다.
  • 미나(경량 공개 블록체인): 재귀적 SNARKs 기술을 채택하고 있습니다. 증명을 지속적으로 재생성하는 메커니즘은 다항식 연산의 반복적인 실행을 필요로 합니다. 이러한 특징은 TPU의 높은 연산 가치를 부각합니다.
  • Zcash(프라이버시 코인): 고전적인 Groth16 증명 시스템은 다항식 연산에 의존합니다. 초기 기술임에도 불구하고 고성능 하드웨어를 활용하면 여전히 상당한 이점을 누릴 수 있습니다.
  • 파일코인(DePIN, 스토리지): 복제 증명 메커니즘을 통해 영지식 증명과 다항식 코딩 기법으로 저장된 데이터의 유효성을 검증합니다.

탈중앙화 AI 및 에이전트 컴퓨팅

TPU를 선택해야 하는 이유는 무엇일까요? 바로 TPU의 주된 활용 시나리오가 신경망 머신러닝(ML) 작업 가속화를 위해 특별히 설계되었기 때문입니다.

  • Bittensor의 핵심 아키텍처는 탈중앙화 AI 추론이며, 이는 TPU의 텐서 컴퓨팅 기능과 완벽하게 부합합니다.
  • Fetch(AI 에이전트): 자율 AI 에이전트는 의사 결정을 위해 지속적인 신경망 추론에 의존하며, TPU는 이러한 모델을 더 낮은 지연 시간으로 실행할 수 있습니다.
  • 싱귤래리티(AI 서비스 플랫폼): 인공지능 서비스 거래 시장 플레이스인 싱귤래리티는 TPU를 통합하여 기본 모델 실행 속도와 비용 효율성을 크게 향상시킵니다.
  • NEAR(퍼블릭 체인, AI 전략적 전환): 온체인 AI 및 신뢰할 수 있는 실행 환경 프록시로의 전환을 위해서는 TPU 가속이 필요한 텐서 연산이 필수적입니다.

양자 후 암호화 네트워크

TPU를 선택해야 하는 이유는 무엇일까요? 양자 후 암호화의 핵심 연산은 종종 격자에서 가장 짧은 벡터를 찾는 문제와 관련이 있습니다. 이러한 작업은 밀집 행렬 및 벡터 연산을 필요로 하며, 계산 아키텍처 측면에서 AI 워크로드와 매우 유사합니다.

  • 알고랜드(퍼블릭 블록체인): 양자 컴퓨팅 환경에서도 안전한 해싱 및 벡터 연산 방식을 채택하여 TPU의 병렬 수학 연산 능력과 높은 호환성을 자랑합니다.
  • QAN(양자 저항 공개 체인): 격자 암호화를 사용하며, 그 기반이 되는 다항식 및 벡터 연산은 TPU가 전문으로 하는 수학적 최적화 영역과 매우 유사합니다.
  • 넥서스(컴퓨팅 플랫폼, ZkVM): 양자 내성 연산 준비에는 TPU 아키텍처에 효율적으로 매핑될 수 있는 다항식 및 격자 기저 알고리즘이 포함됩니다.
  • 셀프레임(양자 충격에 강한 공개 블록체인): 셀프레임에서 사용하는 격자 암호화 및 해시 암호화 기술은 텐서와 유사한 연산을 포함하므로 TPU 가속에 이상적인 후보입니다.
  • 아벨리안(프라이버시 토큰): 양자 후 암호화 격자 연산에 초점을 맞춥니다. QAN과 유사하게, 기술 아키텍처는 TPU 벡터 프로세서의 높은 처리량을 최대한 활용합니다.
  • 퀀투스(퍼블릭 블록체인): 양자 후 암호화 서명은 대규모 벡터 연산에 의존하는데, TPU는 표준 CPU보다 이러한 연산을 처리하는 데 훨씬 높은 병렬화 기능을 갖추고 있습니다.
  • 파울리(컴퓨팅 플랫폼): 양자 안전 컴퓨팅에는 대량 행렬 연산이 포함되는데, 이것이 바로 TPU 아키텍처의 핵심 장점입니다.

개발 병목 현상: TPU가 아직 널리 채택되지 않은 이유는 무엇일까요?

TPU가 양자 후 암호화 및 영지식 증명에서 그렇게 효율적이라면, 왜 업계는 여전히 H100 칩을 사려고 안간힘을 쓰는 걸까요?

  • CUDA의 진입 장벽: NVIDIA의 CUDA 소프트웨어 라이브러리는 업계 표준이 되었으며, 대다수의 암호화 엔지니어가 CUDA를 사용하여 프로그래밍합니다. TPU에서 요구하는 JAX 또는 XLA 프레임 로 코드를 포팅하는 것은 기술적으로 어려울 뿐만 아니라 대량 리소스 투자가 필요합니다.
  • 클라우드 플랫폼 진입 장벽: 고성능 TPU는 거의 구글 클라우드가 독점하고 있습니다. 단일 중앙 집중식 클라우드 서비스 제공업체에 지나치게 의존하는 탈중앙화 네트워크는 검열 리스크 과 단일 장애 지점에 직면하게 됩니다.
  • 경직된 아키텍처: 암호화 알고리즘에 미세 조정(예: 분기 논리 도입)이 필요한 경우 TPU의 성능이 급격히 저하됩니다. 반면 GPU는 이러한 불규칙적인 논리를 처리하는 데 TPU보다 훨씬 뛰어납니다.
  • 해시 연산의 한계: TPU는 비트코인 ​​채굴기를 대체할 수 없습니다. SHA-256 알고리즘은 행렬 연산이 아닌 비트 수준 연산을 사용하기 때문에 TPU는 이 분야에서 활용될 수 없습니다.

결론: 계층형 아키텍처가 미래입니다.

웹3 하드웨어의 미래는 승자독식 경쟁이 아니라 계층형 아키텍처로의 진화입니다.

GPU는 일반 컴퓨팅, 그래픽 렌더링 및 복잡한 분기 논리가 필요한 작업에서 계속해서 주도적인 역할을 수행할 것입니다.

TPU(및 유사한 ASIC 기반 가속기)는 영지식 증명 및 검증된 양자 암호화 서명을 생성하도록 특별히 설계된 Web3 "수학 계층"의 표준 구성으로 점차 자리 잡을 것입니다.

블록체인이 양자 후 보안 표준으로 전환됨에 따라, 거래 서명 및 검증에 필요한 대규모 행렬 연산으로 인해 TPU의 펄스 아키텍처는 더 이상 선택 사항이 아니라 확장 가능하고 양자 보안이 확보된 탈중앙화 네트워크를 구축하는 데 필수적인 인프라가 될 것입니다.

면책 조항: 본 사이트는 블록체인 정보 플랫폼으로서, 사이트에 게시된 글은 필자 및 초청 연사의 개인적인 관점 일 뿐이며 Web3Caff의 공식적인 입장을 반영하는 것은 아닙니다. 본 글에 포함된 정보는 참고용일 뿐이며 투자 자문 또는 투자 제안으로 간주될 수 없습니다. 각 국가 또는 지역의 관련 법률 및 규정을 준수하시기 바랍니다.

Web3Caff 공식 커뮤니티 에 오신 것을 환영합니다 : 트위터 계정 | Web3Caff 리서치 트위터 계정 | 위챗 리더 그룹 | 위챗 공식 계정

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트