AI 모델 암호화폐 거래 경연대회: DeepSeek과 Grok이 수익률에서 선두를 달리다

요약

nof1 Research Lab에서 시작한 Alpha Arena AI 거래 대회에서 DeepSeek Chat V3.1이 +39.61%의 수익률로 선두를 차지했고 , Grok-4가 +35.01%의 수익률을 기록하며 그 뒤를 이었습니다 . 2025년 10월 20일 09:02 UTC 기준, 6개 주요 AI 모델은 Hyperliquid 플랫폼에서 실물 암호화폐 무기한 계약 거래를 통해 총 자산을 6만 달러에서 약 14만 달러로 증가시켜 총 수익률 130%를 달성했습니다.

핵심 분석

대회 개요 및 규칙

Alpha Arena 대회는 2025년 10월 18일에 공식 시작되었습니다. 6개의 최고 AI 모델(DeepSeek Chat V3.1, Grok-4, Claude Sonnet 4.5, Qwen3 Max, GPT-5 및 Gemini 2.5 Pro)은 각각 10,000달러의 USDC 자금을 할당하여 Hyperliquid 탈중앙화 거래소 에서 완전 자율형 암호화폐 영구 계약을 거래했습니다.

이 경쟁은 투명성과 자율성을 강조합니다.

거래 자산 : BTC, ETH, SOL, BNB, DOGE, XRP 6대 주요 암호화폐
레버리지 범위 : 최대 25배 레버리지, AI 모델은 일반적으로 10~25배 레버리지를 사용합니다.
실행 방식 : 완전 온체인 실행, 수동 개입 없음, 모든 거래는 블록체인 브라우저를 통해 검증 가능
전략 제한 : 거래를 위한 앙상블 학습이나 미세 조정은 금지되어 있으며, 기본적인 AI 기능이 테스트됩니다.

실시간 순위 및 성과 지표

순위	AI 모델	계정 가치	생산하다	총 손익	거래 수수료	승률	샤프 비율	완료된 거래 수
1	딥시크 채팅 V3.1	13,961달러	+39.61%	+$3,961	104.53달러	16.7%	0.022	6
2	그록-4	13,501달러	+35.01%	+3,501달러	9.18달러	0%	0.023	1
3	클로드 소네 4.5	12,438달러	+24.38%	+$2,438	115.23달러	20%	0.025	5
4	큐웬3 맥스	10,835달러	+8.35%	+835달러	230.82달러	37.5%	0.018	8
5	GPT-5	7,368달러	-26.32%	-$2,632	89.86달러	0%	-0.022	12
6	제미니 2.5 프로	6,955달러	-30.45%	-3,045달러	447.85달러	19.1%	-0.019	47

거래 전략 분석

DeepSeek Chat V3.1(선도 전략) :

핵심 전략 : "최적 롱(Long)" 전략 채택, 6개 자산 모두에 10~15배 레버리지 롱 포지션 설정
주요 결정 : 800달러 이상의 변동 이익을 내는 무거운 XRP 매수(이 통화에 대한 무거운 포지션을 가진 유일한 모델)
위험 관리 기능 : 가장 낮은 거래 빈도(완료된 거래는 6건에 불과), 처리 수수료 비용의 효과적인 제어
포지션 관리 : 시장 변동에 대한 유연성을 제공하기 위해 2,840달러의 현금 비축

Grok-4(효율적 전략) :

핵심 전략 : 기회주의적 반전 전략, 시장 타이밍을 정확히 파악
주요 결정 : 10월 19일에 BTC 저점매수 (바텀피싱) 공매도(Short) 에서 장기 포지션으로 전환하여 3,500달러의 수익을 얻었습니다.
실행 효율성 : 거래 수가 매우 적고(완료된 거래는 1개뿐) 거래 수수료가 가장 낮습니다($9.18).
과거 실적 : 개인 테스트에서 단 하루 만에 $200에서 $1,000로 증가(+400%)

성능이 좋지 않은 모델 :

GPT-5 : 공매도(Short) 전략에 지나치게 의존한 탓에 시장이 상승하는 동안 상당한 손실이 발생했으며, 완료된 12개 거래 모두 손실로 이어졌습니다.
Gemini 2.5 Pro : 과도한 거래(47건), 최대 $447.85의 수수료, 역효과를 낳은 공격적인 15-25배 레버리지 전략

소셜 미디어 반응

소셜 미디어에서는 대회 결과에 대한 관심이 많았으며, 주요 토론 주제는 다음과 같습니다.

리더들에 대한 칭찬 :

DeepSeek의 선두적인 위치는 커뮤니티에 충격을 주었고, 오픈 소스 모델의 실질적인 장점을 입증하는 "다크호스의 승리"로 칭찬을 받았습니다.
그록은 보수적인 리스크- 보상 균형과 정확한 시장 타이밍으로 칭찬을 받았습니다.
커뮤니티에서는 이를 AI의 거래 능력에 대한 "실제 돈 증거"로 보고 있습니다 .

뒤처진 기업에 대한 비판 :

제미니 2.5 프로는 무려 42%의 손실로 조롱을 받았는데, 공격적인 패턴 매칭 전략은 암호화폐의 예측 불가능한 특성에 적합하지 않다는 평가를 받았습니다.
사용자들은 기본 리스크 관리에서 "하이엔드" AI의 실패에 의문을 제기합니다 . x.com

전반적인 서사 주제 :

오픈 소스 vs. 거대 다이나믹스 : DeepSeek의 리드가 GPT-5와 Claude의 과대광고에 도전하다
투명성의 가치 : Hyperliquid의 온체인 가시성은 게임 체인저로 환영받았습니다.
AI의 한계 : 실패 사례는 정서 에 따른 변동으로 어려움을 겪는 AI를 강조합니다.

기술 인프라

이 경쟁은 Hyperliquid Layer-1 블록체인의 고성능 DeFi 거래 인프라를 기반으로 합니다.

플랫폼 기능 :

실행 속도 : 밀리초 미만의 실행 속도로 AI 에이전트의 고빈도 의사결정 지원
유동성 깊이 : 일일 거래량이 50억 달러를 초과하는 100개 이상의 영구 계약을 지원합니다.
리스크 관리 : 체인 청산을 방지하기 위한 내장 자동 청산(ADL) 메커니즘

데이터 제공 :

실시간 데이터 : 가격, 캔들스틱 차트, 거래량, 오더북 깊이
업데이트 빈도 : 1분 미만의 실시간 업데이트로 동적 분석 지원
데이터 출처 : Chainlink 및 기타 오라클 보완한 Hyperliquid 온체인 데이터

온체인 활동 분석

전반적인 활동 패턴 :

초기 자금 조달 : AI 모델별 전용 금고당 10,000 USDC
사용된 레버리지 : 평균 레버리지 15배, 총 명목 거래량은 100만 달러 이상으로 추산됨
포지션 특성 : 단기 포지션(몇 시간에서 며칠), 고빈도 조정 전략

키 온체인 트렌드 :

10월 18일 : 각 모델 보관소에 최초 10,000 USDC 입금
10월 19일 : BTC/ETH 반등을 집단적으로 포착한 DeepSeek의 XRP 롱 포지션은 800달러의 이익을 냈습니다.
자본 흐름 : 상당한 자본 유출 없음, 모든 자본은 거래를 위해 금고에 보관됨

결론적으로

DeepSeek Chat V3.1은 포괄적인 장기 전략과 정밀한 리스크 관리로 AI 암호화폐 거래 경쟁에서 확실한 우위를 점했습니다. Grok-4는 효율적인 거래 실행과 정밀한 마켓 타이밍으로 그 뒤를 바짝 쫓았습니다. 이 경쟁은 금융 시장에서 AI의 잠재력을 입증했을 뿐만 아니라, 변동성이 높은 자산을 처리할 때 다양한 AI 모델 간의 중요한 차이점을 드러냈습니다. 이 경쟁의 투명성과 온체인 실행은 AI-DeFi 통합의 새로운 기준을 제시했으며, 자율 거래 에이전트의 미래에 긍정적인 영향을 미칠 것으로 기대됩니다.

Surf 에 대해 더 알아보기