AI 모델 암호화폐 거래 경연대회: DeepSeek과 Grok이 수익률에서 선두를 달리다
요약
nof1 Research Lab에서 시작한 Alpha Arena AI 거래 대회에서 DeepSeek Chat V3.1이 +39.61%의 수익률로 선두를 차지했고 , Grok-4가 +35.01%의 수익률을 기록하며 그 뒤를 이었습니다 . 2025년 10월 20일 09:02 UTC 기준, 6개 주요 AI 모델은 Hyperliquid 플랫폼에서 실물 암호화폐 무기한 계약 거래를 통해 총 자산을 6만 달러에서 약 14만 달러로 증가시켜 총 수익률 130%를 달성했습니다.
핵심 분석
대회 개요 및 규칙
Alpha Arena 대회는 2025년 10월 18일에 공식 시작되었습니다. 6개의 최고 AI 모델(DeepSeek Chat V3.1, Grok-4, Claude Sonnet 4.5, Qwen3 Max, GPT-5 및 Gemini 2.5 Pro)은 각각 10,000달러의 USDC 자금을 할당하여 Hyperliquid 탈중앙화 거래소 에서 완전 자율형 암호화폐 영구 계약을 거래했습니다.
이 경쟁은 투명성과 자율성을 강조합니다.
- 거래 자산 : BTC, ETH, SOL, BNB, DOGE, XRP 6대 주요 암호화폐
- 레버리지 범위 : 최대 25배 레버리지, AI 모델은 일반적으로 10~25배 레버리지를 사용합니다.
- 실행 방식 : 완전 온체인 실행, 수동 개입 없음, 모든 거래는 블록체인 브라우저를 통해 검증 가능
- 전략 제한 : 거래를 위한 앙상블 학습이나 미세 조정은 금지되어 있으며, 기본적인 AI 기능이 테스트됩니다.
실시간 순위 및 성과 지표
| 순위 | AI 모델 | 계정 가치 | 생산하다 | 총 손익 | 거래 수수료 | 승률 | 샤프 비율 | 완료된 거래 수 |
|---|---|---|---|---|---|---|---|---|
| 1 | 딥시크 채팅 V3.1 | 13,961달러 | +39.61% | +$3,961 | 104.53달러 | 16.7% | 0.022 | 6 |
| 2 | 그록-4 | 13,501달러 | +35.01% | +3,501달러 | 9.18달러 | 0% | 0.023 | 1 |
| 3 | 클로드 소네 4.5 | 12,438달러 | +24.38% | +$2,438 | 115.23달러 | 20% | 0.025 | 5 |
| 4 | 큐웬3 맥스 | 10,835달러 | +8.35% | +835달러 | 230.82달러 | 37.5% | 0.018 | 8 |
| 5 | GPT-5 | 7,368달러 | -26.32% | -$2,632 | 89.86달러 | 0% | -0.022 | 12 |
| 6 | 제미니 2.5 프로 | 6,955달러 | -30.45% | -3,045달러 | 447.85달러 | 19.1% | -0.019 | 47 |
거래 전략 분석
DeepSeek Chat V3.1(선도 전략) :
- 핵심 전략 : "최적 롱(Long)" 전략 채택, 6개 자산 모두에 10~15배 레버리지 롱 포지션 설정
- 주요 결정 : 800달러 이상의 변동 이익을 내는 무거운 XRP 매수(이 통화에 대한 무거운 포지션을 가진 유일한 모델)
- 위험 관리 기능 : 가장 낮은 거래 빈도(완료된 거래는 6건에 불과), 처리 수수료 비용의 효과적인 제어
- 포지션 관리 : 시장 변동에 대한 유연성을 제공하기 위해 2,840달러의 현금 비축
Grok-4(효율적 전략) :
- 핵심 전략 : 기회주의적 반전 전략, 시장 타이밍을 정확히 파악
- 주요 결정 : 10월 19일에 BTC 저점매수 (바텀피싱) 공매도(Short) 에서 장기 포지션으로 전환하여 3,500달러의 수익을 얻었습니다.
- 실행 효율성 : 거래 수가 매우 적고(완료된 거래는 1개뿐) 거래 수수료가 가장 낮습니다($9.18).
- 과거 실적 : 개인 테스트에서 단 하루 만에 $200에서 $1,000로 증가(+400%)
성능이 좋지 않은 모델 :
- GPT-5 : 공매도(Short) 전략에 지나치게 의존한 탓에 시장이 상승하는 동안 상당한 손실이 발생했으며, 완료된 12개 거래 모두 손실로 이어졌습니다.
- Gemini 2.5 Pro : 과도한 거래(47건), 최대 $447.85의 수수료, 역효과를 낳은 공격적인 15-25배 레버리지 전략
소셜 미디어 반응
소셜 미디어에서는 대회 결과에 대한 관심이 많았으며, 주요 토론 주제는 다음과 같습니다.
리더들에 대한 칭찬 :
- DeepSeek의 선두적인 위치는 커뮤니티에 충격을 주었고, 오픈 소스 모델의 실질적인 장점을 입증하는 "다크호스의 승리"로 칭찬을 받았습니다.
- 그록은 보수적인 리스크- 보상 균형과 정확한 시장 타이밍으로 칭찬을 받았습니다.
- 커뮤니티에서는 이를 AI의 거래 능력에 대한 "실제 돈 증거"로 보고 있습니다 .
뒤처진 기업에 대한 비판 :
- 제미니 2.5 프로는 무려 42%의 손실로 조롱을 받았는데, 공격적인 패턴 매칭 전략은 암호화폐의 예측 불가능한 특성에 적합하지 않다는 평가를 받았습니다.
- 사용자들은 기본 리스크 관리에서 "하이엔드" AI의 실패에 의문을 제기합니다 . x.com
전반적인 서사 주제 :
- 오픈 소스 vs. 거대 다이나믹스 : DeepSeek의 리드가 GPT-5와 Claude의 과대광고에 도전하다
- 투명성의 가치 : Hyperliquid의 온체인 가시성은 게임 체인저로 환영받았습니다.
- AI의 한계 : 실패 사례는 정서 에 따른 변동으로 어려움을 겪는 AI를 강조합니다.
기술 인프라
이 경쟁은 Hyperliquid Layer-1 블록체인의 고성능 DeFi 거래 인프라를 기반으로 합니다.
플랫폼 기능 :
- 실행 속도 : 밀리초 미만의 실행 속도로 AI 에이전트의 고빈도 의사결정 지원
- 유동성 깊이 : 일일 거래량이 50억 달러를 초과하는 100개 이상의 영구 계약을 지원합니다.
- 리스크 관리 : 체인 청산을 방지하기 위한 내장 자동 청산(ADL) 메커니즘
데이터 제공 :
- 실시간 데이터 : 가격, 캔들스틱 차트, 거래량, 오더북 깊이
- 업데이트 빈도 : 1분 미만의 실시간 업데이트로 동적 분석 지원
- 데이터 출처 : Chainlink 및 기타 오라클 보완한 Hyperliquid 온체인 데이터
온체인 활동 분석
전반적인 활동 패턴 :
- 초기 자금 조달 : AI 모델별 전용 금고당 10,000 USDC
- 사용된 레버리지 : 평균 레버리지 15배, 총 명목 거래량은 100만 달러 이상으로 추산됨
- 포지션 특성 : 단기 포지션(몇 시간에서 며칠), 고빈도 조정 전략
키 온체인 트렌드 :
- 10월 18일 : 각 모델 보관소에 최초 10,000 USDC 입금
- 10월 19일 : BTC/ETH 반등을 집단적으로 포착한 DeepSeek의 XRP 롱 포지션은 800달러의 이익을 냈습니다.
- 자본 흐름 : 상당한 자본 유출 없음, 모든 자본은 거래를 위해 금고에 보관됨
결론적으로
DeepSeek Chat V3.1은 포괄적인 장기 전략과 정밀한 리스크 관리로 AI 암호화폐 거래 경쟁에서 확실한 우위를 점했습니다. Grok-4는 효율적인 거래 실행과 정밀한 마켓 타이밍으로 그 뒤를 바짝 쫓았습니다. 이 경쟁은 금융 시장에서 AI의 잠재력을 입증했을 뿐만 아니라, 변동성이 높은 자산을 처리할 때 다양한 AI 모델 간의 중요한 차이점을 드러냈습니다. 이 경쟁의 투명성과 온체인 실행은 AI-DeFi 통합의 새로운 기준을 제시했으며, 자율 거래 에이전트의 미래에 긍정적인 영향을 미칠 것으로 기대됩니다.