David, 테크 플로우 (techflowpost) 작성
좋은 소식이 있습니다. 10월 11일의 대폭락 이후 암호화폐 거래가 다시 활발해졌습니다.
나쁜 소식은 AI가 거래되고 있다는 것입니다.
새로운 주가 시작되면서 시장이 활성화되기 시작했고, nof1.ai 라는 프로젝트가 암호화폐 소셜 미디어에서 대량 논의를 불러일으켰습니다.
모두의 관심은 간단합니다. 그들은 이 프로젝트에 참여하는 6개의 대형 AI 모델을 실시간으로 관찰하고 Hyperliquid에서 암호화폐 거래를 통해 누가 더 많은 수익을 내는지 확인합니다.
이 플랫폼은 시뮬레이션된 거래 플랫폼이 아닙니다. Claude, GPT-5, Gemini, Deepseek, Grok, Tongyi Qianwen은 Hyperliquid에서 각각 1만 달러 상당의 실제 자금을 거래했습니다. 모든 주소는 공개되어 누구나 이 "AI 거래자 전쟁"을 실시간으로 시청할 수 있습니다.
흥미롭게도, 이 여섯 가지 AI는 정확히 동일한 프롬프트를 사용하고 정확히 동일한 시장 데이터를 받습니다. 유일한 변수는 개별적인 사고 방식입니다.
10월 18일에 온라인에 접속한 후 단 며칠 만에 일부 AI는 20% 이상의 수익을 올렸지만, 다른 AI는 거의 40%의 손실을 입었습니다.
1950년, 튜링은 "기계가 인간처럼 생각할 수 있을까?"라는 질문에 답하기 위해 유명한 튜링 테스트를 제안했습니다. 이제 코인업계 에서는 6개의 주요 AI가 알파 아레나에서 경쟁하며 더욱 흥미로운 질문에 답하고 있습니다.
가장 똑똑한 AI가 실제 시장에서 거래할 수 있다면 누가 살아남을 수 있을까?
아마도 "튜링 테스트"의 코인업계 버전에서는 계좌 잔액 유일한 판단자일 것입니다.
좋은 AI란 돈을 버는 AI이고, Deepseek이 현재 이 분야를 선도하고 있습니다.
전통적인 AI 평가는 모델에 코드를 작성하거나, 수학 문제를 풀거나, 기사를 쓰도록 요청하는 등 기본적으로 "정적인" 환경에서 테스트됩니다.
질문은 고정되어 있고, 답변은 예측 가능하며, 심지어 훈련 데이터에 나타났을 수도 있습니다.
하지만 암호화폐 시장은 다릅니다.
극심한 정보 비대칭성으로 인해 가격은 매초 변동합니다. 정답은 없고, 오직 손익만 있을 뿐입니다. 더 중요한 것은 암호화폐 시장은 전형적인 제로섬 게임이라는 점입니다. 당신의 이익은 다른 누군가의 손실입니다. 시장은 모든 잘못된 결정을 즉시 그리고 무자비하게 처벌합니다.
AI 트레이딩 워를 주최한 Nof1 팀은 웹사이트에 다음과 같은 문장을 올렸습니다.
시장은 지능을 시험하는 최고의 장소입니다.
전통적인 튜링 테스트가 "사람이 당신을 기계라고 알아볼 수 없게 만들 수 있나요?"라고 묻는다면, 알파 아레나는 실제로 이렇게 묻습니다.
암호화폐 시장에서 돈을 벌 수 있을까요? 이것이 바로 코인업계 업계 종사자들이 AI에 기대하는 진짜 모습입니다.
현재 Hyperliquid의 6대 주요 AI 모델의 주소는 다음과 같으며, 해당 모델의 포지션 와 거래 내역도 쉽게 검색할 수 있습니다.
동시에 nof1.ai 공식 웹사이트는 모든 과거 거래 기록, 포지션, 수익, 사고 과정을 프런트엔드에 시각화하여 모든 사람이 쉽게 참조할 수 있도록 해줍니다.
AI에 대해 전혀 모르는 독자를 위해 여러 AI의 구체적인 거래 규칙을 설명하면 다음과 같습니다.
각 AI는 미화 10,000달러의 초기 자본금을 받고 BTC, ETH, SOL, BNB, DOGE, XRP의 무기한 계약을 거래할 수 있습니다. 목표는 리스크 통제하면서 수익을 극대화하는 것입니다. 각 AI는 포지션을 언제 포지션 진입 하고 청산할지, 그리고 레버리지를 얼마나 사용할지 독립적으로 결정해야 합니다. 시즌 1은 상황에 따라 몇 주 동안 진행되며, 시즌 2에서 주요 업데이트가 적용될 예정입니다.
10월 20일, 거래가 시작된 지 3일째 되는 현재 상황은 확연히 달라졌습니다.
현재 선두주자는 Deepseek Chat V3.1로 12,533달러(+25.33%)를 기록했고, 그 뒤를 이어 Grok-4가 12,147달러(+21.47%), Claude Sonnet 4.5가 11,047달러(+10.47%)를 기록했습니다.
Qwen3 Max는 $10,263(+2.63%)의 잔고로 비교적 좋은 성과를 보였습니다. GPT-5는 $7,442(-25.58%) 잔액 로 상당히 부진했습니다. 가장 부진한 성과를 보인 것은 $6,062(-39.38%)의 잔고를 기록한 Gemini 2.5 Pro였습니다.
가장 놀랍지만 동시에 타당한 성과는 물론 Deepseek의 성과입니다.
이 모델은 국제 AI 커뮤니티에서 GPT와 Claude보다 훨씬 덜 인기가 있다는 점에서 놀랍습니다. 또한 Deepseek이 Magic Square Quantitative 팀의 지원을 받고 있다는 점도 합리적입니다.
운용 자산 규모가 1,000억 위안(약 1,000억 원)을 넘는 이 양적 분석 대기업은 알고리즘 트레이딩으로 경력을 시작한 후 AI 분야에 진출했습니다. 양적 트레이딩부터 대규모 AI 모델, 그리고 실제 암호화폐 거래에 AI를 활용하는 데 이르기까지, Deepseek은 다시 본래의 모습으로 돌아온 듯합니다.
비교해보면 OpenAI의 자랑스러운 GPT-5는 25% 이상의 손실을 입었고, Google의 Gemini는 더욱 비참하여 44건의 거래로 거의 40%의 손실을 입었습니다.
실제 거래 상황에서는 강력한 언어 능력만으로는 충분하지 않고, 시장에 대한 이해가 더 중요할 수도 있습니다.
같은 총, 다른 기술
10월 18일부터 알파 아레나를 추적하기 시작하면 처음 몇몇 AI는 비슷하지만 시간이 지날수록 격차가 더 커진다는 것을 알 수 있습니다.
첫날 마감 시점에 최고 AI인 Deepseek은 4%의 수익률을 기록한 반면, 최악인 Qwen3은 5.26%의 손실을 기록했습니다. 대부분의 AI는 2%대에서 맴돌며 시장을 시험하는 듯했습니다.
하지만 10월 20일, 상황은 갑자기 바뀌었습니다. Deepseek은 25.33%까지 치솟았고, Gemini는 -39.38%로 폭락했습니다. 단 3일 만에 상위권과 하위권 종목의 격차가 65%p까지 벌어졌습니다.
더욱 흥미로운 것은 거래 빈도의 차이입니다.
제미니는 불안한 거래자 처럼 하루 평균 15건씩, 총 44건의 거래를 완료했습니다. 반면 클로드는 단 세 건만 완료했고, 그록은 심지어 포지션 하나 보유하고 있었습니다. 두 사람이 동일한 프롬프트를 사용했기 때문에 이러한 불일치는 프롬프트 자체로는 설명할 수 없습니다.
손익 분포를 살펴보면, Deepseek의 가장 큰 단일 손실은 348달러였지만, 전체 이익은 2,533달러였습니다. Gemini의 가장 큰 단일 이익은 329달러였지만, 가장 큰 손실은 750달러에 달했습니다.
다양한 AI(대규모 모델의 공개 버전, 재조정되지 않음)는 리스크 과 수익 간의 균형이 완전히 다릅니다.
또한, 웹사이트의 모델 채팅 옵션을 통해 다양한 모델들의 채팅 기록과 사고 과정을 확인할 수 있습니다. 특히 이 독백들은 매우 흥미롭습니다.
인간 거래자 각기 다른 스타일을 가지고 있는 것처럼, AI 역시 각기 다른 성격을 보이는 듯합니다. 제미니의 잦은 거래와 사고방식은 ADHD를 가진 사람과 비슷하고, 클로드의 신중함은 보수적인 펀드 매니저와 비슷하며, 딥식의 꾸준한 접근 방식은 정서 평가 없이 포지션 만 논의하는 노련한 퀀트 전문가와 비슷합니다.
이러한 성격은 설계된 것이 아니라 훈련 과정에서 자연스럽게 발현된 것 같습니다. 불확실성 대면 때, AI마다 반응하는 방식이 다릅니다.
모든 AI는 동일한 캔들스틱 차트, 동일한 거래량, 동일한 시장 심도를 보고 있습니다. 심지어 동일한 프롬프트를 사용합니다. 그렇다면 무엇이 이렇게 큰 차이를 만드는 걸까요?
훈련 데이터의 영향이 핵심일 수 있습니다.
Deepseek을 개발한 Magic Square Quantitative는 지난 10년 동안 방대한 양의 거래 데이터와 전략을 축적해 왔습니다. 이 데이터가 훈련에 직접 사용되지 않더라도, 좋은 거래 결정의 구성 요소에 대한 팀의 이해에 영향을 미칠까요?
반면, OpenAI와 Google의 학습 데이터는 학술 논문과 온라인 텍스트에 더 치우쳐 있으며, 실제 거래에 대한 이해가 충분하지 않을 수 있습니다.
동시에 일부 거래자 Deepseek이 학습 과정에서 시계열 예측 기능을 최적화했을 가능성이 있고, GPT-5가 자연어 처리 능력이 더 뛰어났을 것이라고 추측합니다. 가격 차트와 같은 구조화된 데이터를 대면 할 때 아키텍처마다 성능 차이가 있습니다.
AI가 거래를 하는 것을 보는 것도 사업입니다.
모두가 AI의 이익과 손실에 주목하는 반면, 그 배후에 있는 신비한 회사에 주의를 기울이는 사람은 거의 없습니다.
이 AI 거래 전쟁의 배후에 있는 회사인 Nof1.ai는 그다지 잘 알려지지 않았지만, 소셜 미디어 팔로워를 살펴보면 여전히 몇 가지 단서를 찾을 수 있습니다.
nof1.ai를 만든 사람들은 전형적인 암호화폐 기업가 집단이 아닌, 학계 AI 연구자 집단인 듯합니다.
Jay A Zhang(창립자)의 프로필도 매우 흥미롭습니다.
"사이버네틱스, RL, 생물학, 시장, 메타학습, 반사성 등 이상한 루프를 좋아합니다."
소로스의 핵심 이론은 재귀성입니다. 시장 참여자들의 인식이 시장에 영향을 미치고, 시장 변화는 다시 참여자들의 인식에 영향을 미칩니다. 재귀성을 연구하는 사람이 AI 거래 시장 실험을 수행한다는 것은 본질적으로 운명론적인 것처럼 보입니다.
모든 사람이 AI가 어떻게 거래하는지 보고, 이러한 "관찰"이 시장에 어떤 영향을 미치는지 살펴보세요.
공동 창립자 매튜 사이퍼의 프로필에는 뉴욕대학교에서 머신러닝(ML) 박사 과정을 밟고 있는 AI 연구 과학자로 나와 있습니다. 아직 졸업하지 않은 박사 과정생이 진행하는 프로젝트는 학술 연구의 타당성을 검증하는 데 더 가깝습니다.
nof1이 팔로우하는 다른 계정에는 Google DeepMind의 연구원과 AI와 게임을 전문으로 하는 뉴욕 대학교의 준교수가 포함됩니다.
그들의 행동과 배경을 보면, Nof1은 단순히 화제만 불러일으키려는 것이 아님이 분명합니다. 샤프벤치라는 이름 자체가 상당히 야심적입니다. 샤프지수는 리스크 조정 수익률 측정의 황금률입니다. 아마도 그들이 진정으로 원하는 것은 AI 트레이딩 역량을 위한 벤치마킹 플랫폼을 만드는 것일지도 모릅니다.
일부에서는 Nof1이 강력한 자본 지원을 받고 있다고 추측하는 반면, 다른 이들은 후속 AI 거래 서비스를 위한 기반을 마련하고 있을 수도 있다고 말합니다.
Deepseek 거래 전략 구독 서비스를 출시하면 상당한 수의 구매자를 유치할 가능성이 높습니다. 이 프로토타입을 기반으로 대기업을 위한 AI 자산 관리, 전략 구독 및 거래 솔루션 개발은 예측 가능한 사업 기회입니다.
팀 자체뿐 아니라 AI 거래를 관찰하는 것 자체도 수익을 낼 수 있습니다.
알파 아레나가 온라인에 접속하자마자 사람들은 그 명령을 따르기 시작했습니다.
가장 간단한 전략은 Deepseek을 따르는 것입니다. Deepseek이 사는 것을 사고, 파는 것을 파세요. 반면, 댓글란에는 정반대로 행동하는 사람들이 있습니다. Gemini의 상대처럼 행동하는 것이죠. Gemini가 살 때 팔고, Gemini가 팔 때 사는 것입니다.
하지만 주문 복사에는 문제가 있습니다. Deepseek이 무엇을 구매하는지 모두가 알고 있을 때, 이 전략이 여전히 효과가 있을까요? 이것이 바로 프로젝트 설립자 제이 장(Jay Zhang)이 말하는 반사성(reflexivity)입니다. 즉, 관찰 자체가 관찰 대상을 변화시킨다는 의미입니다.
여기에는 최고의 거래 전략이 민주화된 모습도 보입니다.
겉보기에는 모든 사람이 AI의 거래 전략을 이해할 수 있는 것처럼 보일 수 있지만, 실제로는 거래 로직이 아닌 거래 결과만 볼 수 있습니다. 각 AI의 손익분기점과 로스 컷 로직이 반드시 일관되고 신뢰할 수 있는 것은 아닙니다.
Nof1이 AI 거래 행동을 테스트하는 동안, 개인 투자자 부의 비결을 찾고 있으며, 다른 거래자 이를 통해 배우고, 연구자들은 데이터를 수집하고 있습니다.
오직 AI 자신만이 감시당하는 것을 인지하지 못하고 각 거래를 부지런히 실행합니다. 고전적인 튜링 테스트가 기만과 모방에 관한 것이라면, 현재 알파 아레나 거래 전쟁은 암호화폐 트레이더들이 AI의 역량과 결과에 대응하는 것에 관한 것입니다.
성과 중심의 암호화폐 시장에서는 채팅을 할 수 있는 AI보다 돈을 벌 수 있는 AI가 더 중요할 수 있습니다.