알파 아레나, AI 거래 결함 폭로: 서구 모델, 1주일 만에 자본 80% 손실

이 기사는 기계로 번역되었습니다
원문 표시

비트코인 매거진

알파 아레나, AI 거래 결함 폭로: 서구 모델, 1주일 만에 자본 80% 손실

AI가 암호화폐를 거래할 수 있을까요? 뉴욕 출신의 컴퓨터 엔지니어이자 금융 전문가인 제이 아장( Jay Azhang)은 알파 아레나 (Alpha Arena)를 통해 이 질문을 시험하고 있습니다. 이 프로젝트는 각각 1만 달러 상당의 자본 가진 가장 뛰어난 대규모 언어 모델(LLM)들을 서로 경쟁시켜 어떤 모델이 암호화폐 거래에서 더 많은 수익을 낼 수 있는지를 알아봅니다. 이 모델에는 Grok 4, Claude Sonnet 4.5, 제미니(Gemini) 2.5 pro, ChatGPT 5, Deepseek v3.1, Qwen3 Max가 포함됩니다.

이제 여러분은 "와, 정말 좋은 생각이야!"라고 생각할지도 모릅니다. 그리고 이 글을 쓰는 시점에서 5개의 AI 중 3개가 수중에 있으며, 중국의 오픈소스 모델인 Qwen3와 Deepseek이 선두를 달리고 있다는 사실에 놀라실 겁니다.

Alpha Arena Reveals AI Trading Flaws: Western Models Lose 80% Capital in One Week

그렇습니다. 구글과 OpenAI와 같은 거대 기업이 운영하는 서구 세계에서 가장 강력하고 폐쇄적인 소스의 독점적 인공 지능은 일주일 남짓한 기간 동안 8,000달러가 넘는 손실, 즉 암호화폐 거래 자본 의 80%를 잃었지만, 동양의 오픈 소스 대응 기업은 이익을 냈습니다.

지금까지 가장 성공적인 거래는? Qwen3는 촉촉하게 몸을 가꾸고 제 몫을 다하며 20배의 비트코인 ​​롱 포지션을 취했습니다. Grok 4는 놀랍지 않게도 대부분의 경쟁에서 10배 레버리지로 도지코인(Doge) 롱 포지션으로 유지해 왔습니다. 한때 Deepseek과 함께 차트 정상을 차지했던 그렉은 현재 20% 가까이 하락했습니다. 일론 머스크가 Grok을 개집에서 꺼내기 위해 도지코인(Doge) 밈(meme) 같은 걸 트윗해야 할지도 모릅니다.

Alpha Arena Reveals AI Trading Flaws: Western Models Lose 80% Capital in One Week

한편, 구글의 제미니(Gemini) 거래 가능한 모든 암호화폐 자산에 대해 숏 매도를 유지하며 끊임없이 하락세를 보이고 있습니다. 이러한 입장은 지난 15년간 구글이 취해온 전반적인 암호화폐 정책과 유사합니다.

마지막으로 ChatGibitty가 있습니다. 일주일 연속으로 모든 나쁜 거래를 가능하게 했는데, 정말 놀라운 성과입니다! 특히 Qwen3가 비트코인을 매수하고 낚시를 갔다는 점을 고려하면, 그렇게 나쁜 거래를 하려면 실력이 필요합니다. 이것이 최고의 클로즈드 소스 AI라면, OpenAI는 클로즈드 소스로 유지하고 우리를 보호해야 할지도 모릅니다.

AI의 새로운 벤치마크

농담은 차치하고, 암호화폐 거래 분야에서 AI 모델을 서로 경쟁시키는 아이디어는 매우 심오한 통찰력을 제공합니다. 우선, 암호화폐 거래 관련 지식 테스트의 답은 예측 불가능하기 때문에 AI를 사전 훈련할 수 없으며, 이는 다른 벤치마크에서도 흔히 발생하는 문제입니다. 다시 말해, 많은 AI 모델이 훈련 과정에서 이러한 테스트의 답을 제공받고 있으므로 테스트에서 당연히 좋은 성능을 보입니다. 하지만 일부 연구에 따르면 이러한 테스트 중 일부를 약간만 변경해도 AI 벤치마크 결과가 근본적으로 달라진다는 것이 밝혀졌습니다.

이 논란은 다음과 같은 질문을 던집니다. 지능을 측정하는 궁극적인 기준은 무엇일까요? 아이언맨 열광자이자 Grok 4 개발자인 일론 머스크에 따르면, 미래를 예측하는 것이 지능을 측정하는 궁극적인 기준입니다.

미래를 예측하는 능력은 지능을 측정하는 가장 좋은 방법입니다 . https://t.co/W6WriRGt9N

— 엘론 머스크 (@elonmusk) 2025년 9월 5일

솔직히 말해서, 단기 암호화폐 가격보다 더 불확실한 미래는 없습니다. 아장은 이렇게 말했습니다. "알파 아레나의 목표는 벤치마크를 현실 세계와 더욱 유사하게 만드는 것이며, 시장은 이에 적합합니다. 시장은 역동적이고, 적대적이며, 개방적이고, 끝없이 예측 불가능합니다. 시장은 정적인 벤치마크로는 불가능한 방식으로 AI에 도전합니다. 시장은 지능에 대한 궁극적인 시험대입니다."

시장에 대한 이러한 통찰력은 비트코인이 탄생한 자유주의 원칙에 깊이 뿌리내리고 있습니다. 머레이 로스바드와 밀턴 프리드먼 같은 경제학자들은 100여 년 전, 중앙 계획자들이 시장을 근본적으로 예측할 수 없으며, 실질적인 경제적 결정을 내리고 손실을 감수할 수 있는 개인만이 합리적인 경제 계산을 할 수 있다고 주장했습니다.

다시 말해, 시장은 전 세계의 지적인 사람들의 관점과 결정에 따라 달라지기 때문에 예측하기 가장 어려운 것이며, 따라서 지능을 테스트하는 가장 좋은 방법입니다.

아장(Azhang)은 프로젝트 설명에서 AI가 단순히 이익만을 위해 거래하는 것이 아니라 위험 조정 수익률을 위해 거래하도록 교육받는다고 언급합니다. 이러한 위험 요소는 매우 중요한데, Grok 4 포트폴리오의 몰락에서 볼 수 있듯이 단 한 번의 잘못된 거래로 이전 수익이 모두 사라질 수 있기 때문입니다.

또 다른 의문은 이러한 모델들이 암호화폐 거래 경험을 통해 학습하고 있는지 여부입니다. AI 모델을 사전 훈련하는 데 막대한 비용이 소요된다는 점을 고려하면 기술적으로 쉽지 않은 문제입니다. AI 모델은 자신의 거래 이력이나 다른 사람의 거래 이력을 바탕으로 미세 조정될 수 있으며, 최근 거래 내역을 단기 메모리나 컨텍스트 윈도우에 저장할 수도 있지만, 그 한계가 있습니다. 궁극적으로 적합한 AI 거래 모델은 자신의 경험을 통해 진정으로 학습해야 할 것입니다. 최근 학계에서 이 기술이 발표되었지만, 실제 제품으로 구현되기까지는 아직 갈 길이 멉니다. MIT는 이를 '자가 적응형 AI 모델' 이라고 부릅니다.

그것이 단지 행운이 아니라는 것을 어떻게 알 수 있을까?

이 프로젝트와 지금까지의 결과에 대한 또 다른 분석은 '무작위 진행'과 구분하기 어려울 수 있다는 것입니다. 무작위 진행은 모든 결정에 주사위를 던지는 것과 같습니다. 차트에서는 어떻게 보일까요? 사실, 이 질문에 답할 수 있는 시뮬레이터가 있습니다. 실제로 크게 다르지는 않을 것입니다.

Alpha Arena Reveals AI Trading Flaws: Western Models Lose 80% Capital in One Week

시장에서의 운에 대한 이러한 질문은 나심 탈레브와 같은 지식인들도 그의 저서 『안티프래질』에서 매우 신중하게 다루었습니다. 그는 이 책에서 통계적 관점에서 볼 때, 예를 들어 Qwen3 같은 트레이더가 일주일 내내 운이 좋을 수 있다는 것은 지극히 정상적이며 가능한 일이라고 주장합니다! 이는 마치 우월한 추론처럼 보이게 합니다. 탈레브는 여기서 한 걸음 더 나아가, 월가에는 충분히 많은 트레이더들이 있어서 그중 한 명이 20년 연속으로 운이 좋아서 신과 같은 명성을 얻고 주변 사람들이 그 트레이더를 천재라고 생각할 수도 있다고 주장합니다. 물론 운이 다할 때까지는 말입니다.

따라서 알파 아레나가 가치 있는 데이터를 생성하려면 실제로 오랜 시간 동안 실행해야 하며, 패턴과 결과도 실제 자본 예치(stake) 하여 독립적으로 복제해야 무작위 산책과 다르다는 것을 식별할 수 있습니다.

궁극적으로, DeepSeek처럼 오픈 소스이고 비용 효율적인 모델이 지금까지 폐쇄 소스 모델보다 우수한 성과를 거두는 것을 보는 것은 매우 고무적입니다. Alpha Arena는 지난주 X.com에서 입소문을 타면서 지금까지 큰 즐거움을 선사해 왔습니다. 앞으로 어떻게 될지는 아무도 모릅니다. 개발자가 다섯 명의 챗봇에게 5만 달러를 주고 암호화폐에 투자한 도박이 결국 성공할지 지켜봐야 할 것입니다.

이 게시물은 Alpha Arena가 AI 거래 결함을 공개했습니다. 서양 모델이 1주일 만에 자본 80%를 잃었습니다. 이 게시물Bitcoin Magazine 에 처음 게재되었으며 Juan Galt 가 작성했습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트