체인피드 요약:
AI 트레이딩의 병목 현상은 모델 자체가 아니라 엔지니어링에 있습니다.
기사 출처:
https://x.com/Web3Tinkle/status/2007960269235126350
기사 작성자:
전화
관점:
팅클: 대규모 모델의 계산 과정을 이해하고 나면 핵심적인 질문이 떠오릅니다. 대규모 모델은 정확히 무엇을 하는 걸까요? 표면적으로는 다음에 나올 단어를 예측하는 것처럼 보입니다. 예를 들어, 오늘의 날씨가 주어지면 모델은 "좋음"일 확률이 가장 높다고 출력하며, 마치 미래를 예측하는 것처럼 보입니다. 하지만 내부 메커니즘을 분석해 보면 실제로는 세 단계를 거칩니다. 첫째, 현재 맥락을 고차원 벡터로 인코딩합니다. 둘째, 이 벡터와 가장 잘 일치하는 패턴을 매개변수 공간에서 탐색합니다. 마지막으로, 이 패턴에 해당하는 확률 분포를 출력합니다. 따라서 대규모 모델은 알려지지 않은 사건을 추론하는 것이 아니라, 훈련 데이터에서 현재 입력과 가장 유사한 알려진 패턴을 식별하는 것입니다. 예측은 미래의 불확실성을 추론하는 것이고, 인식은 과거의 패턴을 매칭하는 것입니다. 대규모 모델이 언어 영역에서 뛰어난 성능을 보이는 이유는 자연어 자체가 매우 강력하고 안정적인 통계적 규칙성을 가지고 있기 때문입니다. 특정 단어 시퀀스 이후에는 후속 콘텐츠의 분포가 매우 집중됩니다. ChatGPT에 질문을 하면, ChatGPT는 "답변을 생각하는" 것이 아니라, 사용자의 입력과 가장 유사한 언어 패턴을 찾아 그 패턴에 따른 가장 일반적인 응답 형태를 출력합니다. 표면적으로는 예측처럼 보이지만, 본질적으로는 대규모 패턴 인식입니다. 이러한 패턴 인식 논리를 금융 시장에 적용하는 것은 직관적으로 보입니다. 시장 데이터를 벡터로 인코딩하고, 과거 가장 유사한 상태를 검색하여 미래 추세의 확률 분포를 출력하는 것입니다. 그러나 근본적인 차이점이 존재합니다. 금융 시장의 통계적 규칙성은 자연어의 규칙성보다 훨씬 약합니다. 언어에서는 다음 단어의 불확실성이 매우 낮은 경우가 많지만, 시장에서는 다음 캔들스틱의 상승과 하락이 무작위성에 매우 가깝습니다. 대량 연구에서 금융 시계열 모델은 평균 회귀와 같은 약한 패턴만 학습하고, 진정으로 중요한 극단적인 변동에는 거의 무력하다는 것을 보여주었습니다. 더욱 중요한 것은 시장이 매우 비정상적이고 적대적이라는 점입니다. 참여자 구조, 규제 환경, 자본 행태가 변화함에 따라 효과적인 패턴은 빠르게 무효화되고, 체계적으로 활용될 수 있는 패턴은 차익거래의 힘에 의해 사라질 수 있습니다. 따라서 대규모 모델을 사용하여 가격의 상승과 하락을 직접 예측하는 것은 실패할 수밖에 없습니다. 하지만 그렇다고 해서 금융에서 패턴 인식이 가치가 없다는 의미는 아닙니다. 핵심은 가격이 어디로 갈 것인지 묻는 것이 아니라 시장이 현재 어떤 상태에 있는지 묻는 것입니다. 단일 시점의 상승과 하락을 예측하는 것보다 시장의 현재 상태를 파악하는 것이 신호 대 잡음비가 더 높습니다. 시장은 저변동성 변동, 고변동성 변동, 상승 추세, 하락 추세, 유동성 위기 등 다양한 상태 사이를 진동합니다. 이러한 상태는 종종 지속적이고 식별 가능한 구조적 특징을 나타냅니다. 이러한 아이디어를 바탕으로 시장 상태 임베딩을 구축할 수 있습니다. 즉, 고차원의 이질적인 시장 데이터를 저차원 벡터로 압축하여 벡터 공간에서 유사한 기간들을 서로 가깝게 배치하는 것입니다. 비교 학습, 클러스터링 또는 유사성 검색을 통해 현재 시장이 과거의 어떤 상태에 더 가까운지 판단하고, 그에 따라 전략을 선택하고 리스크 관리할 수 있습니다. 그 가치는 모든 시장 움직임을 포착하는 데 있는 것이 아니라, 리스크 가 높은 시기에 선제적으로 포지션을 줄이거나 청산하여 시스템적 손실을 방지하는 데 있습니다. NoFx는 이러한 개념을 중심으로 AI 트레이딩을 위한 인프라를 구축합니다. AI의 모호한 시장 예측에 의존하는 대신, 투명하고 해석 가능한 기간 식별 및 구조화된 의사 결정을 통해 복잡하고 변동성이 큰 시장에서 거래자 더욱 견고한 선택을 할 수 있도록 지원합니다.
콘텐츠 출처





