디지털 자산 시장을 위한 체계적인 기능 발견

이 기사는 기계로 번역되었습니다
원문 표시
디지털 자산 시장을 위한 체계적인 기능 발견

글래스노드(Glassnode) 에서는 수백 개의 온체인 지표를 통해 블록체인 활동을 모니터링하며, 이 중 다수는 트레이딩 머신러닝 모델의 피처로 활용됩니다. 핵심 과제는 방대한 피처 공간에서 발생합니다. 각 지표는 수많은 지표를 통해 변형되고 사실상 무한한 방식으로 결합될 수 있습니다. 본 사례 연구에서는 이러한 복잡성을 체계적으로 탐색하고 잠재적으로 중요하면서도 가치가 높은 지표 조합을 식별하도록 설계된 상향식 피처 발견 프레임워크를 소개합니다.

요약

  • 우리는 온체인 거래 지표의 조합 공간을 탐색하기 위한 체계적인 하향식 방법론을 제시하고, 수동 상향식 기능 엔지니어링에 대한 대안을 보여줍니다.
  • 2가지 특징 모델만을 사용하여 비트코인 ​​상승 추세를 감지하는 특정 사례 연구에 적용한 결과, 예상치 못한 패턴이 드러났습니다. 기존의 짧은 기간이 아닌 800~1,200일의 최적 컨텍스트 창이 나타났습니다.
  • 가장 높은 성과를 보인 지표 조합에는 실현 시가총액사용자 유지율 지표가 포함되었으나, 이는 잠재적 지표의 표면일 뿐입니다.
  • 이 분석은 실무자들이 구조화된 탐색이 어떻게 전통적인 접근 방식을 보완할 수 있는지 보여주는 시작점이 됩니다.

조합적 도전

구조화된 탐색이 중요한 이유를 이해하려면 오늘날 분석가들이 직면한 과제의 규모를 생각해 보십시오. 현대 금융 시장은 엄청난 규모의 데이터를 생성합니다. 암호화폐 생태계는 특히 풍부한 사례를 보여줍니다. 블록체인은 매일 수십억 건의 거래를 전례 없는 투명성으로 처리합니다. 글래스노드(Glassnode) 다양한 자산, 시간대, 네트워크 세그먼트에 걸쳐 수백 개의 기본 지표를 추적합니다. 각 지표는 고유한 매개변수 범위를 가진 수십 개의 기술 지표를 사용하여 변환할 수 있습니다. 다중 기능 모델로 결합되면 가능한 구성의 수가 급격히 증가하여 "차원의 저주"라고 알려진 난해한 탐색 공간으로 변합니다. 이로 인해 철저한 탐색이 불가능해집니다.

상향식 vs. 하향식 기능 엔지니어링

기존의 하향식 피처 엔지니어링은 경제 이론, 시장 이해도, 그리고 과거 사례를 바탕으로 지표를 선택하는 도메인 전문가에 의존합니다. 피처는 해석 가능성과 이론적 타당성을 고려하여 선택되며, 전문성을 효율적으로 활용하면서도 자연스럽게 이론적 근거를 바탕으로 한 조합에 집중합니다.

이와 대조적으로, 상향식 탐색은 미리 정해진 선호도 없이 피처 공간을 샘플링하여 직관으로는 놓칠 수 있는 패턴을 잠재적으로 발견합니다. 어떤 지표가 효과적일지에 대한 가설을 세우는 대신, 이 접근 방식은 데이터를 통해 예상치 못한 조합을 발견할 수 있도록 합니다.

체계적인 발견 방법론

이러한 계산적 불가능성을 고려할 때, 통계적 엄밀성을 유지하면서 특징 공간의 대표적인 부분집합을 샘플링할 수 있는 구조화된 접근법이 필요합니다. 우리의 접근법은 엄격한 탐색과 평가를 통해 이 우주를 탐구합니다.

사용 가능한 메트릭, 변환 및 매개변수 범위의 전체 공간에서 샘플링하여 특징 조합을 생성함으로써 광범위한 커버리지를 보장하고 편향으로 인해 익숙한 패턴으로 검색이 제한되는 것을 방지합니다. 각 조합은 간단하고 복잡도가 낮은 머신러닝 모델(심도가 제한된 의사결정 트리)을 사용하여 평가하여 과적합된 노이즈가 아닌 실제 패턴을 식별하고, 훈련 데이터 너머로 일반화될 가능성이 더 높은 강력한 지표를 발견하는 데 중점을 둡니다.

모든 기능 조합은 여러 시간 기반 폴드에 걸쳐 테스트를 거치며, 폴드별 성능 일관성은 전체 성능만큼 중요하며, 다양한 시장 상황에서 안정적으로 작동하는 기능을 파악하는 데 도움이 됩니다. 생성된 기능 데이터 세트와 각 기능의 성능은 사후 분석을 통해 어떤 조합이 좋은 성과를 낼 뿐만 아니라 어떤 상황에서 좋은 성과를 낼 수 있는지 파악할 수 있도록 합니다.

사례 연구 설정: 비트코인 ​​추세 감지

이 방법론을 실제로 시연하기 위해, 비트코인 ​​상승 추세 감지라는 특정 시장 관련 목표에 적용합니다. 본 구현에서는 3단계 샘플링 전략을 사용하여 상승 추세 식별을 위한 특징 공간을 체계적으로 탐색합니다. 이를 통해 계산적 타당성과 잠재적 지표 조합에 대한 포괄적인 적용 범위 간의 균형을 맞춥니다.

투자 목표 및 라벨

상승장 국면에서 비트코인 ​​장기 투자에 최적의 기간을 파악하는 데 중점을 두고 있습니다. 본 분석은 계층적 추세 세분화를 통해 국지적 고점과 이전 저점을 감지하여 추세 사이클을 재귀적으로 식별합니다. 이를 통해 투자자들이 "미니 불런(mini 불 run)"이라고 부르는, 더 큰 시장 사이클 내에서 지속적인 상승 모멘텀이 나타나는 기간을 포착합니다.

이 알고리즘은 최소 기간 임계값을 적용하여 노이즈를 필터링하여 레이블 1이 상승 추세 기간을 나타내고 레이블 0이 하락 추세 또는 횡보 시장을 나타내는 이진 분류를 도출합니다. 즉, "레이블 1" 기간에는 시장 참여를 원하지만, "레이블 0" 기간에는 모델이 "시장 이탈"을 예측해야 합니다. 이러한 특정 레이블 선택은 모든 후속 결과에 근본적으로 영향을 미치며, 목표에 따라 결과가 달라집니다.

디지털 자산 시장을 위한 체계적인 기능 발견

그림 1: 비트코인에 적용된 계층적 추세 세분화. 녹색은 상승 추세 기간(라벨 1), 회색은 하락/횡보 시장(라벨 0)을 나타냅니다.

평가 프레임워크

트렌드 정의 프레임워크를 구축했으므로, 일반화 가능한 결과의 가능성을 높이는 평가 방식이 필요합니다. 시간 기반 교차 검증을 사용하여 각 테스트 연도까지의 모든 데이터를 학습하고, 개별 연도(2017-2025)를 테스트 폴드로 사용하여 다양한 시장 구조를 시뮬레이션합니다. 특징 선택은 2017-2023년 기간을 기반으로 하며, 2024-2025년 기간은 표본 외 검증을 위해 남겨둡니다.

성과는 거래 비용 차감 후 순수익을 매수 후 보유 전략 대비로 측정합니다. 이 지표는 예시 목적으로 선택되었으며, 알고리즘적 접근 방식은 샤프 비율이나 소르티노 비율과 같은 위험 조정 지표, 정확도나 F-베타 점수와 같은 기존 ML 지표, 또는 신호 빈도나 하락률과 같은 구현 중심 기준에 대해서도 동일하게 최적화할 수 있습니다. 대안적인 최적화 목표는 다양한 최적 특성 조합을 도출하며, 성과 지표의 선택은 탐색을 통해 발견되는 관계를 근본적으로 형성합니다.

기능 공간 구성

평가 프레임워크가 정의됨에 따라, 방대한 검색 공간을 계산적으로 처리 가능하게 만드는 실질적인 과제에 직면하게 되었습니다. 해석 가능성을 위해 1,600개의 비트코인 ​​지표(하위 추적 포함)를 사용하여 제한된 검색 공간을 구성하고, 변환을 Z-점수와 RSI로만 제한하며, 컨텍스트 윈도우를 최대 1,536일까지 허용하고, 모델을 정확히 2개의 피처로 제한했습니다. 이러한 제약 조건에도 불구하고 이론적인 검색 공간은 다음과 같습니다.

(1,600 metrics × 2 transformations × 1,536 context windows)² = 24 trillion combinations

이러한 계산 과제는 체계적인 차원 축소를 필요로 합니다. 본 연구에서는 아래에 설명된 바와 같이 3단계 접근법을 사용하여 이를 달성합니다.

3단계 탐사 프로세스

1단계: 단일 기능 스크리닝

153,600개의 단일 특성 조합을 평가하고, 지표, 변환 및 컨텍스트 윈도우 전반에 걸쳐 샘플링합니다. 최종 승자를 찾는 대신, 잠재력을 보여주는 지표를 찾습니다.

상위 10개 개인 지표 :

  1. 연령별 MVRV : 1개월 ~ 3개월
  2. MoM 활동 유지 공급 : 이탈 공급
  3. 손익 기준 시가총액 : -10% ~ 0%
  4. 손익에 따른 실현 자본금 : -10% ~ 0%
  5. 연령별 SOPR : 1개월~3개월
  6. 지갑 크기에 따른 실현 한도 : 10만 이상
  7. 연령별 손실량 거래량 : 1개월~3개월
  8. 비용 기준 분포 분위수 : 91%
  9. 잔액이 100k 이상인 기관이 보유한 공급량
  10. 숏 홀더 NUPL : 155일 미만

이러한 지표는 평가 비율, 홀더 행동, 이익/손실 분배를 포괄하며, 사전 선택 없이 평가에서 식별된 다양하고 합리적인 집합입니다.

디지털 자산 시장을 위한 체계적인 기능 발견

그림 2: 상위 50개 단일 기능의 성능 히트맵. 행은 지표를, 열은 컨텍스트 윈도우 버킷(0~1,535일)을 나타냅니다. 색상 강도는 2017년부터 2023년까지의 연간 평균 성능을 나타냅니다.

이 첫 번째 단계의 결과는 그림 2에 나와 있습니다. 예를 들어, " 연령별 MVRV: 1개월~3개월 " 지표와 64~95일의 컨텍스트 윈도우를 함께 적용했을 때, 단순 매수 후 보유 전략 대비 평균 수익률 1.152를 기록했습니다. 하지만 이러한 결과는 본 연구의 첫 단계일 뿐이며, 그 자체로는 강력한 거래 신호와 관련이 없을 가능성이 높습니다.

2단계: 메트릭 쌍 발견

이 분석을 확장하여 1단계의 상위 50개 지표를 사용하여 약 2,300만 가지의 가능한 조합에서 10만 건의 평가를 샘플링합니다. 최종 최적화가 아닌, 잠재적으로 시너지 효과가 있는 조합을 파악하는 것이 목표입니다.

디지털 자산 시장을 위한 체계적인 기능 발견

그림 3: 상위 50개 지표에 대한 쌍별 성과 행렬. 셀 색상은 조합 성과를 나타냅니다.

초기 조사 결과에 따르면 특정 조합은 심층적인 조사가 필요한 것으로 나타났습니다.

  • 실현된 Cap 지표는 일관된 효과를 보여줍니다.
  • 활동 유지 지표는 평가 지표를 보완하는 것으로 보입니다.
  • 일부 쌍은 개별 구성 요소보다 더 강력한 결합 결과를 보여줍니다.

3단계: 매개변수 최적화

2단계에서는 매력적인 지표 조합이 드러나지만, 아직 과거 맥락 창을 최적화하지 못했습니다. 쌍별 분석에서 확인된 가장 주목할 만한 지표 쌍인 실현 시가총액(Realized Cap)과 활동 유지율(Activity Retention)에 대해 맥락 창을 중심으로 집중적인 매개변수 검색을 수행합니다. 비트코인 ​​추세 감지에 가장 적합한 기간은 며칠, 몇 주, 몇 달 중 어느 기간일까요?

시뮬레이션 결과는 그림 5에 요약되어 있습니다. 흥미롭게도 예상치 못한 관계가 나타났습니다. 최적의 기간은 800~1,200일로, 기존 기술 분석 기간보다 상당히 길었습니다.

디지털 자산 시장을 위한 체계적인 기능 발견

그림 5: 선택된 메트릭 쌍에 대한 다양한 윈도우 조합에 따른 성능을 보여주는 컨텍스트 윈도우 최적화.

저희의 연구 결과는 기술적 분석의 통념과 상충되므로 설명이 필요합니다. 비트코인의 심장 박동이 방향을 제시하는 경우가 많지만, 3년 이상 비트코인의 느린 호흡 패턴이 이 목표의 실제 방향을 보여주는 것으로 보입니다. 핵심 요소 중 하나는 레이블 구성입니다. 계층적 추세 세분화는 일반적으로 수주 또는 수개월에 걸쳐 나타나는 상승 추세 구간을 식별합니다. 더 긴 맥락적 기간은 이러한 장기 추세 기간의 점진적인 형성과 확립을 더 잘 포착할 수 있는 반면, 더 짧은 기간은 더 넓은 추세 구조 내의 노이즈에 반응할 수 있습니다. 800일에서 1,200일 사이의 기간은 광범위한 상승 추세 단계에 선행하고 이를 유지하는 더 느리게 움직이는 기저 조건을 감지하는 데 도움이 될 수 있습니다.

그러나 이는 우리의 라벨링 방법론에 특화된 제한된 사례 연구에서 얻은 관찰 결과임을 강조합니다. 단기적인 움직임을 목표로 수정된 라벨 정의는 다른 맥락적 기간을 선호할 것입니다.

시간적 성능 분석

우리의 탐구는 매력적인 조합을 발견했지만, 중요한 의문이 남습니다. 이러한 관계는 시간이 지남에 따라 얼마나 안정적일까요? 이 문제를 해결하기 위해 다양한 피처 아키텍처가 기간에 따라 어떻게 동작하는지 살펴보았습니다. 조합을 지표 유형별로 분류했습니다.

  • 실현된 캡 × 실현된 캡 : 두 가지 지표 모두 체인상 비용 기준
  • 활동 × 실현 상한선 : 혼합된 행동 지표 및 평가 지표
  • 활동 × 활동 : 두 가지 지표 모두 사용자 행동 패턴을 기반으로 함
디지털 자산 시장을 위한 체계적인 기능 발견

그림 10: 테스트 연도(2018-2023)별 아키텍처 성능 궤적. x축의 각 클러스터는 메트릭 쌍과 컨텍스트 윈도우 버킷의 고유한 조합을 나타내며, 막대는 연간 성능을 나타냅니다.

샘플 기간 동안의 주요 관찰 사항:

  • 실현된 캡 조합은 분산은 낮지만 수익률은 적당합니다.
  • 혼합 아키텍처는 일관성과 효율성을 균형 있게 유지합니다.
  • 활동 전용 쌍은 기간별 결과에 따라 높은 분산을 보입니다.

중요한 점은 모든 아키텍처가 2017~2023년 동안 시간이 지남에 따라 감소하는 결과를 보인다는 점인데, 이는 시장 효율성이 증가하거나 시장 역학이 변화하고 있음을 시사합니다.

샘플 밖 결과: 현실 확인

라이브 트레이딩이 여전히 궁극적인 시험이기는 하지만, 이전에 제외된 데이터에 대한 알고리즘 발견을 평가하면 잠재적인 실제 효과에 대한 통찰력을 얻을 수 있습니다. 2024-2025년 검증 기간은 우리의 연구 결과에 대한 다음과 같은 중요한 관점을 제공합니다.

디지털 자산 시장을 위한 체계적인 기능 발견

그림 7: 샘플 외 성능(2024-2025). 학습 기간과 동일한 아키텍처 범주를 사용함.

표본 외 기간은 몇 가지 현상을 보여줍니다. 순수 활동 유지 혼합형과 같이 이전에 강세를 보였던 일부 종목은 효과가 감소하는 반면, 특정 실현 시가총액 조합은 일관된 결과를 유지합니다. 이러한 결과의 변화는 시장 진화에 대한 근본적인 의문을 제기합니다. 효과 특성은 왜 변할까요? 생태계 구조나 참여자 행동의 실질적인 변화, ETF와 같은 새로운 시장 인프라의 영향, 기관 투자 증가, 또는 완전히 다른 이유 등 여러 가지 설명이 가능합니다.

이러한 결과는 구조화된 탐색이 거래 시스템 개발의 종착점이 아니라 조사의 시작점이라는 점을 강조합니다.

실제적 의미와 한계

이 분석이 보여주는 것

구조화된 탐색을 통해 기존 분석에서는 발견하기 어려웠던 명확하지 않은 관계, 특히 800일에서 1,200일의 장기 컨텍스트 윈도우 선호도를 확인할 수 있었습니다. 제한된 지표 집합에서 단 두 개의 특징만 사용하는 제약된 탐색에도 불구하고, 추가 조사가 필요한 행동들을 발견하여 엄격한 제한 조건 하에서도 구조화된 샘플링을 통해 가치 있는 인사이트를 도출할 수 있음을 보여주었습니다. 이 접근 방식은 상향식 탐색과 하향식 특징 엔지니어링이 어떻게 상호 보완적인지 보여주며, 계산적 발견을 통해 도메인 전문 지식을 어디에 집중해야 할지 알려줍니다. 무엇보다도, 이 프레임워크는 다양한 투자 목표, 다양한 자산, 그리고 대체 제약 조건에 적용할 수 있는 확장 가능한 방법론을 제공하여 실무자들에게 특정 사용 사례를 탐색할 수 있는 도구를 제공한다는 점이 중요합니다.

이 분석이 보여주지 않는 것

그러나 이러한 역량을 인정하려면 제약 조건에도 동일한 주의를 기울여야 합니다. 이 분석은 완전한 거래 전략을 제시하지 않습니다. 단순한 의사결정 트리를 사용하는 두 가지 피처만으로는 암호화폐 시장의 복잡성을 완전히 파악할 수 없습니다. 결과는 저희가 선택한 레이블, 지표, 기간에 따라 달라지며, 시장 행동에 대한 보편적인 진실로 해석해서는 안 됩니다. 제한된 피처 공간의 극히 일부만을 샘플링했기 때문에 최적의 솔루션이나 가능한 가장 좋은 피처를 찾기는 어렵습니다. 더욱이, 이는 근본적으로 과거 관계 분석이며, 과거의 관계가 미래의 효과를 보장하지 않으므로 정적인 구현보다는 지속적인 검증의 필요성을 강조합니다.

미래 연구 방향

이러한 제약 조건은 향후 연구를 위한 몇 가지 매력적인 가능성을 제시합니다. 수천 개의 개별 추적과 무한한 변환 가능성을 갖춘 광대한 미개척 구성 공간은 가치 있는 지표를 발견할 수 있는 상당한 잠재력을 보유하고 있습니다. 이 방법론은 변동성 예측, 손실 위험 평가, 정권 변화 감지와 같은 다양한 예측 목표뿐만 아니라 일중, 주간, 월간 분석 기간을 포함한 대체 시간 범위에 맞춰 확장될 수 있습니다. 다양한 암호화폐에 걸친 다중 자산 조합은 보편적인 행동과 자산별 행동을 식별하는 데 도움이 되어 암호화폐 시장 전반에 대한 심층적인 통찰력을 제공합니다. 또한, 단순한 쌍을 넘어 더욱 복잡한 특성 상호작용을 탐구하는 것은 강력한 예측 모델을 구축하는 데 필수적입니다. 더욱 다양한 입력은 향상된 개별 예측 지표를 제공하고 단일 지표로는 파악할 수 없는 특성 간의 상호작용을 포착할 수 있도록 하기 때문입니다.

우리가 개발한 툴을 사용하면 비교적 적은 노력으로 다양한 가설을 탐색할 수 있으며, 이를 통해 특정 목표와 제약에 맞춰 맞춤형 연구를 수행할 수 있는 가능성이 열립니다.

결론

본 연구의 실증적 결과는 본 사례 연구에 국한되었지만, 금융 시장에서의 계산적 발견에 대한 더 광범위한 의문을 제기하고 즉각적인 적용과 향후 연구 방향을 제시합니다. 본 연구는 구조화된 상향식 탐색이 어떻게 기존의 하향식 접근 방식을 보완할 수 있는지, 예를 들어 확장된 맥락 창의 예상치 못한 효과를 보여주는지 보여줍니다. 본 연구는 무한한 조합의 가능성을 보여주는 데 그쳤지만, 실무자들이 각자의 특정 요구에 맞게 적용할 수 있는 방법론을 제시합니다.

표본 외 결과는 암호화폐 시장이 여전히 도전적인 환경이며, 단순한 발견뿐 아니라 지속적인 적응을 요구한다는 점을 다시 한번 일깨워줍니다. 글래스노드(Glassnode) 고객과 알고리즘 트레이더에게 이 프레임워크는 선입견에 얽매이지 않는 방법론 자체를 통해 블록체인 데이터의 복잡성을 헤쳐나가는 데 도움이 되는 출발점을 제공합니다.

암호화폐 시장이 발전함에 따라 분석적 접근 방식도 반드시 필요합니다. 컴퓨팅 탐색은 전문 지식을 대체하는 것이 아니라, 오히려 강화하여 눈에 보이지 않는 관계를 밝혀내는 데 도움을 줍니다.


면책 조항: 본 보고서는 정보 제공 및 교육 목적으로만 제공됩니다. 본 분석은 상당한 제약이 있는 제한적인 사례 연구를 나타내며, 투자 조언이나 확실한 거래 신호로 해석되어서는 안 됩니다. 과거 실적 패턴이 미래의 결과를 보장하는 것은 아닙니다. 투자 결정을 내리기 전에 항상 철저한 실사를 수행하고 여러 요소를 고려하십시오.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트