주요 포인트:
- 미래 데이터 누출(Look-ahead bias) 개념 논의
- 거래 영역에서의 핵심: 과도한 적합(Overfitting)
- 2021년 두 번째 정점: 고정관념에 대한 가장 큰 시험
- 세 가지 지표와 한 가지 모델의 성과 검토
- 더 보수적인 임계값을 어떻게 설정할 수 있을까?
- 2021년 4월로 돌아가서 13년, 17년의 역사적 데이터만 볼 수 있다면, 보수적으로 설정한 임계값이 21년 4월에 트리거될 수 있을까?
- 이러한 방식으로 설정된 임계값이 2021년 두 번째 정점에서 트리거될 수 있을까?
- 2021년 4월을 정점으로 보지 않는다면, 2021년 두 번째 정점에서는 더욱 정점 포착이 불가능할 것이다, 그렇지 않은가?
내가 말하고 싶은 것은:
비트코인(BTC) 역사적 데이터의 표본 수가 너무 적고, 단순히 이전 주기만 고려한다면,실제로 '미래 데이터 누출' 함정에 빠질 가능성이 높다.
2021년 4월(첫 번째 정점)에 있던 사람은 당시의 MVRV 값이 실제로 그 주기의 최고점이라는 것을 알지 못했을 것이다. 왜냐하면 그는 13년, 17년의 데이터만 볼 수 있었기 때문이다;마찬가지로, 2021년 두 번째 정점이 나타났을 때 MVRV 값은 매우 낮은 위치에 있었다.첫 번째 정점에서 빠져나오지 못했다면, 당연히 두 번째 정점의 데이터를 기반으로 정점을 포착할 수 없을 것이고,그렇게 되면 2021년 정점 포착의 최적의 시기를 놓치게 될 것이다.
2. AVIV 지표
AVIV는 수정되고 더 신중하게 고려된 MVRV로 볼 수 있으며, MVRV에 비해 더 명확한 '평균 회귀' 특성을 가지고 있다.
그러나 여전히 '정점(고점) 감소' 현상이 매우 뚜렷하다:
그림에서 표시된 1, 2, 3, 4는 각각 13년, 17년의 정점, 그리고 2021년의 두 번째 정점을 나타낸다.
같은 문제에 대해 독자들의 사고를 위해 위의 텍스트를 그대로 복사했다:
- 더 보수적인 임계값을 어떻게 설정할 수 있을까?
- 2021년 4월로 돌아가서 13년, 17년의 역사적 데이터만 볼 수 있다면, 보수적으로 설정한 임계값이 21년 4월에 트리거될 수 있을까?
- 이러한 방식으로 설정된 임계값이 2021년 두 번째 정점에서 트리거될 수 있을까?
- 2021년 4월을 정점으로 보지 않는다면, 2021년 두 번째 정점에서는 더욱 정점 포착이 불가능할 것이다, 그렇지 않은가?
RUP(Relative Unrealized Profit)
이전에 RUP 온체인 데이터에 대해 자세히 소개한 적이 있으며, 관심 있는 독자들은 다음 두 기사의 내용을 참고할 수 있다:
온체인 데이터 학교(구): 시장 기상도 RUPL(I) - 데이터 소개 & 저점매수 응용
온체인 데이터 학교(십): 시장 기상도 RUPL(II) - 최강 정점 신호 & 역사적 주기 정점 상세 분석
한 독자가 질문한 바 있다: "RUP 배리의 논리는 이해할 수 있지만, RUP가 과거에 도달했던 역사적 최고점도 함께 고려해야 하지 않을까?"
위 그림은 RUP의 역사적 차트로, 그림에서 표시된 1, 2, 3, 4는 각각 13년, 17년의 정점, 그리고 2021년의 두 번째 정점을 나타낸다.
시가총액에 대해 표준화 처리를 했음에도 불구하고,여전히 정점 감소 현상이 존재한다.
다시 한 번 핵심 질문:
- 더 보수적인 임계값을 어떻게 설정할 수 있을까?
- 2021년 4월로 돌아가서 13년, 17년의 역사적 데이터만 볼 수 있다면, 보수적으로 설정한 임계값이 21년 4월에 트리거될 수 있을까?
- 이러한 방식으로 설정된 임계값이 2021년 두 번째 정점에서 트리거될 수 있을까?
- 2021년 4월을 정점으로 보지 않는다면, 2021년 두 번째 정점에서는 더욱 정점 포착이 불가능할 것이다, 그렇지 않은가?
4. 코인타임(Cointime) 가격 편차 모델
코인타임(Cointime) 가격 편차 모델은 내가 개인적으로 설계하여 정점을 관찰하는 모델 중 하나로,자세한 내용은 이전 게시물을 참고할 수 있다(온체인 데이터 학교(칠): ARK가 참여한 연구의 혁신적인 비트코인(BTC) 놀라운 가격 책정 방법론(II) ).
그림에서 표시된 1, 2, 3, 4는 각각 13년, 17년의 정점, 그리고 2021년의 두 번째 정점을 나타낸다.
독자들은 이 그림을 앞의 세 그림과 비교해볼 수 있다:
- 2021년 두 번째 정점의 값은 앞의 세 정점의 값과 차이가 더 작다
- 네 번의 정점 값의 차이가 크지 않다(하지만 여전히 감소 경향이 있다)
- 비트코인(BTC)의 연간 감소하는 변동성을 고려한다
이것이 내가 데이터에 논리를 부여하고 가공하는 것을 더 선호하는 이유이다.오직 이렇게 함으로써 과적합과 미래 데이터 누출 문제를 최대한 피할 수 있다.
결론
본 글은 주로 '과적합'과 '미래 데이터 누출 방지' 이 두 가지 개념에 대해 대중화하고 설명하며, 동시에 2021년의 특수한 상황을 예시로 들어 설명했다.
본문은 전체적으로 심도 있고 내용이 다소 난해할 수 있지만, 독자들에게 도움이 되기를 바란다. 읽어주셔서 감사하다.



