Lấy Cấu trúc Đỉnh đôi của Bitcoin năm 2021 làm Ví dụ: “Rò rỉ dữ liệu trong tương lai” là gì

Bài viết này được dịch máy
Xem bản gốc

Điểm chính:

  • Thảo luận về khái niệm "Rò rỉ dữ liệu trong tương lai (Look-ahead bias)"
  • Thảo luận về yếu huyệt trong lĩnh vực giao dịch: Quá khớp (Overfitting)
  • Đỉnh kép năm 2021: Thử thách lớn nhất đối với việc đánh giá máy móc
  • Xem xét thành tích của ba chỉ báo và một mô hình

Rò rỉ dữ liệu trong tương lai (Look-ahead bias)

Hãy tưởng tượng một tình huống:

「Giả sử tôi đã phát triển một chiến lược giao dịch và thực hiện kiểm tra lại một cách nghiêm ngặt trong 50 năm qua, thời gian kiểm tra từ 1975 đến 2024, và đạt được hiệu suất kiểm tra rất tốt. Do đó, tôi quyết định áp dụng chiến lược này vào năm 2025.」

Các độc giả, có ai nhận ra điều gì sai ở mô tả trên không?

Nếu chỉ thực hiện kiểm tra lại từ 1975 đến 2024,thực sự rất dễ rơi vào bẫy "rò rỉ dữ liệu trong tương lai". Bởi vì chúng ta chỉ đơn giản sử dụng tất cả dữ liệu "cho đến nay" để kiểm tra lại, điều này sẽ dẫn đến các tham số chiến lược được đào tạo có thể "không bền"!

Cách thực hiện nghiêm ngặt hơn là, ví dụ:

Có thể tiếp tục kiểm tra hiệu suất của toàn bộ năm 2024 bằng chiến lược được đào tạo cho giai đoạn "1975 ~ 2023" (giả sử chúng ta đang ở năm 2024);tất nhiên, chúng ta cũng có thể sử dụng dữ liệu từ giai đoạn 1975 ~ 2022 để đào tạo chiến lược, sau đó sử dụng chiến lược đã được đào tạo để kiểm tra hiệu suất của năm 2023 và 2024.

Chính xác hơn, chúng ta có thể thông qua phương pháp "kiểm tra lại lăn" hoặc "kiểm tra lại từng bước" để tránh "rò rỉ dữ liệu trong tương lai" càng nhiều càng tốt.

Lợi ích của việc này là "đảm bảo rằng chiến lược được đào tạo có thể chịu được thử thách trong tương lai".

  • Làm thế nào để đặt ngưỡng bảo thủ hơn?
  • Nếu chúng ta quay lại tháng 4 năm 2021, chỉ có thể nhìn thấy dữ liệu lịch sử từ năm 13, 17, thì ngưỡng được đặt bảo thủ có thể được kích hoạt vào tháng 4 năm 21 không?
  • Ngưỡng được đặt theo cách này có thể được kích hoạt ở đỉnh thứ hai của năm 2021 không?
  • Nếu không cho rằng tháng 4 năm 2021 là đỉnh, thì đỉnh thứ hai của năm 2021 càng không thể thoát đỉnh, phải không?

Tôi muốn nói rằng:

Bởi vì số lượng mẫu dữ liệu lịch sử của BTC quá ít, và nếu chỉ xem xét các chu kỳ trước đó,thực sự rất có thể rơi vào bẫy "rò rỉ dữ liệu tương lai".

Những người ở tháng 4 năm 2021 (đỉnh thứ nhất) sẽ không biết giá trị MVRV tại thời điểm đó,thực sự là điểm cao nhất của chu kỳ này, vì họ chỉ có thể nhìn thấy dữ liệu từ năm 13, 17;tương tự, khi đỉnh thứ hai của năm 2021 xuất hiện, giá trị MVRV thậm chí ở mức cực thấp,nếu không thoát khỏi đỉnh thứ nhất, thì tất nhiên không thể thoát đỉnh dựa trên dữ liệu của đỉnh thứ hai,do đó sẽ bỏ lỡ thời điểm thoát đỉnh tối ưu năm 2021.

2. Chỉ báo AVIV

AVIV có thể được coi là MVRV được điều chỉnh, được xem xét kỹ hơn, và so với MVRV có đặc tính "hồi quy trung bình" rõ ràng hơn.

Nhưng ngay cả như vậy, hiện tượng "giảm dần đỉnh" vẫn rất rõ ràng:

Các điểm đánh dấu 1, 2, 3, 4 tương ứng với các đỉnh năm 13, 17, và hai đỉnh của năm 2021.

Với cùng một vấn đề, tôi sẽ trực tiếp sao chép văn bản ở trên để các độc giả suy nghĩ:

  • Làm thế nào để đặt ngưỡng bảo thủ hơn?
  • Nếu chúng ta quay lại tháng 4 năm 2021, chỉ có thể nhìn thấy dữ liệu lịch sử từ năm 13, 17, thì ngưỡng được đặt bảo thủ có thể được kích hoạt vào tháng 4 năm 21 không?
  • Ngưỡng được đặt theo cách này có thể được kích hoạt ở đỉnh thứ hai của năm 2021 không?
  • Nếu không cho rằng tháng 4 năm 2021 là đỉnh, thì đỉnh thứ hai của năm 2021 càng không thể thoát đỉnh, phải không?
(Phần còn lại của bản dịch tương tự, tuân theo các nguyên tắc dịch như trên)

Khu vực:
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
1
Bình luận