數字資產市場的系統性特徵發現

本文為機器翻譯
展示原文
數字資產市場的系統性特徵發現

在Glassnode,我們通過數百個鏈上指標監控區塊鏈活動,其中許多指標被用作交易機器學習模型的特徵。巨大的特徵空間帶來了一個關鍵挑戰:每個指標都可以通過無數指標進行轉換,並以幾乎無限的方式組合。在本案例研究中,我們引入了一個自下而上的特徵發現框架,旨在系統地應對這種複雜性,並識別潛在的、非同尋常的高價值指標組合。

執行摘要

  • 我們提出了一種自下而上的結構化方法來探索鏈上交易指標的組合空間,展示了一種手動自上而下的特徵工程的替代方法。
  • 應用於僅使用 2 個特徵模型的比特幣上升趨勢檢測的特定案例研究,探索揭示了意想不到的模式:最佳上下文窗口為 800-1,200 天,而不是傳統的較短週期。
  • 表現最佳的指標組合包括已實現的市值用戶保留率指標,儘管這些僅代表潛在指標的表面。
  • 該分析為實踐者提供了一個起點,展示了結構化探索如何補充傳統方法。

組合挑戰

要理解結構化探索的重要性,請思考當今分析師面臨的挑戰之大。現代金融市場生成海量數據。加密貨幣生態系統提供了一個尤為豐富的例子:區塊Glassnode每天以前所未有的透明度結算數十億筆交易。Glassnode 追蹤不同資產、時間範圍和網絡段的數百個基本指標。每個指標都可以使用數十個技術指標進行轉換,每個指標都有各自的參數範圍。當組合成多特徵模型時,可能的配置數量會迅速激增,形成一個難以處理的搜索空間,即所謂的“維數災難”。這使得詳盡的探索變得不可能。

自上而下與自下而上的特徵工程

傳統的自上而下的特徵工程依賴於領域專家,他們根據經濟理論、市場理解和歷史先例來選擇指標。特徵的選擇基於可解釋性和理論合理性,能夠有效地利用專業知識,但自然而然地會側重於理論驅動的組合。

相比之下,自下而上的探索在特徵空間中採樣時沒有預先設定的偏好,因此可能會發現直覺可能遺漏的模式。這種方法並非從假設哪些指標應該有效開始,而是讓數據揭示意想不到的組合。

系統發現方法

鑑於這種計算上的不可能性,我們需要一種結構化的方法,能夠在保持統計嚴謹性的同時,對特徵空間中具有代表性的子集進行採樣。我們的方法通過嚴格的探索和評估來探索這個領域。

我們通過從可用指標、變換和參數範圍的整個空間中採樣來生成特徵組合,確保廣泛的覆蓋範圍,並防止因偏差而將搜索限制在熟悉的模式中。每個組合都使用簡單、低複雜度的機器學習模型(深度有限的決策樹)進行評估,以識別真正的模式而非過度擬合的噪聲,從而專注於發現更有可能在訓練數據之外推廣的穩健指標。

每個功能組合都會經過多個基於時間的測試,各個測試組合之間的性能一致性與整體性能同等重要,這有助於識別在不同市場條件下可靠運行的功能。生成的功能數據集及其各自的性能支持事後分析,不僅可以瞭解哪些組合表現良好,還可以瞭解其在何種情況下表現良好。

案例研究設置:比特幣趨勢檢測

為了在實踐中演示該方法,我們將其應用於一個與市場相關的具體目標:比特幣上漲趨勢檢測。我們的實現採用三階段採樣策略,系統地探索用於識別上漲趨勢的特徵空間。通過這種方式,我們在計算可行性和全面覆蓋潛在指標組合之間取得了平衡。

投資目標和標籤

重點在於在市場上漲階段確定比特幣多頭敞口的最佳時期。我們的標籤採用分層趨勢細分方法,通過檢測局部波峰和先前的波谷,遞歸地識別趨勢週期。這捕捉到了從業者所謂的“迷你牛市”——在更大的市場週期中持續上漲的時期。

該算法應用最小持續時間閾值來過濾噪聲,從而實現二分類:標籤 1 表示上升趨勢,標籤 0 表示下降趨勢或橫盤市場。這意味著,在“標籤 1”的時間段內,我們希望進入市場;而在“標籤 0”的時間範圍內,模型應該預測“退出市場”。請注意,這種特定的標籤選擇從根本上決定了所有後續結果,不同的目標會產生不同的結果。

數字資產市場的系統性特徵發現

圖 1:應用於比特幣的分層趨勢細分。綠色表示上升趨勢期(標籤 1),灰色表示下降趨勢/橫盤市場(標籤 0)。

評估框架

建立了趨勢定義框架後,我們需要一種評估方法,以提升研究結果的普適性。我們採用基於時間的交叉驗證,通過對每個測試年份的所有數據進行訓練來模擬不同的市場結構,並以各個年份(2017-2025)作為測試集。特徵選擇基於 2017-2023 年的數據,而 2024-2025 年的數據則保留用於樣本外驗證。

績效衡量指標是扣除交易成本後的淨收益,相對於買入並持有策略。選擇此指標僅供參考——該算法方法可以同樣針對風險調整指標(例如夏普比率或索提諾比率)、經典機器學習指標(例如準確率或 F-beta 分數)或以實施為中心的標準(例如信號頻率和回撤特徵)進行優化。不同的優化目標將呈現不同的最優特徵組合,而績效指標的選擇從根本上決定了探索過程中能夠發現哪些關係。

特徵空間配置

在定義了評估框架之後,我們面臨的實際挑戰是如何讓龐大的搜索空間易於計算處理。為了提高可解釋性,我們配置了一個受限的搜索空間,使用 1,600 個比特幣指標(包括子跡線),將轉換限制為僅限 Z 得分和 RSI,允許上下文窗口最長為 1,536 天,並將模型限制為僅 2 個特徵。即使有這些限制,理論搜索空間仍可達到:

(1,600 metrics × 2 transformations × 1,536 context windows)² = 24 trillion combinations

這一計算挑戰需要系統地進行降維。我們採用如下所述的三階段方法來實現這一目標。

三階段勘探過程

第一階段:單一特徵篩選

我們評估了 153,600 個單特徵組合,並跨指標、轉換和上下文窗口進行採樣。我們並非尋求絕對的贏家,而是尋找那些展現潛力的指標。

前 10 個個人指標

  1. MVRV 按年齡劃分:1 個月至 3 個月
  2. 月度活動保留供應:流失供應
  3. 市值盈虧:-10% 至 0%
  4. 已實現盈利和虧損上限:-10% 至 0%
  5. 年齡 SOPR :1 個月至 3 個月
  6. 錢包規模已實現上限:10 萬以上
  7. 不同年齡的損耗量:1個月至3個月
  8. 成本基礎分佈分位數:91%
  9. 持有餘額超過 10 萬的實體的供應量
  10. 短期持有人NUPL :少於155天

這些指標涵蓋估值比率、持有人行為和利潤/損失分佈——評估無需任何預選即可確定的多樣化且合理的集合。

數字資產市場的系統性特徵發現

圖 2:Top 50 個單項特徵的性能熱圖。行表示指標,列表示上下文窗口時段(0-1,535 天)。顏色強度表示 2017 年至 2023 年的年度平均性能。

第一階段的結果如圖 2 所示。例如,指標“ MVRV 按年齡:1 個月至 3 個月”結合 64-95 天的上下文窗口,相對於簡單的買入並持有策略,平均表現為 1.152。但請注意,這些發現僅構成我們流程的第一步,其本身很可能與任何穩健的交易信號無關。

第二階段:度量對發現

擴展此分析,我們使用第一階段的前 50 個指標,從約 2300 萬個可能的組合中抽取了 10 萬個評估樣本。目標是識別潛在的協同組合,而非最終的優化。

數字資產市場的系統性特徵發現

圖 3:前 50 個指標的成對績效矩陣。單元格顏色表示組合績效。

初步研究結果表明某些組合值得更深入的研究:

  • 已實現資本指標顯示出一致的有效性
  • 活動留存指標似乎與估值指標相輔相成
  • 一些對的組合結果比單個成分的結果更強。

第三階段:參數優化

雖然第二階段揭示了一些引人注目的指標組合,但我們尚未優化它們的歷史上下文窗口。對於我們在成對分析中確定的最值得關注的指標對——已實現市值和活動留存率,我們跨上下文窗口進行了有針對性的參數搜索。您認為哪個時間範圍最適合比特幣趨勢檢測——幾天、幾周還是幾個月?

模擬結果總結在圖 5 中。有趣的是,出現了一種意想不到的關係:最佳窗口範圍是 800-1,200 天,比傳統的技術分析週期長得多。

數字資產市場的系統性特徵發現

圖 5:上下文窗口優化顯示所選指標對在不同窗口組合中的性能。

我們的發現需要解釋,因為它們與技術分析中的傳統觀點相矛盾。雖然比特幣的脈搏通常指引方向,但我們發現,比特幣三年多來的緩慢呼吸模式似乎勾勒出了這一目標的真實路徑。一個關鍵因素是我們的標籤構建:分層趨勢細分識別出通常跨越數週或數月的上升趨勢段。較長的上下文窗口可能更好地捕捉這些延長趨勢週期的逐漸建立和確立,而較短的窗口可能會對更廣泛趨勢結構中的噪聲做出反應。800-1200天的窗口可能正在探測先於並維持廣泛上升趨勢階段的較慢變化的潛在條件。

然而,我們強調,這些觀察結果僅來自我們標籤方法的有限案例研究。針對短期波動的修改後的標籤定義將適用於不同的上下文窗口。

時間性能分析

我們的探索發現了一些引人注目的組合,但一個關鍵問題依然存在:這些關係隨著時間的推移有多穩定?為了解決這個問題,我們研究了不同特徵架構在不同時間段內的表現。我們根據指標類型對組合進行了分類:

  • 已實現市值 × 已實現市值:兩個指標均基於鏈上成本
  • 活動 × 已實現市值:混合行為和估值指標
  • 活躍度×活躍度:這兩個指標都基於用戶行為模式
數字資產市場的系統性特徵發現

圖 10:測試年份(2018-2023)的架構性能軌跡。x 軸上的每個簇代表指標對和上下文窗口桶的獨特組合,條形圖顯示年度性能。

樣本期間的主要觀察結果:

  • 已實現的資本組合方差較低,但回報率適中
  • 混合架構平衡一致性和有效性
  • 僅活動對錶現出與特定時期結果的高度差異

重要的是,所有架構在 2017 年至 2023 年期間的結果都呈現下降趨勢,這表明市場效率正在提高或市場動態正在發生變化。

樣本外結果:現實檢驗

雖然實時交易仍是最終的檢驗標準,但評估算法在先前排除的數據上的發現,可以洞察潛在的實際有效性。2024-2025 年的驗證期為我們的發現提供了至關重要的視角:

數字資產市場的系統性特徵發現

圖 7:樣本外表現(2024-2025 年)。架構類別與訓練期相同。

樣本外時期揭示了一些現象:一些之前表現強勁的策略(例如純活動留存組合)的有效性有所下降,而某些已實現的市值組合則保持​​了穩定的業績。這些結果的變化引發了關於市場演變的根本性問題。有效性特徵為何會發生變化?原因可能有多種,例如生態系統結構或參與者行為的真正變化、ETF 等新市場基礎設施的影響以及機構採用率的提高,或者其他完全不同的因素。

這些結果強調,結構化探索是調查的起點,而不是交易系統開發的終點。

實際意義和侷限性

分析結果

我們的結構化探索揭示了傳統分析無法發現的隱性關係,尤其是對 800-1,200 天長上下文窗口的偏好。即使我們僅使用來自有限指標集的 2 個特徵進行受限搜索,我們也能發現值得進一步研究的行為,這表明即使在嚴格的限制下,結構化採樣也能產生有價值的洞察。該方法展示了自下而上的探索和自上而下的特徵工程如何相互補充,並通過計算發現來指導領域專業知識的重點。最重要的是,該框架代表了一種可擴展的方法,可應用於不同的投資目標、各種資產和替代約束,為從業者提供探索其特定用例的工具。

這項分析沒有顯示什麼

然而,承認這些能力需要同樣重視約束條件。該分析並未提供完整的交易策略——使用簡單決策樹的兩個特徵無法捕捉加密貨幣市場的全部複雜性。結果特定於我們對標籤、指標和時間段的特定選擇,不應被解讀為關於市場行為的普遍真理。由於我們只採樣了即使在受限特徵空間中的一小部分,因此最優解或最佳特徵仍然難以捉摸。此外,這從根本上來說是一種歷史分析,過去的關係並不能保證未來的有效性,這進一步強調了持續驗證而非靜態實施的必要性。

未來研究方向

這些限制因素為未來的研究指明瞭若干令人信服的途徑。憑藉數千條可用的個體軌跡和無限的轉換可能性,廣闊的未開發配置空間蘊藏著發現有價值指標的巨大潛力。該方法可以擴展到不同的預測目標,例如波動率預測、回撤風險評估和制度變遷檢測,以及包括日內、周和月分析期在內的其他時間範圍。跨不同加密貨幣的多資產組合有助於識別普遍行為與特定資產行為,從而更深入地洞察加密貨幣市場。此外,探索超越簡單交易對的更復雜特徵交互對於構建穩健的預測模型至關重要,因為更多樣化的輸入既可以提供增強的個體預測指標,又能夠捕捉單一指標無法揭示的特徵之間的交互。

我們開發的工具使我們能夠以相對較少的努力探索不同的假設,為針對特定目標和限制的定製研究開闢了可能性。

結論

這些實證研究結果雖然僅針對我們的案例研究,但卻闡明瞭金融市場計算發現的更廣泛問題,並指明瞭當前的應用和未來的研究方向。我們的工作展示了結構化的自下而上的探索如何能夠補充傳統的自上而下的方法,例如,通過揭示擴展上下文窗口的意外有效性。雖然我們的分析僅僅觸及了無限可能組合的表面,但它展現了一種實踐者可以根據自身特定需求進行調整的方法。

樣本外結果至關重要地提醒我們:加密貨幣市場仍然充滿挑戰,不僅需要探索,還需要持續適應。對於Glassnode 的客戶和算法交易者來說,這個框架提供了一個起點,其方法本身不受先入之見的影響,有助於應對區塊鏈數據的巨大複雜性。

隨著加密貨幣市場的發展,分析方法也必須隨之演變。計算探索並非取代專業知識,而是增強專業知識,幫助揭示顯而易見的隱藏關係。


免責聲明:本報告僅供參考及教育之用。本分析基於有限的案例研究,且包含重大限制,不應被視為投資建議或最終交易信號。過往業績模式不保證未來業績。投資決策前,請務必進行徹底的盡職調查,並考慮多種因素。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論