Chainfeeds 導讀:
AI Trading 的瓶頸不在模型,在工程。
文章來源:
https://x.com/Web3Tinkle/status/2007960269235126350
文章作者:
Tinkle
觀點:
Tinkle:理解了大模型的計算流程後,一個核心問題浮現出來:大模型到底在做什麼?表面上看,它是在預測下一個詞,比如給定今天天氣,模型輸出不錯的概率最高,看起來像是在預測未來。但如果拆解其內部機制,會發現它做的其實是三步:首先,將當前上下文編碼為一個高維向量;其次,在參數空間中檢索與該向量最匹配的模式;最後,輸出該模式對應的概率分佈。因此,大模型並不是在推斷未知事件,而是在識別當前輸入最像訓練數據中的哪一種已知模式。預測,是對未來不確定性的推斷;而識別,是對歷史模式的匹配。大模型之所以在語言領域表現卓越,是因為自然語言本身具有極強且穩定的統計規律 —— 某些詞序列之後,接續內容的分佈高度集中。當你向 ChatGPT 提問時,它並非在 “思考答案”,而是在匹配與你輸入最相似的語言模式,並輸出該模式下最常見的回應形式。表面呈現為預測,底層本質卻是大規模模式識別。將這種模式識別的邏輯遷移到金融市場,看似直觀:把市場數據編碼成向量,檢索歷史上最相似的狀態,再輸出未來走勢的概率分佈。然而,這裡存在一個根本差異:金融市場的統計規律遠弱於自然語言。語言中,下一個詞的不確定性往往很低,而市場中,下一根 K 線的漲跌卻高度接近隨機。大量研究表明,模型在金融時間序列上往往只能學到均值迴歸這類弱模式,對真正重要的極端波動幾乎無能為力。更關鍵的是,市場具有強烈的非平穩性和對抗性:有效規律會隨著參與者結構、監管環境和資金行為的變化而迅速失效,任何可被系統性利用的模式,都會被套利力量抹平。因此,用大模型直接預測漲跌註定失敗。但這並不意味著模式識別在金融中沒有價值,關鍵在於:不要問價格會怎麼走,而要問市場現在處於什麼狀態。相比預測單點漲跌,識別市場所處的 Regime(狀態)具有更高的信噪比。市場會在低波動震盪、高波動震盪、趨勢上漲、趨勢下跌、流動性危機等不同狀態之間切換,而這些狀態往往具有持續性和可識別的結構特徵。基於這一思路,可以構建市場狀態嵌入:將高維異構市場數據壓縮為低維向量,使相似 Regime 的時刻在向量空間中彼此接近。通過對比學習、聚類或相似度檢索,可以判斷當前市場更接近歷史上的哪一類狀態,並據此進行策略選擇和風險控制。其價值不在於捕捉每一次行情,而在於在高風險 Regime 中主動降倉或退出,避免系統性回撤。NoFx 的定位正是圍繞這一理念構建 AI Trading 的基礎設施層:不讓 AI 玄學式預測市場,而是通過透明、可解釋的 Regime 識別與結構化決策,幫助交易者在複雜多變的市場中做出更穩健的選擇。
內容來源





