【長推】Polymarket 套利聖經

Chainfeeds

Chainfeeds 導讀：

差距不是運氣。是數學基礎設施。

文章來源：

https://x.com/MrRyanChi/status/2031292099384008810

文章作者：

Roan

觀點：

Roan：預測市場中一個常見誤區是「單一市場謬誤」。如果只看單個市場，價格看起來往往是合理的。例如某個市場的問題是：「特朗普會贏下賓夕法尼亞州嗎？」YES 價格為 0.48，NO 價格為 0.52，兩者相加正好等於 1，看起來完全符合概率邏輯，沒有任何套利空間。但問題在於，現實世界中的事件並不是孤立的。只要把多個相關市場放在一起，就可能暴露出定價上的邏輯矛盾。例如再看另一個市場：「共和黨是否會在賓夕法尼亞州領先對手 5 個百分點以上？」這個市場的 YES 價格為 0.32，NO 價格為 0.68，同樣加起來是 1，看似也沒有問題。然而兩者之間存在明顯的邏輯依賴關係。美國總統選舉是按州計算選舉人票的，特朗普作為共和黨候選人，如果共和黨在賓夕法尼亞州領先對手 5 個百分點以上，那麼特朗普不僅會贏下該州，而且是大勝。因此，共和黨大勝實際上是特朗普獲勝的一個子集。換句話說，如果 B 事件發生，那麼 A 事件必然發生。在概率邏輯上，子集事件的概率不可能高於其母事件。如果市場給出的價格違反了這一點，就意味著存在套利空間。一個直觀的類比是天氣預測：明天會下雨嗎和明天會有雷暴嗎。雷暴一定伴隨著降雨，因此雷暴發生的概率不可能高於下雨。如果市場價格出現這種不合理情況，交易者就可以同時在不同市場中買入和賣出相關頭寸，從而鎖定無風險利潤。這種通過利用邏輯不一致獲得收益的行為，就是套利。在複雜預測市場中，檢測套利並不是簡單的事情。理論上，如果一個市場有 n 個條件，那麼所有可能的結果組合數量是 2ⁿ。這個數字在條件數量增加時會迅速膨脹。例如在 2010 年 NCAA 錦標賽市場中，一共有 63 場比賽，每場比賽只有兩種結果：勝或負。這意味著所有可能的結果組合數量為 2⁶³，大約是 9.22×10¹⁸ 種，也就是超過九百億億種可能情況。如果試圖通過暴力搜索的方法逐一檢查每一種組合，即使每秒能夠計算 10 億種情況，也需要接近三百年的時間才能完成。這種計算複雜度在現實系統中完全不可接受。同樣的問題也出現在政治預測市場中。例如在 2024 年美國大選相關市場中，研究團隊發現存在 1576 對潛在具有依賴關係的市場。如果每個市場有 10 個條件，那麼每一對市場需要檢查 2²⁰（約一百萬）種組合，再乘以所有市場對，計算量將迅速膨脹。因此，量化系統不會採用暴力枚舉的方式，而是使用整數規劃來描述合法結果。通過一組線性約束，就可以排除大量不可能出現的組合。例如在 Duke 對 Cornell 的比賽市場中，每支球隊都有 7 個可能的勝場數盤口，總共 14 個條件。如果用暴力方法，需要檢查 2¹⁴（16384）種組合。但實際上只需要三條約束即可描述所有合法情況：第一，每支球隊的 7 個盤口中必須恰好有一個為真；第二，兩隊不可能同時贏 5 場以上，因為那樣會在半決賽相遇。通過這種方式，複雜問題被轉化為少量約束，大幅降低了計算成本。在發現套利機會之後，另一個關鍵問題是如何計算最優交易方案。直覺上，一個簡單的做法是找到距離當前價格最近的無套利價格，然後執行對應的交易。但如果使用普通的歐幾里得距離（即直線距離）來衡量價格差異，會產生嚴重問題。因為在預測市場中，價格實際上代表的是隱含概率，而概率變化在不同區間的意義並不相同。例如價格從 0.50 上升到 0.60，代表概率從 50% 變為 60%，這只是一個相對溫和的信念更新。但如果價格從 0.05 上升到 0.15，則意味著一個幾乎不可能發生的事件突然變得顯著更可能，這種變化包含的信息量要大得多。歐幾里得距離無法反映這種差異，它會把所有 10 美分的變化視為同樣重要。因此，在使用 LMSR（對數市場評分規則）作為做市機制的預測市場中，更合理的距離度量是 Bregman 散度。在這種情況下，Bregman 散度等價於 KL 散度，它來源於信息論，用來衡量兩個概率分佈之間的差異。KL 散度的一個重要特性是：當價格接近 0 或 1 時，任何小的變化都會被賦予更大的權重。這與市場直覺一致，因為極端概率附近的價格變化通常意味著更強的信息衝擊。

內容來源

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論