【長推】Polymarket 套利聖經

Chainfeeds 導讀:

差距不是運氣。是數學基礎設施。

文章來源:

https://x.com/MrRyanChi/status/2031292099384008810

文章作者:

Roan


觀點:

Roan:預測市場中一個常見誤區是「單一市場謬誤」。如果只看單個市場,價格看起來往往是合理的。例如某個市場的問題是:「特朗普會贏下賓夕法尼亞州嗎?」YES 價格為 0.48,NO 價格為 0.52,兩者相加正好等於 1,看起來完全符合概率邏輯,沒有任何套利空間。但問題在於,現實世界中的事件並不是孤立的。只要把多個相關市場放在一起,就可能暴露出定價上的邏輯矛盾。例如再看另一個市場:「共和黨是否會在賓夕法尼亞州領先對手 5 個百分點以上?」這個市場的 YES 價格為 0.32,NO 價格為 0.68,同樣加起來是 1,看似也沒有問題。然而兩者之間存在明顯的邏輯依賴關係。美國總統選舉是按州計算選舉人票的,特朗普作為共和黨候選人,如果共和黨在賓夕法尼亞州領先對手 5 個百分點以上,那麼特朗普不僅會贏下該州,而且是大勝。因此,共和黨大勝實際上是特朗普獲勝的一個子集。換句話說,如果 B 事件發生,那麼 A 事件必然發生。在概率邏輯上,子集事件的概率不可能高於其母事件。如果市場給出的價格違反了這一點,就意味著存在套利空間。一個直觀的類比是天氣預測:明天會下雨嗎和明天會有雷暴嗎。雷暴一定伴隨著降雨,因此雷暴發生的概率不可能高於下雨。如果市場價格出現這種不合理情況,交易者就可以同時在不同市場中買入和賣出相關頭寸,從而鎖定無風險利潤。這種通過利用邏輯不一致獲得收益的行為,就是套利。在複雜預測市場中,檢測套利並不是簡單的事情。理論上,如果一個市場有 n 個條件,那麼所有可能的結果組合數量是 2ⁿ。這個數字在條件數量增加時會迅速膨脹。例如在 2010 年 NCAA 錦標賽市場中,一共有 63 場比賽,每場比賽只有兩種結果:勝或負。這意味著所有可能的結果組合數量為 2⁶³,大約是 9.22×10¹⁸ 種,也就是超過九百億億種可能情況。如果試圖通過暴力搜索的方法逐一檢查每一種組合,即使每秒能夠計算 10 億種情況,也需要接近三百年的時間才能完成。這種計算複雜度在現實系統中完全不可接受。同樣的問題也出現在政治預測市場中。例如在 2024 年美國大選相關市場中,研究團隊發現存在 1576 對潛在具有依賴關係的市場。如果每個市場有 10 個條件,那麼每一對市場需要檢查 2²⁰(約一百萬)種組合,再乘以所有市場對,計算量將迅速膨脹。因此,量化系統不會採用暴力枚舉的方式,而是使用整數規劃來描述合法結果。通過一組線性約束,就可以排除大量不可能出現的組合。例如在 Duke 對 Cornell 的比賽市場中,每支球隊都有 7 個可能的勝場數盤口,總共 14 個條件。如果用暴力方法,需要檢查 2¹⁴(16384)種組合。但實際上只需要三條約束即可描述所有合法情況:第一,每支球隊的 7 個盤口中必須恰好有一個為真;第二,兩隊不可能同時贏 5 場以上,因為那樣會在半決賽相遇。通過這種方式,複雜問題被轉化為少量約束,大幅降低了計算成本。在發現套利機會之後,另一個關鍵問題是如何計算最優交易方案。直覺上,一個簡單的做法是找到距離當前價格最近的無套利價格,然後執行對應的交易。但如果使用普通的歐幾里得距離(即直線距離)來衡量價格差異,會產生嚴重問題。因為在預測市場中,價格實際上代表的是隱含概率,而概率變化在不同區間的意義並不相同。例如價格從 0.50 上升到 0.60,代表概率從 50% 變為 60%,這只是一個相對溫和的信念更新。但如果價格從 0.05 上升到 0.15,則意味著一個幾乎不可能發生的事件突然變得顯著更可能,這種變化包含的信息量要大得多。歐幾里得距離無法反映這種差異,它會把所有 10 美分的變化視為同樣重要。因此,在使用 LMSR(對數市場評分規則)作為做市機制的預測市場中,更合理的距離度量是 Bregman 散度。在這種情況下,Bregman 散度等價於 KL 散度,它來源於信息論,用來衡量兩個概率分佈之間的差異。KL 散度的一個重要特性是:當價格接近 0 或 1 時,任何小的變化都會被賦予更大的權重。這與市場直覺一致,因為極端概率附近的價格變化通常意味著更強的信息衝擊。

內容來源

https://chainfeeds.substack.com

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論