具有語言模型的抗操縱預測市場衍生性商品

10-15

本文為機器翻譯

展示原文

利用語言模型實現抗操縱的預測市場衍生品

感謝Diego 的深入討論促成了這項工作。
還要感謝Sam Hart 、 David Crapis 、 Swapnil和Jorik 的反饋和審查。

TL;DR：基於 LLM 的預測衍生品為傳統預測市場衍生品的操縱風險提供了一種新穎的解決方案，同時也為支持預測市場中可能更豐富的事件格局提供了一種新的原語。通過使用語言模型來生成指數價格，這種方法將衍生品與可操縱的現貨市場分離開來。數學證明支持該解決方案的穩健性，同時提出了增強系統可靠性的其他策略。

超級預報員1024×1024 332 KB

預測市場有效地彙總了信息並預測事件。然而，衍生品預測市場帶來了新的風險：操縱決定衍生品指數價格的底層“現貨”市場。

最近對 Polymarket 的一次失敗攻擊就是這種攻擊方式的典型。2024 年 9 月 6 日，一名攻擊者以 2024 年美國總統選舉衍生品市場為目標，採取了以下行動：

在衍生品市場中佔據較大份額；
試圖花費約 700 萬美元壓低“現貨”市場價格；
如果成功的話，將獲得150萬美元的賠付。

雖然這次嘗試失敗了，但類似的漏洞在具有類似市場結構的借貸市場上已被成功利用，例如Mango Markets 。這些事件凸顯了衍生品預測市場固有的關鍵系統性風險。

法學碩士衍生品

提醒一下，永續合約的關鍵組成部分是：

標記價格，即永續合約的交易價格
指數價格，即永續合約所追蹤的標的資產的價格
當標記價格偏離指數價格時，多頭和空頭之間交換的資金費率
開倉所需抵押品

例如，永續合約可以追蹤預測市場上交易的“YES”代幣的中間價，從而成為預測市場的衍生品。

我們建議使用大型語言模型 (LLM)，而不是使用預測市場內生的信息來生成指數價格。通過將衍生品與現貨市場脫鉤，並利用多樣化、可靠的來源，這種方法可能比傳統預測市場具有更大的抗操縱能力，因為在傳統預測市場中，任何參與者都可以影響價格。

LLM 可以被解釋為一種將不斷變化的定性公共信息商品化的機制。通過將當前的信息格局彙總為一個概率，它可以為構建可交易工具設定一個價格。以下是對此類 perp 結構的更精確描述：

指數價格是LLM計算出的概率的移動平均值。
多頭押注該事件發生的可能性增加。
空頭押注該事件發生的可能性會降低。
資金利率的支付取決於衍生品市場與 LLM 相比的賠率定價方式（對 LLM 隱藏了多少信息）。

最近的研究支持了 LLM 的預測能力。Halawi 等人的研究“利用語言模型實現人類水平的預測”發現，經過微調的 LLM 在某些情況下幾乎可以匹敵甚至超越人類預測者對 Polymarket 事件的預測，有可能成為“超級預測者”。這表明 LLM 可以有效地充當指數價格的預言機，允許從現貨市場稀少或不存在的事件中創建衍生工具。

信息聚合

LLM 充當計算代理，彙總並自動整合公開信息。相反，交易員則通過其交易活動貢獻私人信息。

該系統的抗操縱能力得到了 LLM 的來源加權機制的支持。這將操縱任何單個信息源的影響限制在 LLM 為其分配的權重內。因此，單個來源相對於其他來源的權重越低，系統對針對該來源的操縱嘗試的抵抗力就越強。

假設S S為 LLM 使用的所有源的集合。我們考慮一個簡單的模型，其中 LLM 將其概率P P生成為來自所有源的概率的加權平均值，並且所有源都是獨立的： P=\sum_{j \in S}(w_j*p_j) P = ∑ j ∈ S ( w j ∗ p j ) 。這實際上對應於來自獨立數據的多個 LLM 推理的集合概率。但是，LLM 可以以不同的方式生成P P並且源可能具有依賴關係。

定理 1 (權重調整源的抗操縱性) ：在上述模型下，令P P為 LLM 生成的事件概率， P_i P i為源i i被操縱時產生的概率。然後：

|P - P_i| ≤ w_i

| P − P i | ≤ w i

其中w_i w i是 LLM 分配給源i i 的權重，其中\sum w_i=1 ∑ w i = 1 。

證明
令S_{-i} S − i為除i i之外的所有源的集合。
如果源i i被操縱，新的概率P_i P i將是：
P_i=w_i*p_i'+\sum_{j \in S_{-i}}(w_j*p_j)
P i = w i ∗ p ′ i + ∑ j ∈ S − i ( w j ∗ p j )
其中p_i' p ′ i是從源i i操縱的概率。
P P和P_i P i的區別在於：
|P-P_i|=|w_i*(p_i-p_i')|
| P − P i | = | w i ∗ （ p i − p ′ i ） |
p_i p i和p_i' p ′ i之間可能的最大差值為1 1 。因此，
|P-P_i| \leq w_i
| P − P i | ≤ w i
\黑色正方形■

該定理提供了一種可量化的抗操縱性測量方法，與 LLM 使用的源權重直接相關。假設信息源之間相互獨立，該定理表明，當分配給任何單個源的權重接近於零時，基於 LLM 的預測導數對操縱的抵抗力越來越強。

推論 1 (等權重源的抗操縱性) ：如果 LLM 使用至少n個等權重的獨立源，則：

|P-P_i|\leq\ \frac{1}{n}

| P − P i | ≤ 1 n

其中P P是 LLM 生成的事件概率， P_i P i是如果源i i被操縱則生成的事件概率。

證明
如果各源的權重相等，則w_i=\frac{1}{n} w i = 1 n對於所有的i i 。
因此，根據定理 1：
|P-P_i|\leq w_i=\frac{1}{n}
| P − P i | ≤ w i = 1 n
\黑色正方形■

這一推論表明，增加同等權重的信息源數量可以降低操縱任何單一信息源的影響。直觀地看，隨著事件接近解決，可用信息源的數量往往會增加，從而進一步增強系統對操縱的抵抗力。

基於法學碩士的預測永久債券

我們正式引入事件概率的永續合約，其中 LLM 而不是傳統市場生成指數價格。

令P P為 LLM 生成的概率。因此，永久性由以下因素決定：

\text{抵押比率} = \frac{\text{權益}}{\text{債務}} = \frac{\text{抵押數量} * \text{抵押價格}}{\text{永續數量} * P*\$1}

抵押比率=股權債務=抵押品數量∗抵押品價格永續合約數量∗ P ∗ $ 1

由於P P是概率，我們將分母乘以 $1，確保與分子的單位一致。

資金利率機制將交易價格（標記）與 LLM 生成的概率（指數）對齊，其差距直觀地與 LLM 隱藏的信息量成正比。

\text{資金} = \text{標記} - \text{指數} = \text{標記} - P

資金=馬克−指數=馬克− P

信息聚合：信息替代品

LLM 聚合機制的另一種模型是，LLM 對接收到的單個信號執行基於共同先驗的貝葉斯更新。當同時呈現所有信號時，它可以將它們聚合成一個概率估計。然後，概率P_t P t成為對最後一組信號進行最新貝葉斯更新的結果。

正式來說，LLM 估計一個共同的先驗P_{LLM} P L L M 。我們將與支撐市場的二元結果相對應的變量表示為Y. Y 。當 LLM 收到n個不同的信號\{x_1, \dots, x_n\} { x 1 , … , x n } 時，它會輸出價格P = P_{LLM}(Y=1|x_1, \dots, x_n) P = P L L M ( Y = 1 | x 1 , … , x n ) 。

如果兩個信號在給定基本事實的情況下條件獨立，則它們被視為信息替代品。這是預測市場文獻中確保激勵兼容性的重要條件。

這種模型可以研究單個 LLM 推理聚合多個可替代信號的情況，或對可替代信號進行連續 LLM 推理的情況。一個信號可能對應一組信息源。

定理 2 （信息替代條件下 LLM 的抗操縱性）：在對信息結構進行合理假設的情況下，如果 LLM 能夠獲取足夠數量的信息替代信號，那麼試圖操縱信號的惡意代理最多隻能使最終價格偏離\epsilon ϵ 。

證明
該結果源於對 Srinivasan 等人的“無法驗證結果的自我解決預測市場”中引理 1和定理 1的重新解釋。
我們考慮一個特定的信號t t ，它被惡意代理篡改，導致信號\tilde{x_t} ~ x t被修改。LLM 還可以訪問另一組信息源x_{-t} x − t ，簡單地表示為x_r x r ，其中\Omega_r Ω r對應於底層信號空間的結構。LLM 將在收到真實信號x_t x t後產生價格P_{LLM}(Y=1 | x_t) P L L M ( Y = 1 | x t ) 。
我們假設代理在操作期間無法訪問此信息集。如果 LLM 立即從多個來源更新（代理沒有時間訪問它們），或者如果我們將每個信號視為與特定時間t t相關聯，則此假設成立。然後，LLM 首先接收操縱信號以及捆綁在\tilde{x_t} ~ x t中的其他公共源的信號，一段時間後，它會從非操縱源接收更新作為x_r x r 。如果源隨時間快速更新，後者可能特別有趣。
根據上述引理，我們有：
E [P_{LLM}(Y=1 | x_r，\tilde{x_t}) | x_t] = P_{LLM}(Y=1 | x_t) + \Delta(\Omega_r，\tilde{x_t}，x_t)
E [ PLLM （ Y = 1 | xr ， ~ xt ） | xt ] = PLLM （ Y = 1 | xt ） + Δ （ Ωr ， ~ xt ， xt ）
該方程表明，惡意代理在x_r x r下聚合其他信息源後對 LLM 價格的預期受到依賴於虛假報告\tilde{x_t} ~ x t 的誤差項的影響。誤差項越大，意味著價格操縱潛力越大。
定理 1表明，如果\Omega_r Ω r由信息替代品信號組成，則誤差項可以隨著替代品數量k k的增加而最小化。
\黑色正方形■

該定理表明，當 LLM 能夠訪問替代信息源時，惡意代理操縱最終價格的能力將受到極大限制。定理11具有互補價值，因為人們可以對可替代信號進行多種推斷。

市場效率

這種衍生品可能實現一種新穎的效率形式，其中LLM可以快速整合公共信息，而交易活動則可以整合私人信息。

定理 3 （基於 LLM 的預測永續合約的效率）：令P_t P t為 LLM 在時刻t t生成的概率， M_t M t為永續合約在時刻t t的標記價格， I_t I t為時刻t t可獲得的公開信息集。用\delta_t δ t表示對應於私人信息到來導致的標記價格跳變的 delta-Dirac 函數。然後：

|E[P_t|I_t]-P_t|\leq \epsilon_{\text{LLM}} | E [ P t | I t ] − P t | ≤ ϵ LLM （ LLM 效率）
在私人信息到達之外， P_t \approx M_t P t ≈ M t (均值反轉)
當\delta_t δ t變為正值，標記價格跳變時，經過一段鬆弛時間P_t後， P t也會跳變（ LLM 與市場之間的反饋迴路）

證明
1. LLM 效率：根據設計，LLM 處理所有可用的公共信息I_t I t以生成P_t P t 。邊界\epsilon_{\text{LLM}} ϵ LLM表示此過程中的最大誤差。
2. 令f(t)=k(M_t-P_t) f ( t ) = k ( M t − P t )為時間t t 的資金利率，其中1>k>0 1 > k > 0為常數。如果M_t>P_t M t > P t ，則f(t)>0 f ( t ) > 0 ，激勵交易者賣出並推低M_t M t 。如果M_t<P_t M t < P t ，則f(t)<0 f ( t ) < 0 ，激勵交易者買入並推高M_t M t 。這創建了一個廣義的 Ornstein-Uhlenbeck 過程：
  dM_t=\alpha(P_t-M_t)dt+\sigma d W_t
  d M t = α ( P t − M t ) d t + σ d W t
  其中\alpha>0 α > 0是調整速度， \sigma σ是波動率， W_t W t是維納過程。
  我們假設P_t P t是一個緩慢變化的隨機變量。這是一個現實的假設，因為新聞格局不會突然改變。那麼對於一個時間段[t_0,t_1] [ t 0 , t 1 ]，我們有P_t(\omega) \approx P(\omega) P t ( ω ) ≈ P ( ω ) 。上面的 SDE 給出
  |E[M_t]-P(\omega)|=|P(\omega)-M_{t_0}|e^{-k(t-t_0)}
  | E [ M t ] − P ( ω ) | = | P ( ω ) − M t 0 | e − k ( t − t 0 )
  因此，在正常市場條件下，我們會看到指數均值反轉和P_t \approx M_t P t ≈ M t 。我們還可以看到，彙總公共信息的誤差界限完全取決於 LLM。
  我們現在在上面的 SDE 中引入\delta_t δ t來解釋私人信息：
  dM_t=\alpha(P_t-M_t)dt+ \eta\delta_tdt + \sigma d W_t
  d M t = α ( P t − M t ) d t + η δ t d t + σ d W t
  我們假設\delta=0 δ = 0在]t(\omega), t(\omega) + \epsilon(\omega)[ ] t ( ω ) , t ( ω ) + ϵ ( ω ) [之外，其中t t和\epsilon ϵ為隨機變量， \delta_t>0 δ t > 0在區間內且\int_{\mathbb{R}} \delta_t =1 ∫ R δ t = 1 。項\eta(\omega) η ( ω )是量化跳躍幅度的隨機變量，它可以等於\pm \eta ± η 。由於在t^*=t(\omega) t ∗ = t ( ω )之前我們有M_t\approx P_t M t ≈ P t，因此可以合理地假設在時間\epsilon(\omega) ϵ ( ω )期間我們有：
  dM_t = \eta\delta_tdt + \sigma d W_t
  dMt = ηδtdt + σdWt
  因此，平均價格漲幅為\eta η 。因此，我們可以簡化假設：當t<t^* t < t ∗時， M_t= M_{t_0} M t = M t 0 ；當 t > t^* + \epsilon(\omega) t > t ∗ + ϵ ( ω )時，M_t = M_{t_0} + \eta M t = M t 0 + η ，其中t_0 < t^* t 0 < t ∗ 。為簡潔起見，我們省略其餘證明，但通過求解上述第二個 SDE 並對t>>t^* t > > t ∗進行漸近分析，可以發現：
  M_{t_0} + \eta \approx P(\omega)[1-e^{-k(tt^*)}]
  M t 0 + η ≈ P ( ω ) [ 1 − e − k ( t − t ∗ ) ]
  因此，對於較大的t t ，我們必須有P_t \approx M_{t_0} + \eta P t ≈ M t 0 + η ，並且 LLM 必須遵循初始跳躍。
  \黑色正方形■

該定理形式化了基於 LLM 的預測衍生品（所有公開信息均已計入價格）的半強有效性的新形式，將 LLM 信息處理與市場價格發現相結合。

確保進一步的穩健性

LLM 的設計必須能夠抵禦諸如遺漏或不一致等錯誤。它應該依靠可靠、不易操縱的信息來源，並努力實現最大程度的可觀察性。

為了增強系統可靠性和抵抗操縱，存在更多策略：

經過驗證的信息檢索：從特定網站（例如，使用 TLSNotary）認證 LLM 的數據檢索，以確保信息管道的完整性，這對於分散的 LLM 操作至關重要。
白名單：限制LLM的來源以確保權威性和相關性。
適應性檢索：根據事件類型（例如體育與太空飛行）定製優先級、API 模塊和白名單。
合約價格跟蹤：實施 LLM 反饋迴路，促進指數和標記價格之間的收斂，補充資金利率和價格收斂至0 0或1 1 。
LLM 預測集成：通過組合多個預測來減少變化和不一致性。
包含列表機制：要求 LLM 審查特定數據，無論其內部檢索決定如何。
基於數據模型識別：實現一個複雜的本體來對 LLM 預測進行基準測試，如本文所述。
多 LLM 平均：通過可能存在多個相互競爭的 LLM 的“硅谷智慧”方法，減輕 LLM 特定的偏見（例如，校準不佳、過度自信）。
具有 TEE 的無許可機制：LLM 權重可以預先提交，任何人都可以重新運行 LLM 來驗證輸出。此外，最終提示可以來自各種參與者（請參閱本文對此類機制的一般討論）。

拓展活動範圍

預測市場仍然支持非常有限的市場。像“科學”這樣的龐大領域在 Polymarket 上只包含大約 30 個市場。通過生成動態價格（該價格會隨著新信息的出現而更新，且無需初始資本），LLM 幾乎可以支持任何市場，只要它能夠獲得可靠的信息來源。

正如本研究報告所指出的，通過“超級提問者”（與“超級預測者”對稱的角色）有效地探索可能發生事件的空間，對於理解最重要的“存在”問題至關重要。

結束語

我們假設 LLM 在將公共信息彙總為概率方面具有一定的固有效率。我們還假設此類預測 LLM 實際上可以處於我們上面概述的操縱範圍內。如果呈現給 LLM 的信息結構足夠豐富，我們預計情況會如此。

在這些假設下，使用 LLM 作為指數價格構建預測市場衍生品是可能的和有效的，這一關鍵主張取決於上面提出的最後一個結果，該結果確保了融資利率可以推動均值迴歸走向真實的解決方案。第一個結果支持\epsilon_{LLM} ϵ L L M可以被選擇得足夠小的說法。

一般直覺是， P_t P t是聚合公共信號的代理， M_t M t是聚合公共和私人信號的代理，而資金利率會隨著時間的推移推動衍生品價格朝著正確的方向發展。

基於 LLM 的預測衍生品為衍生品預測市場中的一個關鍵操縱風險提供了一種新穎的解決方案。通過與可能被操縱的現貨市場脫鉤，這種方法旨在消除開發事件概率衍生品市場的主要障礙。我們預計，這種解決方案將鼓勵對預測市場衍生品進行試驗，特別是在相應的現貨預測市場流動性不足或不存在的情況下。

此外，這樣的原語可以確保比我們目前在 Polymarket 等市場上看到的更大的市場集的效率，使我們能夠訪問新穎的信息聚合形式。