利用语言模型实现抗操纵的预测市场衍生品
感谢Diego 的深入讨论促成了这项工作。
还要感谢Sam Hart 、 David Crapis 、 Swapnil和Jorik 的反馈和审查。
TL;DR:基于 LLM 的预测衍生品为传统预测市场衍生品的操纵风险提供了一种新颖的解决方案,同时也为支持预测市场中可能更丰富的事件格局提供了一种新的原语。通过使用语言模型来生成指数价格,这种方法将衍生品与可操纵的现货市场分离开来。数学证明支持该解决方案的稳健性,同时提出了增强系统可靠性的其他策略。
预测市场有效地汇总了信息并预测事件。然而,衍生品预测市场带来了新的风险:操纵决定衍生品指数价格的底层“现货”市场。
最近对 Polymarket 的一次失败攻击就是这种攻击方式的典型。2024 年 9 月 6 日,一名攻击者以 2024 年美国总统选举衍生品市场为目标,采取了以下行动:
- 在衍生品市场中占据较大份额;
- 试图花费约 700 万美元压低“现货”市场价格;
- 如果成功的话,将获得150万美元的赔付。
虽然这次尝试失败了,但类似的漏洞在具有类似市场结构的借贷市场上已被成功利用,例如Mango Markets 。这些事件凸显了衍生品预测市场固有的关键系统性风险。
法学硕士衍生品
提醒一下,永续合约的关键组成部分是:
- 标记价格,即永续合约的交易价格
- 指数价格,即永续合约所追踪的标的资产的价格
- 当标记价格偏离指数价格时,多头和空头之间交换的资金费率
- 开仓所需抵押品
例如,永续合约可以追踪预测市场上交易的“YES”代币的中间价,从而成为预测市场的衍生品。
我们建议使用大型语言模型 (LLM),而不是使用预测市场内生的信息来生成指数价格。通过将衍生品与现货市场脱钩,并利用多样化、可靠的来源,这种方法可能比传统预测市场具有更大的抗操纵能力,因为在传统预测市场中,任何参与者都可以影响价格。
LLM 可以被解释为一种将不断变化的定性公共信息商品化的机制。通过将当前的信息格局汇总为一个概率,它可以为构建可交易工具设定一个价格。以下是对此类 perp 结构的更精确描述:
- 指数价格是LLM计算出的概率的移动平均值。
- 多头押注该事件发生的可能性增加。
- 空头押注该事件发生的可能性会降低。
- 资金利率的支付取决于衍生品市场与 LLM 相比的赔率定价方式(对 LLM 隐藏了多少信息)。
最近的研究支持了 LLM 的预测能力。Halawi 等人的研究“利用语言模型实现人类水平的预测”发现,经过微调的 LLM 在某些情况下几乎可以匹敌甚至超越人类预测者对 Polymarket 事件的预测,有可能成为“超级预测者”。这表明 LLM 可以有效地充当指数价格的预言机,允许从现货市场稀少或不存在的事件中创建衍生工具。
信息聚合
LLM 充当计算代理,汇总并自动整合公开信息。相反,交易员则通过其交易活动贡献私人信息。
该系统的抗操纵能力得到了 LLM 的来源加权机制的支持。这将操纵任何单个信息源的影响限制在 LLM 为其分配的权重内。因此,单个来源相对于其他来源的权重越低,系统对针对该来源的操纵尝试的抵抗力就越强。
假设S S为 LLM 使用的所有源的集合。我们考虑一个简单的模型,其中 LLM 将其概率P P生成为来自所有源的概率的加权平均值,并且所有源都是独立的: P=\sum_{j \in S}(w_j*p_j) P = ∑ j ∈ S ( w j ∗ p j ) 。这实际上对应于来自独立数据的多个 LLM 推理的集合概率。但是,LLM 可以以不同的方式生成P P并且源可能具有依赖关系。
定理 1 (权重调整源的抗操纵性) :在上述模型下,令P P为 LLM 生成的事件概率, P_i P i为源i i被操纵时产生的概率。然后:
其中w_i w i是 LLM 分配给源i i 的权重,其中\sum w_i=1 ∑ w i = 1 。
证明
令S_{-i} S − i为除i i之外的所有源的集合。
如果源i i被操纵,新的概率P_i P i将是:P_i=w_i*p_i'+\sum_{j \in S_{-i}}(w_j*p_j)P i = w i ∗ p ′ i + ∑ j ∈ S − i ( w j ∗ p j )其中p_i' p ′ i是从源i i操纵的概率。
P P和P_i P i的区别在于:
|P-P_i|=|w_i*(p_i-p_i')|| P − P i | = | w i ∗ ( p i − p ′ i ) |p_i p i和p_i' p ′ i之间可能的最大差值为1 1 。因此,
|P-P_i| \leq w_i| P − P i | ≤ w i\黑色正方形■
该定理提供了一种可量化的抗操纵性测量方法,与 LLM 使用的源权重直接相关。假设信息源之间相互独立,该定理表明,当分配给任何单个源的权重接近于零时,基于 LLM 的预测导数对操纵的抵抗力越来越强。
推论 1 (等权重源的抗操纵性) :如果 LLM 使用至少n个等权重的独立源,则:
其中P P是 LLM 生成的事件概率, P_i P i是如果源i i被操纵则生成的事件概率。
证明
如果各源的权重相等,则w_i=\frac{1}{n} w i = 1 n对于所有的i i 。
因此,根据定理 1:
|P-P_i|\leq w_i=\frac{1}{n}| P − P i | ≤ w i = 1 n\黑色正方形■
这一推论表明,增加同等权重的信息源数量可以降低操纵任何单一信息源的影响。直观地看,随着事件接近解决,可用信息源的数量往往会增加,从而进一步增强系统对操纵的抵抗力。
基于法学硕士的预测永久债券
我们正式引入事件概率的永续合约,其中 LLM 而不是传统市场生成指数价格。
令P P为 LLM 生成的概率。因此,永久性由以下因素决定:
由于P P是概率,我们将分母乘以 $1,确保与分子的单位一致。
资金利率机制将交易价格(标记)与 LLM 生成的概率(指数)对齐,其差距直观地与 LLM 隐藏的信息量成正比。
信息聚合:信息替代品
LLM 聚合机制的另一种模型是,LLM 对接收到的单个信号执行基于共同先验的贝叶斯更新。当同时呈现所有信号时,它可以将它们聚合成一个概率估计。然后,概率P_t P t成为对最后一组信号进行最新贝叶斯更新的结果。
正式来说,LLM 估计一个共同的先验P_{LLM} P L L M 。我们将与支撑市场的二元结果相对应的变量表示为Y. Y 。当 LLM 收到n个不同的信号\{x_1, \dots, x_n\} { x 1 , … , x n } 时,它会输出价格P = P_{LLM}(Y=1|x_1, \dots, x_n) P = P L L M ( Y = 1 | x 1 , … , x n ) 。
如果两个信号在给定基本事实的情况下条件独立,则它们被视为信息替代品。这是预测市场文献中确保激励兼容性的重要条件。
这种模型可以研究单个 LLM 推理聚合多个可替代信号的情况,或对可替代信号进行连续 LLM 推理的情况。一个信号可能对应一组信息源。
定理 2 (信息替代条件下 LLM 的抗操纵性):在对信息结构进行合理假设的情况下,如果 LLM 能够获取足够数量的信息替代信号,那么试图操纵信号的恶意代理最多只能使最终价格偏离\epsilon ϵ 。
证明
该结果源于对 Srinivasan 等人的“无法验证结果的自我解决预测市场”中引理 1和定理 1的重新解释。
我们考虑一个特定的信号t t ,它被恶意代理篡改,导致信号\tilde{x_t} ~ x t被修改。LLM 还可以访问另一组信息源x_{-t} x − t ,简单地表示为x_r x r ,其中\Omega_r Ω r对应于底层信号空间的结构。LLM 将在收到真实信号x_t x t后产生价格P_{LLM}(Y=1 | x_t) P L L M ( Y = 1 | x t ) 。
我们假设代理在操作期间无法访问此信息集。如果 LLM 立即从多个来源更新(代理没有时间访问它们),或者如果我们将每个信号视为与特定时间t t相关联,则此假设成立。然后,LLM 首先接收操纵信号以及捆绑在\tilde{x_t} ~ x t中的其他公共源的信号,一段时间后,它会从非操纵源接收更新作为x_r x r 。如果源随时间快速更新,后者可能特别有趣。
根据上述引理,我们有:
E [P_{LLM}(Y=1 | x_r,\tilde{x_t}) | x_t] = P_{LLM}(Y=1 | x_t) + \Delta(\Omega_r,\tilde{x_t},x_t)E [ PLLM ( Y = 1 | xr , ~ xt ) | xt ] = PLLM ( Y = 1 | xt ) + Δ ( Ωr , ~ xt , xt ) 该方程表明,恶意代理在x_r x r下聚合其他信息源后对 LLM 价格的预期受到依赖于虚假报告\tilde{x_t} ~ x t 的误差项的影响。误差项越大,意味着价格操纵潜力越大。
定理 1表明,如果\Omega_r Ω r由信息替代品信号组成,则误差项可以随着替代品数量k k的增加而最小化。
\黑色正方形■
该定理表明,当 LLM 能够访问替代信息源时,恶意代理操纵最终价格的能力将受到极大限制。定理11具有互补价值,因为人们可以对可替代信号进行多种推断。
市场效率
这种衍生品可能实现一种新颖的效率形式,其中LLM可以快速整合公共信息,而交易活动则可以整合私人信息。
定理 3 (基于 LLM 的预测永续合约的效率) :令P_t P t为 LLM 在时刻t t生成的概率, M_t M t为永续合约在时刻t t的标记价格, I_t I t为时刻t t可获得的公开信息集。用\delta_t δ t表示对应于私人信息到来导致的标记价格跳变的 delta-Dirac 函数。然后:
- |E[P_t|I_t]-P_t|\leq \epsilon_{\text{LLM}} | E [ P t | I t ] − P t | ≤ ϵ LLM ( LLM 效率)
- 在私人信息到达之外, P_t \approx M_t P t ≈ M t (均值反转)
- 当\delta_t δ t变为正值,标记价格跳变时,经过一段松弛时间P_t后, P t也会跳变( LLM 与市场之间的反馈回路)
- 证明
LLM 效率:根据设计,LLM 处理所有可用的公共信息I_t I t以生成P_t P t 。边界\epsilon_{\text{LLM}} ϵ LLM表示此过程中的最大误差。
令f(t)=k(M_t-P_t) f ( t ) = k ( M t − P t )为时间t t 的资金利率,其中1>k>0 1 > k > 0为常数。如果M_t>P_t M t > P t ,则f(t)>0 f ( t ) > 0 ,激励交易者卖出并推低M_t M t 。如果M_t<P_t M t < P t ,则f(t)<0 f ( t ) < 0 ,激励交易者买入并推高M_t M t 。这创建了一个广义的 Ornstein-Uhlenbeck 过程:
dM_t=\alpha(P_t-M_t)dt+\sigma d W_td M t = α ( P t − M t ) d t + σ d W t其中\alpha>0 α > 0是调整速度, \sigma σ是波动率, W_t W t是维纳过程。
我们假设P_t P t是一个缓慢变化的随机变量。这是一个现实的假设,因为新闻格局不会突然改变。那么对于一个时间段[t_0,t_1] [ t 0 , t 1 ],我们有P_t(\omega) \approx P(\omega) P t ( ω ) ≈ P ( ω ) 。上面的 SDE 给出|E[M_t]-P(\omega)|=|P(\omega)-M_{t_0}|e^{-k(t-t_0)}| E [ M t ] − P ( ω ) | = | P ( ω ) − M t 0 | e − k ( t − t 0 )因此,在正常市场条件下,我们会看到指数均值反转和P_t \approx M_t P t ≈ M t 。我们还可以看到,汇总公共信息的误差界限完全取决于 LLM。
我们现在在上面的 SDE 中引入\delta_t δ t来解释私人信息:dM_t=\alpha(P_t-M_t)dt+ \eta\delta_tdt + \sigma d W_td M t = α ( P t − M t ) d t + η δ t d t + σ d W t我们假设\delta=0 δ = 0在]t(\omega), t(\omega) + \epsilon(\omega)[ ] t ( ω ) , t ( ω ) + ϵ ( ω ) [之外,其中t t和\epsilon ϵ为随机变量, \delta_t>0 δ t > 0在区间内且\int_{\mathbb{R}} \delta_t =1 ∫ R δ t = 1 。项\eta(\omega) η ( ω )是量化跳跃幅度的随机变量,它可以等于\pm \eta ± η 。由于在t^*=t(\omega) t ∗ = t ( ω )之前我们有M_t\approx P_t M t ≈ P t,因此可以合理地假设在时间\epsilon(\omega) ϵ ( ω )期间我们有:
dM_t = \eta\delta_tdt + \sigma d W_tdMt = ηδtdt + σdWt因此,平均价格涨幅为\eta η 。因此,我们可以简化假设:当t<t^* t < t ∗时, M_t= M_{t_0} M t = M t 0 ;当 t > t^* + \epsilon(\omega) t > t ∗ + ϵ ( ω )时,M_t = M_{t_0} + \eta M t = M t 0 + η ,其中t_0 < t^* t 0 < t ∗ 。为简洁起见,我们省略其余证明,但通过求解上述第二个 SDE 并对t>>t^* t > > t ∗进行渐近分析,可以发现:
M_{t_0} + \eta \approx P(\omega)[1-e^{-k(tt^*)}]M t 0 + η ≈ P ( ω ) [ 1 − e − k ( t − t ∗ ) ]因此,对于较大的t t ,我们必须有P_t \approx M_{t_0} + \eta P t ≈ M t 0 + η ,并且 LLM 必须遵循初始跳跃。
\黑色正方形■
该定理形式化了基于 LLM 的预测衍生品(所有公开信息均已计入价格)的半强有效性的新形式,将 LLM 信息处理与市场价格发现相结合。
确保进一步的稳健性
LLM 的设计必须能够抵御诸如遗漏或不一致等错误。它应该依靠可靠、不易操纵的信息来源,并努力实现最大程度的可观察性。
为了增强系统可靠性和抵抗操纵,存在更多策略:
- 经过验证的信息检索:从特定网站(例如,使用 TLSNotary)认证 LLM 的数据检索,以确保信息管道的完整性,这对于分散的 LLM 操作至关重要。
- 白名单:限制LLM的来源以确保权威性和相关性。
- 适应性检索:根据事件类型(例如体育与太空飞行)定制优先级、API 模块和白名单。
- 合约价格跟踪:实施 LLM 反馈回路,促进指数和标记价格之间的收敛,补充资金利率和价格收敛至0 0或1 1 。
- LLM 预测集成:通过组合多个预测来减少变化和不一致性。
- 包含列表机制:要求 LLM 审查特定数据,无论其内部检索决定如何。
- 基于数据模型识别:实现一个复杂的本体来对 LLM 预测进行基准测试,如本文所述。
- 多 LLM 平均:通过可能存在多个相互竞争的 LLM 的“硅谷智慧”方法,减轻 LLM 特定的偏见(例如,校准不佳、过度自信)。
- 具有 TEE 的无许可机制:LLM 权重可以预先提交,任何人都可以重新运行 LLM 来验证输出。此外,最终提示可以来自各种参与者(请参阅本文对此类机制的一般讨论)。
拓展活动范围
预测市场仍然支持非常有限的市场。像“科学”这样的庞大领域在 Polymarket 上只包含大约 30 个市场。通过生成动态价格(该价格会随着新信息的出现而更新,且无需初始资本),LLM 几乎可以支持任何市场,只要它能够获得可靠的信息来源。
正如本研究报告所指出的,通过“超级提问者”(与“超级预测者”对称的角色)有效地探索可能发生事件的空间,对于理解最重要的“存在”问题至关重要。
结束语
我们假设 LLM 在将公共信息汇总为概率方面具有一定的固有效率。我们还假设此类预测 LLM 实际上可以处于我们上面概述的操纵范围内。如果呈现给 LLM 的信息结构足够丰富,我们预计情况会如此。
在这些假设下,使用 LLM 作为指数价格构建预测市场衍生品是可能的和有效的,这一关键主张取决于上面提出的最后一个结果,该结果确保了融资利率可以推动均值回归走向真实的解决方案。第一个结果支持\epsilon_{LLM} ϵ L L M可以被选择得足够小的说法。
一般直觉是, P_t P t是聚合公共信号的代理, M_t M t是聚合公共和私人信号的代理,而资金利率会随着时间的推移推动衍生品价格朝着正确的方向发展。
基于 LLM 的预测衍生品为衍生品预测市场中的一个关键操纵风险提供了一种新颖的解决方案。通过与可能被操纵的现货市场脱钩,这种方法旨在消除开发事件概率衍生品市场的主要障碍。我们预计,这种解决方案将鼓励对预测市场衍生品进行试验,特别是在相应的现货预测市场流动性不足或不存在的情况下。
此外,这样的原语可以确保比我们目前在 Polymarket 等市场上看到的更大的市场集的效率,使我们能够访问新颖的信息聚合形式。





