【长推】Polymarket 套利圣经

Chainfeeds 导读:

差距不是运气。是数学基础设施。

文章来源:

https://x.com/MrRyanChi/status/2031292099384008810

文章作者:

Roan


观点:

Roan:预测市场中一个常见误区是「单一市场谬误」。如果只看单个市场,价格看起来往往是合理的。例如某个市场的问题是:「特朗普会赢下宾夕法尼亚州吗?」YES 价格为 0.48,NO 价格为 0.52,两者相加正好等于 1,看起来完全符合概率逻辑,没有任何套利空间。但问题在于,现实世界中的事件并不是孤立的。只要把多个相关市场放在一起,就可能暴露出定价上的逻辑矛盾。例如再看另一个市场:「共和党是否会在宾夕法尼亚州领先对手 5 个百分点以上?」这个市场的 YES 价格为 0.32,NO 价格为 0.68,同样加起来是 1,看似也没有问题。然而两者之间存在明显的逻辑依赖关系。美国总统选举是按州计算选举人票的,特朗普作为共和党候选人,如果共和党在宾夕法尼亚州领先对手 5 个百分点以上,那么特朗普不仅会赢下该州,而且是大胜。因此,共和党大胜实际上是特朗普获胜的一个子集。换句话说,如果 B 事件发生,那么 A 事件必然发生。在概率逻辑上,子集事件的概率不可能高于其母事件。如果市场给出的价格违反了这一点,就意味着存在套利空间。一个直观的类比是天气预测:明天会下雨吗和明天会有雷暴吗。雷暴一定伴随着降雨,因此雷暴发生的概率不可能高于下雨。如果市场价格出现这种不合理情况,交易者就可以同时在不同市场中买入和卖出相关头寸,从而锁定无风险利润。这种通过利用逻辑不一致获得收益的行为,就是套利。在复杂预测市场中,检测套利并不是简单的事情。理论上,如果一个市场有 n 个条件,那么所有可能的结果组合数量是 2ⁿ。这个数字在条件数量增加时会迅速膨胀。例如在 2010 年 NCAA 锦标赛市场中,一共有 63 场比赛,每场比赛只有两种结果:胜或负。这意味着所有可能的结果组合数量为 2⁶³,大约是 9.22×10¹⁸ 种,也就是超过九百亿亿种可能情况。如果试图通过暴力搜索的方法逐一检查每一种组合,即使每秒能够计算 10 亿种情况,也需要接近三百年的时间才能完成。这种计算复杂度在现实系统中完全不可接受。同样的问题也出现在政治预测市场中。例如在 2024 年美国大选相关市场中,研究团队发现存在 1576 对潜在具有依赖关系的市场。如果每个市场有 10 个条件,那么每一对市场需要检查 2²⁰(约一百万)种组合,再乘以所有市场对,计算量将迅速膨胀。因此,量化系统不会采用暴力枚举的方式,而是使用整数规划来描述合法结果。通过一组线性约束,就可以排除大量不可能出现的组合。例如在 Duke 对 Cornell 的比赛市场中,每支球队都有 7 个可能的胜场数盘口,总共 14 个条件。如果用暴力方法,需要检查 2¹⁴(16384)种组合。但实际上只需要三条约束即可描述所有合法情况:第一,每支球队的 7 个盘口中必须恰好有一个为真;第二,两队不可能同时赢 5 场以上,因为那样会在半决赛相遇。通过这种方式,复杂问题被转化为少量约束,大幅降低了计算成本。在发现套利机会之后,另一个关键问题是如何计算最优交易方案。直觉上,一个简单的做法是找到距离当前价格最近的无套利价格,然后执行对应的交易。但如果使用普通的欧几里得距离(即直线距离)来衡量价格差异,会产生严重问题。因为在预测市场中,价格实际上代表的是隐含概率,而概率变化在不同区间的意义并不相同。例如价格从 0.50 上升到 0.60,代表概率从 50% 变为 60%,这只是一个相对温和的信念更新。但如果价格从 0.05 上升到 0.15,则意味着一个几乎不可能发生的事件突然变得显著更可能,这种变化包含的信息量要大得多。欧几里得距离无法反映这种差异,它会把所有 10 美分的变化视为同样重要。因此,在使用 LMSR(对数市场评分规则)作为做市机制的预测市场中,更合理的距离度量是 Bregman 散度。在这种情况下,Bregman 散度等价于 KL 散度,它来源于信息论,用来衡量两个概率分布之间的差异。KL 散度的一个重要特性是:当价格接近 0 或 1 时,任何小的变化都会被赋予更大的权重。这与市场直觉一致,因为极端概率附近的价格变化通常意味着更强的信息冲击。

内容来源

https://chainfeeds.substack.com

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论