【长推】Polymarket 套利圣经

Chainfeeds

Chainfeeds 导读：

差距不是运气。是数学基础设施。

文章来源：

https://x.com/MrRyanChi/status/2031292099384008810

文章作者：

Roan

观点：

Roan：预测市场中一个常见误区是「单一市场谬误」。如果只看单个市场，价格看起来往往是合理的。例如某个市场的问题是：「特朗普会赢下宾夕法尼亚州吗？」YES 价格为 0.48，NO 价格为 0.52，两者相加正好等于 1，看起来完全符合概率逻辑，没有任何套利空间。但问题在于，现实世界中的事件并不是孤立的。只要把多个相关市场放在一起，就可能暴露出定价上的逻辑矛盾。例如再看另一个市场：「共和党是否会在宾夕法尼亚州领先对手 5 个百分点以上？」这个市场的 YES 价格为 0.32，NO 价格为 0.68，同样加起来是 1，看似也没有问题。然而两者之间存在明显的逻辑依赖关系。美国总统选举是按州计算选举人票的，特朗普作为共和党候选人，如果共和党在宾夕法尼亚州领先对手 5 个百分点以上，那么特朗普不仅会赢下该州，而且是大胜。因此，共和党大胜实际上是特朗普获胜的一个子集。换句话说，如果 B 事件发生，那么 A 事件必然发生。在概率逻辑上，子集事件的概率不可能高于其母事件。如果市场给出的价格违反了这一点，就意味着存在套利空间。一个直观的类比是天气预测：明天会下雨吗和明天会有雷暴吗。雷暴一定伴随着降雨，因此雷暴发生的概率不可能高于下雨。如果市场价格出现这种不合理情况，交易者就可以同时在不同市场中买入和卖出相关头寸，从而锁定无风险利润。这种通过利用逻辑不一致获得收益的行为，就是套利。在复杂预测市场中，检测套利并不是简单的事情。理论上，如果一个市场有 n 个条件，那么所有可能的结果组合数量是 2ⁿ。这个数字在条件数量增加时会迅速膨胀。例如在 2010 年 NCAA 锦标赛市场中，一共有 63 场比赛，每场比赛只有两种结果：胜或负。这意味着所有可能的结果组合数量为 2⁶³，大约是 9.22×10¹⁸ 种，也就是超过九百亿亿种可能情况。如果试图通过暴力搜索的方法逐一检查每一种组合，即使每秒能够计算 10 亿种情况，也需要接近三百年的时间才能完成。这种计算复杂度在现实系统中完全不可接受。同样的问题也出现在政治预测市场中。例如在 2024 年美国大选相关市场中，研究团队发现存在 1576 对潜在具有依赖关系的市场。如果每个市场有 10 个条件，那么每一对市场需要检查 2²⁰（约一百万）种组合，再乘以所有市场对，计算量将迅速膨胀。因此，量化系统不会采用暴力枚举的方式，而是使用整数规划来描述合法结果。通过一组线性约束，就可以排除大量不可能出现的组合。例如在 Duke 对 Cornell 的比赛市场中，每支球队都有 7 个可能的胜场数盘口，总共 14 个条件。如果用暴力方法，需要检查 2¹⁴（16384）种组合。但实际上只需要三条约束即可描述所有合法情况：第一，每支球队的 7 个盘口中必须恰好有一个为真；第二，两队不可能同时赢 5 场以上，因为那样会在半决赛相遇。通过这种方式，复杂问题被转化为少量约束，大幅降低了计算成本。在发现套利机会之后，另一个关键问题是如何计算最优交易方案。直觉上，一个简单的做法是找到距离当前价格最近的无套利价格，然后执行对应的交易。但如果使用普通的欧几里得距离（即直线距离）来衡量价格差异，会产生严重问题。因为在预测市场中，价格实际上代表的是隐含概率，而概率变化在不同区间的意义并不相同。例如价格从 0.50 上升到 0.60，代表概率从 50% 变为 60%，这只是一个相对温和的信念更新。但如果价格从 0.05 上升到 0.15，则意味着一个几乎不可能发生的事件突然变得显著更可能，这种变化包含的信息量要大得多。欧几里得距离无法反映这种差异，它会把所有 10 美分的变化视为同样重要。因此，在使用 LMSR（对数市场评分规则）作为做市机制的预测市场中，更合理的距离度量是 Bregman 散度。在这种情况下，Bregman 散度等价于 KL 散度，它来源于信息论，用来衡量两个概率分布之间的差异。KL 散度的一个重要特性是：当价格接近 0 或 1 时，任何小的变化都会被赋予更大的权重。这与市场直觉一致，因为极端概率附近的价格变化通常意味着更强的信息冲击。

内容来源

来源

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢