在埃隆·马斯克在7月9日发布Grok 4的演示中,有一个令人印象深刻的演示是让人工智能预测今年晚些时候哪支队伍将赢得美国职棒大联盟世界大赛。
经过4.5分钟的数据分析,使用了Polymarket的数据,这是一个基于以太坊的预测市场平台,并运用xAI所称的"重度"推理能力,Grok 4给出了结论:洛杉矶道奇队最有可能赢得2025年世界大赛。Grok给洛杉矶队21.6%的获胜几率,高于其他任何队伍,但同时也指出他们可能被高估。
Grok的预测与其他主要平台的预测基本一致,包括ESPN BET,在MLB赛季即将迎来全明星赛休赛期时,道奇队的赔率为+225。底特律老虎队(+750)在美联中央赛区遥遥领先,以59-35的战绩成为一匹黑马。
X平台上的交易者对拥有一个个人"Grok预言家"感到兴奋,并称这些结果为"无限金钱漏洞"。
但我们想知道:其他主要人工智能模型是否与Grok的预测一致?
事实证明,并不完全一致。
ChatGPT的o3模型给道奇队26%的获胜几率,同时也标记他们被高估。该模型认为底特律队提供了最佳价值,以16%的获胜概率对抗市场赔率暗示的仅为12.5%。其推理中心是老虎队王牌投手塔里克·斯库巴尔的主导地位和球队联盟最佳的投球阵容。
DeepSeek进一步支持洛杉矶,给出23%的概率,但指出道奇队可能正在乘着过多的积极情绪。尽管倾向于洛杉矶获胜,但该模型表示更愿意押注费城,因为风险回报比更具吸引力。
由于我们很穷,而且我们的雇主不太可能为了一个问题批准Grok 4 Heavy的300美元订阅,我们询问了30美元套餐可用的轻量版Grok 4。有趣的是,它给底特律队比道奇队略微领先——两队赔率相差不到一个百分点。
三个模型都标记了类似的因素:底特律精英投球轮换、道奇队的伤病问题,以及历史模式表明市场高估了卫冕冠军。
虽然Grok 4的"重度"推理令人印象深刻,但你不需要每月300美元的计划来获得可靠的预测。通过巧妙的提示,即使是基本模型也能提供敏锐的洞察。我们发现成功的提示至少需要以下三个主要元素:
首先,角色扮演。告诉模型它应该是谁,以及应该如何行动。尝试这样说:"你是一位具有深厚贝叶斯预测和风险管理知识的预测市场分析师。"
其次,方法论:告诉模型你想要什么,以及为了成功应遵循哪些步骤。要求模型从多个来源收集当前赔率,将其与分析预测进行比较,并识别价值赌注。当模型能够将市场共识与自身计算进行比较时,表现会更好。
这就是提示工程师所说的思维链——如果模型确切知道要做什么,它就能提供更好的结果。不知道如何指导?可以单独询问模型完成任务所需的步骤。
第三,指向分析资源。提及棒球参考文献模拟或FanGraphs预测有助于将预测建立在既定框架上,而不是纯粹的推测。
对于有兴趣自己尝试的人,我们构建了一个自定义GPT,复制了xAI用Grok 4展示的内容。这只是一个有趣的实验,但它通过自然对话收集赔率、分析球队表现并识别潜在的投注价值。
我们还将预测市场提示上传到了GitHub,如果你想使用自己的聊天机器人进行实验。
自然要谨慎使用。我们不是财务顾问,这些人工智能也不是。如果你输了,别怪我们——但如果它帮你赢得大奖,我们也不会拒绝一杯啤酒。




