逻辑推理模型(LLM)在创作原创笑话方面表现不佳,但它们通常至少能够解释某些笑话的笑话所在。我最近在研究一个笑话资料集时,注意到其中一个笑话LLM几乎完全无法理解。这个笑话本身并不特别有趣或巧妙,但它非常依赖良好的心智理论。在一次运行中, Gemini Pro成功理解了这个笑话,但也是唯一一个。 GPT 5.4 Pro、Opus 4.6和Grok都始终无法理解它。
本文为机器翻译
展示原文




来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享





