本文为机器翻译
展示原文

@logic_int 刚刚用 PutnamBench 测试了一下!这对数学领域的影响是深远的,但我更兴奋的是像 Aleph 这样的智能体凭借其独特的能力,能在更广泛的代码生成领域带来哪些突破。关于这一点,稍后会有更多内容……

Logical Intelligence
@logic_int
01-12
Our Aleph agent, powered by @OpenAI 's GPT‑5.2, scored 668/672, 99.4% w/hyper-efficiency on @gtsoukal et al.'s PutnamBench (the hardest formal math benchmark) a critical step in natural language automated code generation — English as programming — with hallucination-free results
相关赛道:
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论