本文為機器翻譯
展示原文

@logic_int 剛剛用 PutnamBench 測試了一下!這對數學領域的影響是深遠的,但我更興奮的是像 Aleph 這樣的智能體憑藉其獨特的能力,能在更廣泛的代碼生成領域帶來哪些突破。關於這一點,稍後會有更多內容……

Logical Intelligence
@logic_int
01-12
Our Aleph agent, powered by @OpenAI 's GPT‑5.2, scored 668/672, 99.4% w/hyper-efficiency on @gtsoukal et al.'s PutnamBench (the hardest formal math benchmark) a critical step in natural language automated code generation — English as programming — with hallucination-free results
相关赛道:
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論