本文為機器翻譯
展示原文

Grok 4.20 Beta 在電信領域 𝜏²-Bench 測試中排名第二(代理工具使用),準確率達到 97%。 它在性能上優於 Claude Opus 4.6(max)、GPT-5.4(xhigh) 和Gemini 3.1 Pro,同時在智能體工作流程方面也接近GLM-5 的領先水平。 工具調用是人工智能體的核心所在,而這正是 Grok 4.20 的強項。 它採用最先進的智能技術,可瞬間啟動,使其成為業內每秒代幣處理速度最快的設備。

來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論