本文为机器翻译
展示原文

Grok 4.20 Beta 在电信领域 𝜏²-Bench 测试中排名第二(代理工具使用),准确率达到 97%。 它在性能上优于 Claude Opus 4.6(max)、GPT-5.4(xhigh) 和Gemini 3.1 Pro,同时在智能体工作流程方面也接近GLM-5 的领先水平。 工具调用是人工智能体的核心所在,而这正是 Grok 4.20 的强项。 它采用最先进的智能技术,可瞬间启动,使其成为业内每秒代币处理速度最快的设备。

来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论