不受欢迎的观点:Claude Opus 4.6 并非“最佳程式设计LLM” (GPT-5、 Gemini 3 Pro 或其他任何软体也都不是) 「哪种模型最好?」的争论已经彻底失败了。 因为真正的答案是:全部。 ↳ Gemini 3 Flash 用于样板程式码(比 Opus 便宜 96%) ↳ Claude Sonnet 4.5 适合日常编码(平衡 + 快速) ↳ Opus 4.6 用于生产环境 bug(SWE-bench 之王) ↳ GPT-5.3-Codex for CI bots (Terminal-Bench beast) ↳ DeepSeek V3,预算有限时的理想选择(超高的性价比) Opus 4.6 版本两天前刚发布,对终端代理进行了大幅改进。 但如果你什么都用它,你的耗电量就是正常耗电量的 20 倍。 我花了一些时间分析了 SWE-bench Verified、Terminal-Bench 2.0、定价以及各大型号的速度。 结果如何?一种既能节省 75% 的成本,又能提高产出品质的路线规划策略。 包含决策树和图表的完整指南: linkedin.com/pulse/which-llm-s...… 别再问“哪个最好?”,而应该问“哪个最适合这项任务?” #TechLeadership #AIEngineering #ClaudeOpus #LLMs #DevTools
本文为机器翻译
展示原文
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享



