Dipesh的想法

02-07

本文为机器翻译

展示原文

不受欢迎的观点：Claude Opus 4.6 并非“最佳程式设计LLM” （GPT-5、 Gemini 3 Pro 或其他任何软体也都不是）「哪种模型最好？」的争论已经彻底失败了。因为真正的答案是：全部。 ↳ Gemini 3 Flash 用于样板程式码（比 Opus 便宜 96%） ↳ Claude Sonnet 4.5 适合日常编码（平衡 + 快速） ↳ Opus 4.6 用于生产环境 bug（SWE-bench 之王） ↳ GPT-5.3-Codex for CI bots (Terminal-Bench beast) ↳ DeepSeek V3，预算有限时的理想选择（超高的性价比） Opus 4.6 版本两天前刚发布，对终端代理进行了大幅改进。但如果你什么都用它，你的耗电量就是正常耗电量的 20 倍。我花了一些时间分析了 SWE-bench Verified、Terminal-Bench 2.0、定价以及各大型号的速度。结果如何？一种既能节省 75% 的成本，又能提高产出品质的路线规划策略。包含决策树和图表的完整指南： linkedin.com/pulse/which-llm-s...… 别再问“哪个最好？”，而应该问“哪个最适合这项任务？” #TechLeadership #AIEngineering #ClaudeOpus #LLMs #DevTools