Dipesh的想法

02-07

本文為機器翻譯

展示原文

不受歡迎的觀點：Claude Opus 4.6 並非“最佳程式設計LLM” （GPT-5、 Gemini 3 Pro 或其他任何軟體也都不是）「哪種模型最好？」的爭論已經徹底失敗了。因為真正的答案是：全部。 ↳ Gemini 3 Flash 用於樣板程式碼（比 Opus 便宜 96%） ↳ Claude Sonnet 4.5 適合日常編碼（平衡 + 快速） ↳ Opus 4.6 用於生產環境 bug（SWE-bench 之王） ↳ GPT-5.3-Codex for CI bots (Terminal-Bench beast) ↳ DeepSeek V3，預算有限時的理想選擇（超高的性價比） Opus 4.6 版本兩天前剛發布，對終端代理進行了大幅改進。但如果你什麼都用它，你的耗電量就是正常耗電量的 20 倍。我花了一些時間分析了 SWE-bench Verified、Terminal-Bench 2.0、定價以及各大型號的速度。結果如何？一種既能節省 75% 的成本，又能提高產出品質的路線規劃策略。包含決策樹和圖表的完整指南： linkedin.com/pulse/which-llm-s...… 別再問“哪個最好？”，而應該問“哪個最適合這項任務？” #TechLeadership #AIEngineering #ClaudeOpus #LLMs #DevTools

來自推特

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論