本文為機器翻譯
展示原文

我們能否讓 Claude Opus 4.5 更上一層樓? Anthropic/Claude 表示,借助技能庫,這是完全可能的。 因此,我為 @vibeshipco Spawner 建立了一個技能庫,但格式更加完善。 現在,在某些技能方面,它已經大幅超越了原版 Claude Opus 4.5。 例如,這是後端錯誤處理技能。此技能由 5 位語言大師 (LLM) 進行基準測試和評審。 結論: - Vibeship 技能庫以 +34.9 分的優勢勝出 - 原版 Claude Opus 4.5 平均分為 59.5/100 - Vibeship 技能庫版 Claude Opus 4.5 平均分為 94.4/100 我們正在逐步改進所有技能。 Opus 4.5 已經令人驚艷,但我認為我們還可以更進一步。 我會在本帖中分享更多基準測試結果。

來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論