我们能否让 Claude Opus 4.5 更上一层楼? Anthropic/Claude 表示,借助技能库,这是完全可能的。 因此,我为 @vibeshipco Spawner 建立了一个技能库,但格式更加完善。 现在,在某些技能方面,它已经大幅超越了原版 Claude Opus 4.5。 例如,这是后端错误处理技能。此技能由 5 位语言大师 (LLM) 进行基准测试和评审。 结论: - Vibeship 技能库以 +34.9 分的优势胜出 - 原版 Claude Opus 4.5 平均分为 59.5/100 - Vibeship 技能库版 Claude Opus 4.5 平均分为 94.4/100 我们正在逐步改进所有技能。 Opus 4.5 已经令人惊艳,但我认为我们还可以更进一步。 我会在本帖中分享更多基准测试结果。
本文为机器翻译
展示原文

来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享



