이 기사는 기계로 번역되었습니다
원문 표시

Claude Opus 4.5를 더욱 개선할 수 있을까요? Anthropic/Claude는 스킬 기능을 통해 이것이 가능하다고 했습니다. 그래서 저는 @vibeshipco Spawner를 위한 스킬 라이브러리를 훨씬 더 정교한 형태로 개발했습니다. 이제 특정 스킬에서 일반 Claude Opus 4.5를 큰 차이로 앞서고 있습니다. 예를 들어 백엔드 오류 처리 스킬을 살펴보겠습니다. 5명의 LLM이 벤치마킹 및 평가를 진행했습니다. 결과는 다음과 같습니다. - Vibeship Skills, 34.9점 차이로 승리 - 일반 Claude Opus 4.5 = 평균 59.5/100점 - Vibeship Skill Claude Opus 4.5 = 평균 94.4/100점 모든 스킬을 단계적으로 개선해 나가고 있습니다. 이미 많은 사람들이 Opus 4.5에 감탄하고 있지만, 저는 여기서 더 나아갈 수 있다고 생각합니다. 더 자세한 벤치마킹 결과는 이 스레드에 공유하겠습니다.

Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트