Bài viết này được dịch máy
Xem bản gốc

Liệu chúng ta có thể làm cho Claude Opus 4.5 tốt hơn nữa không? Anthropic/Claude đã nói rằng với Skills, điều này là khả thi. Vì vậy, tôi đã xây dựng một thư viện Skills cho @vibeshipco Spawner, nhưng ở định dạng tinh vi hơn nhiều. Hiện tại, nó vượt trội hơn hẳn so với Claude Opus 4.5 thông thường ở một số kỹ năng nhất định. Ví dụ, đây là kỹ năng xử lý lỗi ở phần backend. Được đánh giá và chấm điểm bởi 5 chuyên gia LLM. Kết quả: - Vibeship Skills thắng với +34,9 điểm - Claude Opus 4.5 thông thường = 59,5/100 điểm trung bình - Vibeship Skill Claude Opus 4.5 = 94,4/100 điểm trung bình Tôi đang nỗ lực cải thiện từng bước một. Mọi người đã rất ngạc nhiên với Opus 4.5, nhưng tôi nghĩ chúng ta có thể đưa nó tiến xa hơn nữa. Tôi sẽ chia sẻ thêm kết quả đánh giá trên diễn đàn này.

Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận