Bài viết này được dịch máy
Xem bản gốc
Bạn có card đồ họa 16GB? Bạn có thể chạy tất cả những ứng dụng này ngay bây giờ.
Đã thử nghiệm 4 mô hình dựa trên Qwen3.5 trên ToolCall-15 & BugFind-15:
Các mẫu:
- Qwen3.5:9b Q8 (Chính thức)
- Qwopus v3 Q8 của Jackrong
- OmniCoder-9B của Tesslate
- Qwen3.5-9b-Sushi-Coder của bigatuna
Bản tóm tắt:
- ToolCall-15: Qwopus v3 đạt điểm tuyệt đối 30/30, Sushicoder đánh bại Qwen3.5 cơ bản.
- BugFind-15: Omnicoder đã lật ngược Script và giành vị trí số 1 với 83%
Không có mô hình nào giành chiến thắng cả hai giải, đó mới là điều thú vị.
Cộng đồng mã nguồn mở đang hoạt động rất tích cực.
Ý tưởng này được lấy cảm hứng từ @leftcurvedev_ — cảm ơn vì ý tưởng, đây quả là một bài kiểm tra thú vị!
Ảnh chụp màn hình kết quả




Khu vực:
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan




