Bài viết này được dịch máy
Xem bản gốc
Gemma4 vừa ra mắt. Nó xử lý các lệnh công cụ như thế nào?
Tôi đã chạy ToolCall-15 trên toàn bộ các dòng Gemma4.
Gemma4 31b = Qwen3.5 27b. Cả hai đều đạt điểm tuyệt đối 15/15.
Nhưng điều đáng ngạc nhiên là:
Qwen3.5 9b đã đạt 13/15, trong khi Gemma4 cần 26b để đạt được con số đó.
Kết quả và so sánh (Gemma4 & Qwen3.5)



Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan




