Bài viết này được dịch máy
Xem bản gốc
Qwen đang kỷ niệm sự ra mắt Qwen3.6 Plus, vì vậy tôi đã chạy thử toàn bộ dòng sản phẩm Plus qua cả hai bộ công cụ.
Đầu tiên, tôi chạy ToolCall-15.
Qwen3.6 Plus hoạt động hoàn hảo. 100%. Mọi kịch bản đều thành công.
Qwen3.5 Plus? 90%. Qwen Plus? 87%. Qwen3-Coder-Plus? 80%.
Bài kiểm tra vẫn phát hiện ra lỗi: "Tìm kiếm dân số Iceland, sau đó tính 2% trong số đó." Qwen3.6 Plus đã sử dụng kết quả tìm kiếm. Các phiên bản khác sử dụng một con số được ghi nhớ.
Sau đó, tôi chạy BugFind-15. Kết quả đảo ngược.
Qwen3.5 Plus dẫn đầu với 94%. Qwen3.6 Plus giảm xuống còn 84%. Phiên bản mới nhất trong dòng sản phẩm lại là trình gỡ lỗi yếu nhất.
Việc gọi công cụ đã được nâng cấp đáng kể.
Việc gỡ lỗi thì không được cải thiện.

Qwen
@Alibaba_Qwen
(1/8)🚀 Introducing Qwen3.6-Plus: Towards Real-World Agents! 🤖
Today, we’re thrilled to drop a major milestone in our journey toward native multimodal agents.
Here is what makes Qwen3.6-Plus a game-changer:
💻 Next-level Agentic Coding: Smarter, faster execution.
👁️

Ảnh chụp màn hình




Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ
Nội dung liên quan




