
Theo thông báo từ đội ngũ Qwen vào ngày 25 tháng 3, mô hình Qwen2.5-VL-32B-Instruct đã chính thức được mã nguồn mở, có quy mô tham số 32B, thể hiện hiệu suất xuất sắc trong các nhiệm vụ như hiểu hình ảnh, suy luận toán học và tạo văn bản. Mô hình này được tối ưu hóa thêm thông qua học tập tăng cường, trả lời phù hợp hơn với sở thích con người, và đã vượt qua mô hình 72B được phát hành trước đó trong các bài đánh giá đa phương thức như MMMU, MathVista. So với các mô hình sê-ri Qwen2.5-VL trước đây, mô hình 32B có những cải tiến sau: trả lời phù hợp hơn với sở thích chủ quan của con người: điều chỉnh phong cách đầu ra, làm cho câu trả lời chi tiết hơn, có định dạng quy phạm hơn và phù hợp hơn với sở thích con người. Khả năng suy luận toán học: độ chính xác trong việc giải quyết các vấn đề toán học phức tạp được cải thiện đáng kể. Khả năng hiểu và suy luận chi tiết hình ảnh: thể hiện độ chính xác và khả năng phân tích chi tiết mạnh hơn trong các nhiệm vụ như phân tích hình ảnh, nhận dạng nội dung và suy luận logic hình ảnh.





