Qwen phát hành mô hình đa phương thức Qwen2.5-VL-32B, với hiệu suất vượt qua với mô hình lớn 72B

avatar
PANews
03-25
Bài viết này được dịch máy
Xem bản gốc

Theo thông báo từ đội ngũ Qwen vào ngày 25 tháng 3, mô hình Qwen2.5-VL-32B-Instruct đã chính thức được mã nguồn mở, có quy mô tham số 32B, thể hiện hiệu suất xuất sắc trong các nhiệm vụ như hiểu hình ảnh, suy luận toán học và tạo văn bản. Mô hình này được tối ưu hóa thêm thông qua học tập tăng cường, trả lời phù hợp hơn với sở thích con người, và đã vượt qua mô hình 72B được phát hành trước đó trong các bài đánh giá đa phương thức như MMMU, MathVista. So với các mô hình sê-ri Qwen2.5-VL trước đây, mô hình 32B có những cải tiến sau: trả lời phù hợp hơn với sở thích chủ quan của con người: điều chỉnh phong cách đầu ra, làm cho câu trả lời chi tiết hơn, có định dạng quy phạm hơn và phù hợp hơn với sở thích con người. Khả năng suy luận toán học: độ chính xác trong việc giải quyết các vấn đề toán học phức tạp được cải thiện đáng kể. Khả năng hiểu và suy luận chi tiết hình ảnh: thể hiện độ chính xác và khả năng phân tích chi tiết mạnh hơn trong các nhiệm vụ như phân tích hình ảnh, nhận dạng nội dung và suy luận logic hình ảnh.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
1
Thêm vào Yêu thích
Bình luận
Followin logo