Phiên bản AI Mistral mới ra mắt: Một ChatGPT và Claude đáng giá với chi phí chỉ bằng một phần nhỏ

avatar
Decrypt
05-09
Bài viết này được dịch máy
Xem bản gốc

Mistral Trung bình 3 được phát hành hôm qua, định vị mô hình như một thách thức trực tiếp đối với kinh tế triển khai AI doanh nghiệp.

Startup có trụ sở tại Paris, được thành lập năm 2023 bởi các nhà nghiên cứu Google DeepMind và Meta AI, đã phát hành mô hình mà họ cho là mang lại hiệu suất tiên phong với chi phí vận hành chỉ bằng một phần tám so với các mô hình tương tự.

"Mistral Trung bình 3 mang lại hiệu suất tiên phong trong khi chi phí thấp hơn một bậc," công ty đã nói.

Mô hình này đại diện cho sản phẩm độc quyền mạnh nhất của Mistral AI cho đến nay, phân biệt với danh mục mã nguồn mở bao gồm Mistral 7B, Mixtral, Codestral và Pixtral.

Với mức giá 0,4 đô la cho mỗi triệu token đầu vào và 2 đô la cho mỗi triệu token đầu ra, Trung bình 3 giảm đáng kể chi phí so với các đối thủ cạnh tranh trong khi vẫn duy trì hiệu suất ngang bằng. Đánh giá độc lập của Artificial Analysis đã xếp mô hình "trong số các mô hình phi suy luận hàng đầu với Trung bình 3 cạnh tranh với Llama 4 Maverick, Gemini 2.0 Flash và Claude 3.7 Sonnet."

Mô hình đặc biệt xuất sắc trong các lĩnh vực chuyên nghiệp.

Đánh giá của con người đã chứng minh hiệu suất vượt trội trong các nhiệm vụ mã hóa, với Sophia Yang, đại diện Mistral AI, nhận xét rằng "Mistral Trung bình 3 nổi bật trong lĩnh vực mã hóa và mang lại hiệu suất tốt hơn nhiều so với các đối thủ lớn hơn."

Kết quả benchmark cho thấy Trung bình 3 hoạt động ngang bằng hoặc tốt hơn Claude Sonnet 3.7 của Anthropic trên các danh mục thử nghiệm đa dạng, đồng thời vượt trội hơn đáng kể so với Llama 4 Maverick của Meta và Command A của Cohere trong các lĩnh vực chuyên biệt như mã hóa và suy luận.

Cửa sổ ngữ cảnh 128.000 token của mô hình là tiêu chuẩn, và tính đa phương thức cho phép xử lý tài liệu và đầu vào hình ảnh trên 40 ngôn ngữ.

Nhưng không giống như các mô hình đã làm nên danh tiếng Mistral, người dùng sẽ không thể sửa đổi hoặc chạy nó cục bộ.

Hiện tại, nguồn tốt nhất cho những người nhiệt tình với mã nguồn mở là Mixtral-8x22B-v0.3, một mô hình hỗn hợp chuyên gia chạy 8 chuyên gia với 22 tỷ tham số mỗi cái. Ngoài Mixtral, công ty có hơn một tá mô hình mã nguồn mở khác.

Nó ban đầu chỉ khả dụng cho triển khai doanh nghiệp chứ không phải sử dụng trong nước thông qua LeChat - giao diện chatbot của Mistral. Mistral AI nhấn mạnh khả năng thích ứng doanh nghiệp của mô hình, hỗ trợ đào tạo trước liên tục, tinh chỉnh đầy đủ và tích hợp vào các cơ sở kiến thức doanh nghiệp cho các ứng dụng chuyên ngành.

Khách hàng beta trên các lĩnh vực dịch vụ tài chính, năng lượng và chăm sóc sức khỏe đang thử nghiệm mô hình để nâng cao dịch vụ khách hàng, cá nhân hóa quy trình kinh doanh và phân tích tập dữ liệu phức tạp.

API sẽ được ra mắt ngay lập tức trên Mistral La Plateforme và Amazon Sagemaker, với kế hoạch tích hợp sắp tới cho IBM WatsonX, NVIDIA NIM, Azure AI Foundry và Google Cloud Vertex.

Thông báo này đã gây ra cuộc thảo luận đáng kể trên các nền tảng truyền thông xã hội, với các nhà nghiên cứu AI khen ngợi bước đột phá về hiệu quả chi phí đồng thời lưu ý tính chất độc quyền như một hạn chế tiềm năng.

Trạng thái mã nguồn đóng của mô hình đánh dấu sự khác biệt so với các sản phẩm trọng lượng mở của Mistral, mặc dù công ty đã gợi ý về các bản phát hành trong tương lai.

"Với việc ra mắt Mistral Small vào tháng 3 và Mistral Trung bình hôm nay, không phải là bí mật rằng chúng tôi đang làm việc trên một thứ 'lớn' trong vài tuần tới," Sophia Yang, Trưởng bộ phận Quan hệ Nhà phát triển của Mistral, đã úp mở trong thông báo. "Với mô hình kích thước trung bình của chúng tôi đã tốt hơn rõ rệt so với các mô hình mã nguồn mở hàng đầu như Llama 4 Maverick, chúng tôi rất háo hức để 'mở' những gì sắp tới."

Mistral có xu hướng ảo giác ít hơn so với mô hình trung bình, đó là tin tức tuyệt vời xét về kích thước của nó.

Nó tốt hơn Meta Llama-4 Maverick, Deepseek V3 và Amazon Nova Pro, để kể tên một vài mô hình. Hiện tại, mô hình có ít ảo giác nhất là Gemini 2.5 Pro mới được Google ra mắt.

Bản phát hành này diễn ra giữa sự tăng trưởng kinh doanh ấn tượng của công ty có trụ sở tại Paris bất chấp việc im lặng kể từ khi phát hành Mistral Large 2 vào năm ngoái.

Mistral gần đây đã ra mắt phiên bản doanh nghiệp của chatbot Le Chat tích hợp với Microsoft SharePoint và Google Drive, với CEO Arthur Mensch nói với Reuters rằng họ đã "tăng gấp ba lần kinh doanh trong 100 ngày qua, đặc biệt là ở Châu Âu và ngoài Hoa Kỳ."

Công ty, hiện được định giá 6 tỷ đô la, đang thể hiện sự độc lập công nghệ của mình bằng cách vận hành cơ sở hạ tầng tính toán riêng và giảm sự phụ thuộc vào các nhà cung cấp đám mây Hoa Kỳ - một động thái chiến lược phù hợp ở Châu Âu giữa mối quan hệ căng thẳng sau các mức thuế của Tổng thống Trump đối với các sản phẩm công nghệ.

Liệu tuyên bố của Mistral về việc đạt được hiệu suất cấp doanh nghiệp với mức giá thân thiện với người tiêu dùng có được chứng minh trong việc triển khai thực tế hay không vẫn còn phải chờ xem.

Nhưng hiện tại, Mistral đã định vị Trung bình 3 như một điểm trung gian hấp dẫn trong một ngành công nghiệp thường cho rằng lớn hơn (và đắt hơn) đồng nghĩa với tốt hơn.

Được biên tập bởi Josh Quittner và Sebastian Sinclair

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận