DeepSeek V3-0324 đứng đầu các mô hình AI không có lý luận trong mã nguồn mở đầu tiên

avatar
AI News
03-25
Bài viết này được dịch máy
Xem bản gốc

DeepSeek V3-0324 đã trở thành mô hình không suy luận có điểm số cao nhất trên Chỉ số Trí tuệ Nhân tạo trong một thành tựu đáng chú ý cho AI nguồn mở.

Mô hình mới đã tiến bộ bảy điểm trong tiêu chuẩn để vượt qua các đối thủ độc quyền như Gemini 2.0 Pro của Google, Claude 3.7 Sonnet của Anthropic và Llama 3.3 70B của Meta.

Mặc dù V3-0324 thua các mô hình suy luận, bao gồm cả R1 của chính DeepSeek và các sản phẩm từ OpenAI và Alibaba, nhưng thành tựu này nhấn mạnh tính khả thi ngày càng tăng của các giải pháp nguồn mở trong các ứng dụng nhạy cảm với độ trễ nơi các phản hồi ngay lập tức là rất quan trọng.

DeepSeek V3-0324 đại diện cho một kỷ nguyên mới của AI nguồn mở

Các mô hình không suy luận - những mô hình tạo ra câu trả lời ngay lập tức mà không cần các giai đoạn "suy nghĩ" - là rất quan trọng cho các trường hợp sử dụng thời gian thực như chatbot, tự động hóa dịch vụ khách hàng và dịch thuật trực tiếp. Phiên bản mới nhất của DeepSeek hiện đã đặt ra tiêu chuẩn cho các ứng dụng này, vượt qua cả các công cụ độc quyền hàng đầu.

Kết quả đánh giá của DeepSeek V3-0324 trong Chỉ số Trí tuệ Nhân tạo cho thấy một thành tựu đáng chú ý cho các mô hình AI nguồn mở không suy luận.

"Đây là lần đầu tiên một mô hình trọng số mở trở thành mô hình không suy luận hàng đầu, một cột mốc cho nguồn mở," Artificial Analysis tuyên bố. Hiệu suất của mô hình đưa nó đến gần hơn với các mô hình suy luận độc quyền, mặc dù những mô hình này vẫn vượt trội hơn cho các nhiệm vụ yêu cầu giải quyết vấn đề phức tạp.

DeepSeek V3-0324 giữ hầu hết các thông số từ phiên bản tiền nhiệm tháng 12/2024, bao gồm:

  • Cửa sổ ngữ cảnh 128k (giới hạn 64k qua API của DeepSeek)
  • Tổng 671 tỷ tham số, yêu cầu hơn 700GB bộ nhớ GPU cho độ chính xác FP8
  • 37 tỷ tham số hoạt động
  • Chức năng văn bản (không hỗ trợ đa phương thức)
  • Giấy phép MIT

"Vẫn chưa phải thứ bạn có thể chạy ở nhà!" Artificial Analysis nhận xét, nhấn mạnh các yêu cầu cơ sở hạ tầng cấp doanh nghiệp của nó.

AI nguồn mở đang mang lại sự nóng bỏng

Trong khi các mô hình suy luận độc quyền như DeepSeek R1 vẫn duy trì sự thống trị trong Chỉ số Trí tuệ rộng hơn, khoảng cách đang thu hẹp.

Ba tháng trước, DeepSeek V3 gần như sánh kịp các mô hình độc quyền của Anthropic và Google nhưng không vượt qua được. Ngày nay, phiên bản V3-0324 được cập nhật không chỉ dẫn đầu các giải pháp nguồn mở mà còn vượt trội hơn tất cả các đối thủ không suy luận độc quyền.

"Bản phát hành này thậm chí còn ấn tượng hơn cả R1," Artificial Analysis nói.

Sự tiến bộ của DeepSeek báo hiệu một sự chuyển dịch trong lĩnh vực AI, nơi các khung nguồn mở ngày càng cạnh tranh với các hệ thống đóng. Đối với các nhà phát triển và doanh nghiệp, V3-0324 được cấp phép MIT cung cấp một công cụ mạnh mẽ, linh hoạt - mặc dù chi phí tính toán của nó có thể hạn chế khả năng tiếp cận.

"DeepSeek hiện đang dẫn đầu biên giới của các mô hình trọng số mở không suy luận," Artificial Analysis tuyên bố.

Với R2 trong tầm nhìn, cộng đồng đang chờ đợi một bước nhảy tiềm năng khác trong hiệu suất AI.

(Ảnh bởi Paul Hanaoka)

Xem thêm: Hugging Face kêu gọi tập trung vào nguồn mở trong Kế hoạch Hành động AI

Bạn muốn tìm hiểu thêm về AI và big data từ các nhà lãnh đạo ngành? Hãy xem Triển lãm AI & Big Data diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được đồng tổ chức với các sự kiện hàng đầu khác bao gồm Hội nghị Tự động Thông minh, BlockX, Tuần Chuyển đổi Số và Triển lãm An ninh Mạng & Đám mây.

Khám phá các sự kiện và hội thảo công nghệ doanh nghiệp sắp tới do TechForge cung cấp tại đây.

Bài viết DeepSeek V3-0324 dẫn đầu các mô hình AI không suy luận trong lần đầu tiên nguồn mở ban đầu xuất hiện trên Tin tức AI.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận