MiniMax M2.1 cung cấp khả năng lập trình đa ngôn ngữ nâng cao cho các ứng dụng thực tế phức tạp.

Bài viết này được dịch máy
Xem bản gốc
MiniMax ra mắt mẫu M2.1 với khả năng phát triển đa ngôn ngữ và toàn diện tiên tiến.

Công ty phát triển trí tuệ nhân tạo Trung Quốc MiniMax đã thông báo về việc ra mắt mô hình M2.1, mô tả đây là một bản nâng cấp lớn được thiết kế để mang lại hiệu năng mạnh mẽ hơn trên nhiều ngôn ngữ lập trình cũng như phát triển ứng dụng di động và web.

Theo công ty, trong khi phiên bản M2 trước đó chủ yếu tập trung vào việc giảm chi phí vận hành và cải thiện khả năng truy cập, thì phiên bản M2.1 tập trung vào việc nâng cao hiệu quả trong các tác vụ phức tạp thực tế, đặc biệt chú trọng đến việc hỗ trợ nhiều ngôn ngữ hơn và các trường hợp sử dụng thực tiễn trong văn phòng.

MiniMax cho biết mô hình này hiện cung cấp các khả năng được cải thiện đáng kể trên nhiều ngôn ngữ lập trình, bao gồm Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript và JavaScript, cho phép phát triển toàn diện từ kỹ thuật hệ thống cấp thấp đến xây dựng lớp ứng dụng. Công ty cũng báo cáo những cải tiến lớn trong phát triển web và di động, tăng cường hỗ trợ gốc cho Android và iOS đồng thời mở rộng khả năng của mô hình trong việc diễn giải các yêu cầu thiết kế, tạo ra giao diện trực quan tinh tế và xây dựng môi trường mô phỏng tương tác và ba chiều tiên tiến.

Công ty này cũng lưu ý thêm rằng M2.1 cải thiện khả năng xử lý các tập lệnh phức tạp và thực thi tác vụ tích hợp, cho phép hiệu suất đáng tin cậy hơn trong các kịch bản năng suất văn phòng. So với phiên bản tiền nhiệm, phiên bản mới được mô tả là mang lại phản hồi ngắn gọn và hiệu quả hơn, thời gian thực thi nhanh hơn và giảm chi phí tính toán, góp phần tạo ra quy trình làm việc mượt mà hơn cho việc lập trình hỗ trợ AI và các hoạt động dựa trên tác nhân. MiniMax cho biết thêm rằng M2.1 thể hiện khả năng tương thích mạnh mẽ với nhiều công cụ phát triển và khung tác nhân khác nhau, đồng thời cung cấp chất lượng hội thoại và văn bản được cải thiện, tạo ra đầu ra chi tiết và có cấu trúc tốt hơn trong tài liệu kỹ thuật và bối cảnh giao tiếp chung.

M2.1 thiết lập các chuẩn mực hiệu năng mới, mang lại những cải tiến vượt bậc trong các bài kiểm tra đa ngôn ngữ và toàn diện.

MiniMax báo cáo rằng mô hình M2.1 của họ cho thấy những cải tiến đáng kể về hiệu năng so với phiên bản M2 trước đó trên các tiêu chuẩn đánh giá kỹ thuật phần mềm quan trọng, đặc biệt là kết quả mạnh mẽ trong các tác vụ lập trình đa ngôn ngữ, nơi nó được mô tả là vượt trội hơn Claude Sonnet 4.5 và gần đạt hiệu năng của Claude Opus 4.5. Công ty cho biết các đánh giá được thực hiện trên SWE-bench Verified, sử dụng một loạt các khung phần mềm mã hóa, cho thấy mức độ tổng quát hóa khung và tính ổn định hoạt động cao.

Các thử nghiệm đánh giá hiệu năng bổ sung bao gồm các lĩnh vực như tạo kiểm thử, tối ưu hóa thời gian chạy, xem xét mã và tuân thủ hướng dẫn được báo cáo đã cho thấy những cải tiến rộng rãi so với M2, với M2.1 liên tục đạt hoặc vượt trội hơn Claude Sonnet 4.5 trong một số hạng mục này. Để đánh giá khả năng của mô hình trong việc thiết kế và cung cấp các ứng dụng hoàn chỉnh từ ý tưởng ban đầu đến triển khai chức năng, MiniMax đã giới thiệu một khung đánh giá mới có tên là VIBE, đo lường chất lượng hình ảnh và hành vi tương tác trên web, mô phỏng, Android, iOS và phát triển phụ trợ. Không giống như các phương pháp kiểm thử truyền thống, VIBE áp dụng phương pháp xác minh dựa trên tác nhân tự động để kiểm tra cả tính thẩm mỹ giao diện và logic thời gian chạy.

Theo MiniMax, M2.1 đạt điểm VIBE tổng thể là 88,6, phản ánh khả năng phát triển toàn diện mạnh mẽ, đặc biệt đạt kết quả cao trong phát triển web với 91,5 điểm và phát triển Android với 89,7 điểm. Công ty cũng cho biết thêm rằng mô hình này còn thể hiện những cải tiến liên tục trong việc sử dụng các công cụ mở rộng và các chỉ số thông minh tổng thể so với phiên bản M2 trước đó.

Bài đăng " MiniMax M2.1 cung cấp khả năng lập trình đa ngôn ngữ nâng cao cho các ứng dụng thực tế phức tạp" xuất hiện lần đầu trên Metaverse Post .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận