IplanRIO, một công ty CNTT thuộc chính quyền thành phố Rio de Janeiro ở Brazil, đã bất ngờ vươn lên hàng đầu thế giới về trí tuệ nhân tạo (AI) bằng cách huấn luyện lại mô hình Qwen 3.5-397B-A17B dựa trên mô hình Tongyi Qianwen 3.5-397B-A17B của Alibaba và mã nguồn mở một mô hình lớn có tên Rio 3.5 Open 397B.
Tác giả và nguồn bài viết: Machine Heart
Hiện nay, bên cạnh Claude Fable 5, tựa game bị cấm trên toàn cầu (ngoại trừ Mỹ), cộng đồng AI cũng đang tràn ngập các bài đăng về một mô hình mã nguồn mở.

Một người dùng Twitter đã phát hiện ra mã nguồn mở Rio 3.5 397B, một mô hình mã nguồn mở được phát triển bởi một công ty CNTT thuộc chính quyền thành phố Rio de Janeiro ở Brazil, vượt qua các mô hình mã nguồn mở khác như Qwen 3.7 Plus trong nhiều bài kiểm tra hiệu năng. Mô hình cơ bản của mô hình này là Qwen3.5-397B-A17B .


Một người dùng Twitter khác, "Chubby," bày tỏ sự ngạc nhiên và nói: "Một mô hình mà tôi chưa từng nghe đến trước đây giờ lại trở thành mô hình mã mã nguồn mở, thậm chí còn vượt qua cả Qwen 3.7."


Đây là mô hình thứ hai trong tuần này được huấn luyện lại trên Qwen3.5 và đạt được hiệu năng hàng đầu. Mô hình còn lại là Nex-N2-Pro 397B, cũng được xây dựng trên Qwen3.5-397B-A17B, với hiệu năng tương đương với các mô hình hàng đầu như GPT-5.5 và Opus 4.7.

Sự nổi lên của Rio 3.5 đã khiến Clem Delangue, đồng sáng lập kiêm CEO của Huggingface, nhận xét: "Không có gì trong tương lai của AI là đã được định trước. Những gì sẽ xảy ra tiếp theo sẽ cho chúng ta tất cả sự lựa chọn và không gian để hành động: Con đường 1: API mã nguồn đóng, quyền lực tập trung, tương lai do một số ít người ở Thung lũng Silicon và Washington quyết định. Con đường 2: AI mã nguồn mở, cho phép mọi người tham gia, sở hữu và cùng xây dựng, bao gồm cả các tổ chức như Rio de Janeiro. Hãy chọn con đường của bạn, bạn ạ."


Tiếp theo, chúng ta hãy cùng xem xét các thông số kỹ thuật của mẫu Rio 3.5 397B.

Rio 3.5 Open 397B là một mô hình trí tuệ nhân tạo đa năng tiên tiến được phát triển bởi IplanRIO, công ty CNTT thuộc chính quyền thành phố Rio de Janeiro.
Mô hình này được huấn luyện lại trên tập dữ liệu Qwen 3.5 397B và đạt được thứ hạng hàng đầu trong số các mô hình mã nguồn mở trong các bài kiểm tra chuẩn như lập trình tác nhân, toán học, STEM, đa ngôn ngữ và đa phương thức. Nó cho thấy sự cải thiện đáng kể so với mô hình cơ sở và có khả năng cạnh tranh với các mô hình mã nguồn mở và mã nguồn đóng mạnh nhất thế giới.

Các đặc điểm cốt lõi của mô hình bao gồm:
- Tổng cộng 397 tỷ tham số, 17 tỷ tham số kích hoạt, sử dụng kiến trúc chuyên gia lai (MoE).
- 1.010.000 token, tương đương với 1 triệu cửa sổ ngữ cảnh;
- SwiReasoning tích hợp: Cho phép chuyển đổi linh hoạt giữa suy luận không gian tường minh và không gian tiềm ẩn, đạt được sự cân bằng tốt hơn giữa độ chính xác và hiệu quả;
- Khả năng thích ứng cao: Nó vượt trội trong lập trình tác nhân, suy luận, tuân theo chỉ dẫn và nhiệm vụ đa phương thức;
- Khả năng đa ngôn ngữ vượt trội: Thành thạo tiếng Bồ Đào Nha, tiếng Anh, tiếng Trung và hàng chục ngôn ngữ khác;
- Được cấp phép theo Giấy phép MIT: Hoàn toàn mở và có thể được sử dụng cho mục đích thương mại và nghiên cứu.
Trong đó, SwiReasoning là một khung suy luận không cần huấn luyện dựa trên nghiên cứu của Shi et al. (2025). Nó có thể chuyển đổi linh hoạt giữa suy luận Chuỗi suy nghĩ rõ ràng và suy luận không gian tiềm ẩn dựa trên tín hiệu độ tin cậy dựa trên entropy. Điều này có thể cải thiện cả độ chính xác và hiệu quả token. Trong quá trình huấn luyện, mô hình cũng được tối ưu hóa rõ ràng để đạt được hiệu quả nhờ suy luận không gian tiềm ẩn.

So sánh hiệu năng lập trình tác nhân thông minh và kỹ thuật phần mềm:

Bài kiểm tra đánh giá kiến thức và khả năng suy luận:

Các bài kiểm tra chuẩn toán học:

Tiêu chuẩn đa ngôn ngữ:

Các bài kiểm tra chuẩn về tuân thủ hướng dẫn và đại lý:

Liên kết tham khảo:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191



