巴西里約熱內盧市政府旗下的IT公司IplanRIO,基於阿里通義千問Qwen 3.5-397B-A17B模型進行後訓練,開源了一個名為 Rio 3.5 Open 397B 的大模型,意外殺入了全球AI第一梯隊。
文章作者、來源:機器之心
今天,除了全球(非美)被禁的 Claude Fable 5,AI 社區還被一個開源模型刷屏了。

有推特博主發現,一個由巴西里約熱內盧市政府旗下 IT 公司開源的模型 Rio 3.5 397B,在多項基準測試中超越了 Qwen 3.7 Plus 等開源模型,而這個模型的基礎模型還是 Qwen3.5-397B-A17B。


另一位推特博主「Chubby」對此表示不可思議,「一個以前從來沒聽過的模型現在成了開源 SOTA,甚至超過了 Qwen 3.7。」


這已經是本週第二個基於 Qwen3.5 做後訓練、並躋身前沿水平的模型了。另一個是 Nex-N2-Pro 397B,同樣基於 Qwen3.5-397B-A17B 構建,性能可比肩 GPT-5.5 和 Opus 4.7 等頂級模型。

Rio 3.5 的崛起讓 Huggingface 聯合創始人兼 CEO Clem Delangue 發出了感嘆,「AI 的未來沒有什麼是註定的。接下來會發生,我們每個人都有選擇和行動的空間:路徑一:閉源 API,權力集中,未來由硅谷和華盛頓少數人決定。路徑二:開源 AI,讓每個人都能參與、擁有並共同構建,包括里約市這樣的機構。選你的路吧,朋友。」


接下來,我們來了解一下 Rio 3.5 397B 模型的技術細節。

Rio 3.5 Open 397B 是一款前沿級通用 AI 模型,由里約熱內盧市政府旗下的市政 IT 公司 IplanRIO 開發。
該模型基於 Qwen 3.5 397B 進行後訓練,在智能體編程、數學、STEM、多語言和多模態等基準測試中達到了開源模型的領先水平,相比基座模型有顯著提升,並且能夠與全球最強的開源和閉源模型競爭。

模型核心特性包括如下:
- 397B 總參數,17B 激活參數,採用混合專家架構(MoE);
- 1,010,000 token,也就是 100 萬級上下文窗口;
- 集成 SwiReasoning:可在顯式推理和潛空間推理之間動態切換,在準確率和效率上實現更優平衡;
- 通用能力強:在智能體編程、推理、指令遵循和多模態任務上表現突出;
- 多語言能力強:在葡萄牙語、英語、中文以及數十種其他語言中都有較好表現;
- 採用 MIT 許可證:完全開放,可用於商業和研究用途。
其中,SwiReasoning 是一種免訓練推理框架,基於 Shi 等人 2025 年的研究,可根據基於熵的置信度信號,在顯式思維鏈推理和潛空間推理之間動態切換。這樣既能提升準確率,也能大幅提高 token 效率。該模型在訓練時,也明確針對潛空間推理帶來的效率增益進行了優化。

智能體編程與軟件工程基準測試:

知識與推理基準測試:

數學基準測試:

多語言基準測試:

智能體與指令遵循基準測試:

參考鏈接:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191



