
人工智慧研究組織OpenAI宣佈釋出兩個名為gpt-oss-120b和gpt-oss-20b的先進開放權重語言模型。這些模型在實際應用中表現出色,同時保持低運營成本。在靈活的Apache 2.0許可下發布,它們在推理任務中超越了同等大小的其他開放模型,展現出強大的工具使用能力,並針對消費級硬體進行了最佳化。訓練過程涉及強化學習技術,並結合了OpenAI最先進的內部模型(包括o3和其他尖端系統)的見解。
gpt-oss-120b模型在基本推理基準測試中幾乎與OpenAI的o4-mini模型持平,並可在單個80 GB GPU上高效執行。與此同時,gpt-oss-20b模型在常見基準測試中取得了與OpenAI的o3-mini相當的結果,並能在僅有16 GB記憶體的邊緣裝置上執行,使其適用於裝置上應用、本地推理或快速測試,無需昂貴的基礎設施。兩個模型都在工具使用、少樣本函式呼叫、思維鏈(CoT)推理方面表現出強大能力,如Tau-Bench代理評估和HealthBench所示,有時甚至超越了OpenAI o1和GPT-4o等專有模型。
這些模型與Responses API相容,旨在整合到代理工作流中,提供高階指令跟隨、工具使用(包括網頁搜尋和Python程式碼執行)以及推理能力。這包括可調節的推理工作,以最佳化不需要複雜推理或優先考慮最終輸出低延遲的任務。兩個模型都完全可自定義,支援完整的思維鏈推理,並支援結構化輸出格式。
安全考慮是這些模型釋出的核心,尤其是考慮到它們的開放性質。除了全面的安全訓練和評估外,還透過OpenAI的準備框架下經過對抗性微調的gpt-oss-120b版本進行了額外的測試。gpt-oss模型在安全基準效能上可與OpenAI最新的專有模型相媲美,為開發者提供類似的安全保證。詳細結果和進一步資訊可在研究論文和模型卡片中找到,其方法已由外部專家審查,代表了為開放權重模型建立新安全標準的進展。
OpenAI已與AI Sweden、Orange和Snowflake等早期合作伙伴合作,探索這些開放模型的實際應用,包括出於資料安全考慮的本地託管和在專門資料集上的微調。這些開放模型的可用性旨在賦能從個人開發者到大型企業和政府實體的廣泛使用者群,使他們能在自己的基礎設施上執行和定製人工智慧。結合透過OpenAI API可訪問的其他模型,開發者可以選擇在效能、成本和延遲之間平衡的各種選項,以支援多樣的人工智慧工作流。
gpt-oss是個大事件;這是一個最先進的開放權重推理模型,具有與o4-mini相當的強大實際效能,你可以在自己的電腦(或對於較小尺寸的模型,在手機)上本地執行。我們認為這是最好且最易用的開放模型……
— Sam Altman (@sama) 2025年8月5日




