OpenAI 推出 o3 和 o4-mini

本文為機器翻譯
展示原文

OpenAI的新型AI模型可以在回答前停下來思考,允許直接在瀏覽器中處理影象和執行Python程式碼。

OpenAI剛剛在週四官方上線了兩個新的人工智慧模型o3和o4-mini。這些是設計用於在給出答案前"暫停和思考"的推理模型,標誌著全球AI競爭中的重要進展。

據OpenAI稱,o3是他們迄今最先進的推理模型,在數學、程式設計、推理、科學和影象理解測試中表現優異。o4-mini被介紹為成本、速度和效能之間的平衡選擇——這是開發者選擇AI模型時通常考慮的三個重要因素。

在激烈競爭背景下的技術突破

值得注意的是,這些模型可以使用ChatGPT中的工具生成響應,如瀏覽網頁、執行Python程式碼、處理和建立影象。特別是,o3和o4-mini是OpenAI首個能夠"用影象思考"的模型——使用者可以上傳白板草圖或PDF文件中的圖表,模型將在"思考鏈"過程中分析影象後再回答。

在效能方面,o3在SWE-bench verified測試中取得了令人印象深刻的69.1%成績(沒有自定義腳手架),遠超o3-mini(49.3%)和Claude 3.7 Sonnet(62.3%)。

OpenAI釋出o3是一個值得注意的轉折點,尤其是在CEO Sam Altman在2月份曾發出訊號,公司計劃將資源集中在一個更精細的整合o3技術的替代方案上。然而,競爭壓力似乎促使OpenAI改變了方向。

o3、o4-mini和o4-mini-high(一個花費更多時間提高可靠性的變體)這三個模型現已可供OpenAI的Pro、Plus和Team訂閱使用者使用,同時也將透過開發者端點提供,包括Chat Completions API和Responses API。

在定價方面,OpenAI為o3設定了相對較低的價格,每百萬輸入代幣10美元,每百萬輸出代幣40美元。對於o4-mini,價格與o3-mini相當,每百萬輸入代幣1.10美元,每百萬輸出代幣4.40美元。

在接下來的幾周裡,OpenAI預計將釋出o3-pro,這是一個使用更多計算資源的o3版本,專門面向ChatGPT Pro訂閱使用者。Sam Altman還表示,o3和o4-mini可能是ChatGPT中最後的獨立AI推理模型,直到GPT-5上線——這個模型預計將統一傳統模型如GPT-4.1和推理模型。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論