OpenAI正在製作其最聰明的人工智慧模型的更小、更高效的版本,並免費提供,因為它試圖回應中國AI初創公司DeepSeek推出的一款新的開源產品所引發的炒作和熱情。
WIRED之前報道過OpenAI正在準備推出新的模型o3-mini,定於1月31日釋出。據知情人士透露,該公司的研究人員一直在加班加點地準備這款新產品。
o3-mini是OpenAI目前最先進的AI推理能力模型的縮小版。該模型可以將複雜問題分解成組成部分,以找出最佳解決方案。
"這個強大而快速的模型推進了小型模型所能實現的邊界,"該公司在一篇部落格文章中宣佈o3-mini的推出。
OpenAI將向ChatGPT的所有Plus、Team和Pro使用者提供o3-mini。ChatGPT的免費版使用者也可以嘗試使用o3-mini,但無法傳送太多查詢,公司表示。
OpenAI顯然已經有一段時間在使用博士生來幫助訓練新模型。幾周前,該公司開始招聘每小時100美元的計算機科學博士生進行"研究合作",以"參與未釋出模型的工作"。
OpenAI還似乎透過其經常使用的一家名為Mercor的公司,招募了在其他領域有專長的博士生。Mercor在LinkedIn上釋出的一份工作崗位說:"這個專案的總體目標是創造具有挑戰性的科學編碼問題,旨在測試大型語言模型在解決實際科學研究問題方面的能力。"
這份工作崗位描述與一個名為SciCode的基準測試中的一個問題驚人相似,該基準測試旨在測試大型語言模型解決複雜科學問題的能力。
這一訊息傳出之際,DeepSeek的R1繼續在美國科技界引發轟動。這樣一個強大的模型能夠免費釋出,給谷歌和Anthropic施加了降低價格的壓力。
據公司內部人士透露,OpenAI特別渴望證明自己仍然處於開發和商業化AI的前沿。
DeepSeek的免費模型採用了一些創新,使其在訓練和服務方面更加高效。該公司似乎使用的資源遠少於OpenAI和其他美國公司目前建立前沿AI模型所需的資源,儘管DeepSeek的具體支出細節仍然不為人知。OpenAI表示,它認為R1可能使用了其模型的輸出進行訓練。
您是OpenAI的現任或前任員工嗎?我們很想聽聽您的意見。請使用非工作手機或電腦,透過電子郵件will_knight@wired.com或Signal使用者名稱wak01聯絡Will Knight。
OpenAI的最新模型在價格上可能無法超越R1,但它表明該公司未來將把效率作為重點。OpenAI還表示,該模型在數學、科學和程式設計方面特別出色。
該公司表示,這款最新模型還將包括新功能,包括能夠訪問網路搜尋、呼叫使用者程式碼中的函式,以及在不同的推理級別之間切換,在速度和問題解決能力之間進行權衡。
DeepSeek的突然崛起也引發了人們對美國政府遏制中國在AI領域崛起戰略的質疑。過去兩屆美國政府已經出臺了一系列制裁措施,以遏制中國獲取通常用於構建前沿AI模型的最先進英偉達晶片的能力。DeepSeek在其研究中描述了幾種型別的英偉達晶片,但具體使用了哪些仍不清楚。





