阿里雲確認李飛飛團隊的s1模型是基於Qwen訓練

avatar
PANews
02-06

PANews 2月6日消息,據新浪科技,李飛飛等斯坦福大學和華盛頓大學研究人員以不到50美元的雲計算費用訓練了一個名叫s1的人工智能推理模型,該模型在數學和編碼能力測試中的表現與OpenAl的o1和Depsek的R1等尖端推理模型類似,引發廣泛關注。不過很快,該s1模型被指“並非從零開始訓練”,其基座模型為“阿里通義千問(Qwen)模型”。對此,記者向阿里雲方面求證,阿里雲方面確認了這一消息,並回應稱:“他們以阿里通義千問Qwen2.5-32B-Instruct開源模型為底座,在16塊H100GPU上監督微調26分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-preview高出27%。”

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論