人工智能公司 Gradient 推出“Echo-2”,可將模型訓練成本降低 90% 以上

本文為機器翻譯
展示原文

人工智能基礎設施公司 Gradient 發佈了其新一代去中心化強化學習 (RL) 平臺 Echo-2。該平臺利用分佈式計算技術,充分利用全球閒置的 GPU 資源,有效解決了計算成本高昂的問題。這種方法主要針對採樣過程,該過程占強化學習計算的 80%,非常適合進行高級並行處理。 Gradient 成功地將一個擁有 300 億參數的模型的訓練成本降低了 10 倍以上,從商業雲平臺上的每次訓練約 4,490 美元降至約 425 美元。訓練時間也顯著縮短至 9.5 小時。 Echo-2 採用了基於“有界陳舊性”的異步強化學習技術,該技術將學習者與參與者分離,並嚴格控制模型版本之間的時間延遲,從而保持訓練的穩定性。它還採用了“Lattica”點對點協議,可在短短几分鐘內將超過 60GB 的大型模型權重部署到數百個節點;此外,它還採用了“三平面架構”,可獨立管理部署、訓練和數據,從而創建一個無需複雜設置即可運行的環境。 Gradient 的一位代表表示,Echo-2 將為任何人構建和擁有最先進的推理模型奠定基礎,而無需考慮經濟因素。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論