谷歌DeepMind的新AI模型有望透過語音控制來革新機器人行業,實現複雜多樣的任務。
在人工智慧應用領域取得重大進展的一步,谷歌DeepMind剛剛釋出了Gemini Robotics - 一種專門設計用於控制機器人執行復雜任務的先進AI模型。這標誌著谷歌努力將大型語言模型(LLM)的應用擴充套件到機器人領域的重要一步。
根據週三釋出的公告,Gemini Robotics的目標是使機器人系統能夠與物體進行視覺互動、在環境中靈活移動,並自然完成多樣的任務。釋出的演示影片展示了該模型透過語音指令控制機器人執行精細操作如摺紙、放置物品等的出色能力。
對機器人行業具有突破性潛力
Gemini Robotics的亮點在於其泛化能力 - 這是當前機器人技術面臨的最大挑戰之一。該模型經過訓練,能夠靈活地將機器人獲取的視覺資訊與其可執行的具體動作相關聯,並在不同硬體平臺上執行。
"我們已經證明,Gemini Robotics即使在從未出現在訓練資料中的環境中也能高效執行,"DeepMind代表表示。這與之前的系統相比是一個重要進步,後者通常難以應對新環境或未預先程式設計的任務。
除了推出主要模型,谷歌DeepMind還發布了Gemini Robotics-ER - 一個精簡版本,供研究人員和開發者整合到自己的機器人專案中。這反映了谷歌在推動AI機器人社群發展方面的開放戰略。
為確保新技術的安全性,DeepMind還推出了Asimov標準 - 一個評估AI驅動機器人潛在風險的框架。這反映了行業對於部署AI技術到物理系統時安全和倫理問題的日益關注。



