Google DeepMind 与Gemini Robotics

本文为机器翻译
展示原文

谷歌DeepMind的新AI模型有望通过语音控制来革新机器人行业,实现复杂多样的任务。

在人工智能应用领域取得重大进展的一步,谷歌DeepMind刚刚发布了Gemini Robotics - 一种专门设计用于控制机器人执行复杂任务的先进AI模型。这标志着谷歌努力将大型语言模型(LLM)的应用扩展到机器人领域的重要一步。

根据周三发布的公告,Gemini Robotics的目标是使机器人系统能够与物体进行视觉交互、在环境中灵活移动,并自然完成多样的任务。发布的演示视频展示了该模型通过语音指令控制机器人执行精细操作如折纸、放置物品等的出色能力。

对机器人行业具有突破性潜力

Gemini Robotics的亮点在于其泛化能力 - 这是当前机器人技术面临的最大挑战之一。该模型经过训练,能够灵活地将机器人获取的视觉信息与其可执行的具体动作相关联,并在不同硬件平台上运行。

"我们已经证明,Gemini Robotics即使在从未出现在训练数据中的环境中也能高效运行,"DeepMind代表表示。这与之前的系统相比是一个重要进步,后者通常难以应对新环境或未预先编程的任务。

除了推出主要模型,谷歌DeepMind还发布了Gemini Robotics-ER - 一个精简版本,供研究人员和开发者集成到自己的机器人项目中。这反映了谷歌在推动AI机器人社群发展方面的开放战略。

为确保新技术的安全性,DeepMind还推出了Asimov标准 - 一个评估AI驱动机器人潜在风险的框架。这反映了行业对于部署AI技术到物理系统时安全和伦理问题的日益关注。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论