구글 DeepMind의 새로운 AI 모델은 음성 제어를 통해 복잡한 다양한 작업을 수행할 수 있는 로봇 산업을 혁명할 것으로 기대됩니다.
인공지능 응용 분야에서 주목할 만한 진전을 이룬 구글 DeepMind은 최근 제미니 로보틱스(Gemini Robotics) - 실제 환경에서 복잡한 작업을 수행할 수 있는 로봇을 제어하기 위해 특별히 설계된 첨단 AI 모델을 발표했습니다. 이는 구글이 대규모 언어 모델(LLM)의 로봇공학 분야 적용 범위를 확장하려는 노력의 중요한 이정표입니다.
수요일에 발표된 바에 따르면, 제미니 로보틱스는 로봇 시스템이 시각적으로 물체와 상호 작용하고, 유연하게 이동하며, 다양한 작업을 자연스럽게 수행할 수 있도록 개발되었습니다. 공개된 데모 영상에서는 음성 지시를 통해 로봇이 종이 접기나 물건 배치와 같은 정교한 작업을 수행하는 인상적인 능력을 보여줍니다.
로봇 산업을 위한 돌파구
제미니 로보틱스의 핵심은 일반화 능력(generalization)입니다. 이는 현대 로봇공학의 가장 큰 과제 중 하나입니다. 이 모델은 로봇이 인식한 시각 정보와 실제 수행할 수 있는 행동 사이의 유연한 연결을 학습하여, 다양한 로봇 하드웨어 플랫폼에서 작동할 수 있습니다.
"우리는 제미니 로보틱스가 훈련 데이터에 없던 환경에서도 효과적으로 작동할 수 있음을 입증했습니다." DeepMind 대변인은 말했습니다. 이는 이전 시스템들이 새로운 환경이나 사전 프로그래밍되지 않은 작업에 어려움을 겪었던 것과 대조되는 중요한 진전입니다.
주요 모델 출시와 함께 구글 DeepMind는 연구자와 개발자들이 자체 로봇 프로젝트에 통합할 수 있는 축소판 Gemini Robotics-ER도 공개했습니다. 이는 구글이 로봇 AI 커뮤니티 발전을 지원하려는 개방적 전략을 보여줍니다.
새로운 기술의 안전성을 보장하기 위해 DeepMind는 Asimov 표준 - AI 기반 로봇의 잠재적 위험을 평가하는 프레임워크도 소개했습니다. 이는 물리적 시스템에 AI 기술을 적용할 때 대두되는 안전성과 윤리 문제에 대한 산업계의 우려를 반영합니다.



