제미니(Gemini) 2.0: 구글이 에이전트 AI 시대를 열다

avatar
AI News
12-12
이 기사는 기계로 번역되었습니다
원문 표시

구글 CEO 순다르 피차이가 구글의 AI 혁신을 대표하는 제미니 2.0 모델 출시를 발표했습니다.

제미니 1.0 모델 출시 1년 만에 선보이는 이번 업그레이드에는 향상된 멀티모달 기능, 에이전트 기능, 혁신적인 사용자 도구가 포함되어 AI 기술의 경계를 넓히고자 합니다.

혁신적인 AI로의 도약

구글의 26년 간 세계 정보 정리 및 접근성 향상 노력을 돌아보며 피차이는 "제미니 1.0이 정보 정리와 이해에 관한 것이었다면, 제미니 2.0은 이를 훨씬 더 유용하게 만드는 것"이라고 말했습니다.

2022년 12월 출시된 제미니 1.0은 구글 최초의 네이티브 멀티모달 AI 모델로 주목받았습니다. 이 모델은 텍스트, 비디오, 이미지, 오디오, 코드 등을 이해하고 처리하는 데 탁월했으며, 생산성 중심 NotebookLM과 같은 애플리케이션 개발에 널리 활용되었습니다.

이제 제미니 2.0을 통해 구글은 이미지와 오디오 생성, 더 나은 추론과 계획, 실제 의사결정 능력을 갖춘 범용 AI 어시스턴트로서의 역할을 가속화하고자 합니다. 피차이는 이를 "에이전트 시대의 여명"이라고 표현했습니다.

"우리는 세계에 대한 이해도가 높고, 여러 단계를 미리 생각하며, 사용자의 감독하에 대신 행동할 수 있는 에이전트 모델 개발에 투자해왔습니다."라고 피차이가 설명했습니다.

제미니 2.0: 핵심 기능 및 출시

이번 발표의 핵심은 실험적으로 공개된 제미니 2.0 Flash 모델입니다. 이 모델은 이전 세대의 기반 위에 더 빠른 응답 속도와 향상된 성능을 제공합니다.

제미니 2.0 Flash는 텍스트와 함께 네이티브 이미지 생성, 다국어 음성 합성 등의 멀티모달 입출력을 지원합니다. 또한 구글 검색과 사용자 정의 기능 등의 네이티브 도구 통합도 가능합니다.

개발자와 기업은 구글 AI 스튜디오와 Vertex AI를 통해 제미니 2.0 Flash API에 접근할 수 있으며, 더 큰 모델 크기는 2024년 1월에 일반 공개될 예정입니다.

전 세계적 접근성을 위해 제미니 앱에 2.0 Flash 실험 모델의 채팅 최적화 버전이 추가되었으며, 데스크톱과 모바일에서 조만간 경험할 수 있을 것입니다.

포괄적인 AI 혁신 제품군

제미니 2.0 출시와 함께 새로운 기능들이 소개되었습니다.

Deep Research는 AI 연구 보조 기능으로, 복잡한 주제 조사 과정을 간소화하여 종합 보고서를 작성합니다. 또한 검색 기능이 제미니 기반 AI 개요로 향상되어 복잡한 다단계 질문을 처리할 수 있습니다.

제미니 2.0은 구글의 6세대 Tensor Processing Unit인 Trillium을 사용하여 학습 및 추론이 이루어졌습니다. Trillium은 이제 외부 개발자들도 활용할 수 있게 되었습니다.

선구적인 에이전트 경험

제미니 2.0과 함께 선보이는 실험적 "에이전트" 프로토타입은 다음과 같습니다:

  • 프로젝트 아스트라: 범용 AI 어시스턴트

올해 I/O에서 처음 소개된 프로젝트 아스트라는 제미니 2.0의 멀티모달 이해력을 활용하여 실제 AI 상호작용을 개선합니다. 안드로이드에서 시험 운영되며, 다국어 대화, 기억력, 구글 검색/렌즈/지도 등과의 통합이 개선되고 있습니다. 아스트라는 또한 사람과 유사한 대화 속도를 보여주고 있으며, 웨어러블 기기 적용을 위한 연구도 진행 중입니다.

  • 프로젝트 마리너: 웹 자동화 재정의

프로젝트 마리너는 제미니 2.0의 텍스트, 이미지, 양식 등 웹 요소 이해 능력을 활용하는 실험적 웹 브라우징 어시스턴트입니다. 초기 테스트에서 83.5%의 성공률을 보였으며, 크롬 확장프로그램을 통해 사용자 피드백을 받아 기능을 개선하고 있습니다.

  • 줄스: 개발자를 위한 코딩 에이전트

줄스는 GitHub 워크플로우에 통합되어 코딩 문제를 해결하는 AI 어시스턴트입니다. 사용자의 감독하에 자율적으로 솔루션을 제안하고, 계획을 수립하며, 코드 작업을 수행할 수 있습니다.

  • 게임 애플리케이션과 그 이상

제미니 2.0의 가상 환경 적용을 위해 구글 딥마인드는 Supercell과 같은 게임 파트너와 협력하고 있습니다. 이러한 실험적 AI 동반자는 실시간으로 게임 동작을 해석하고, 전략을 제안하며, 검색을 통해 더 넓은 지식에 접근할 수 있습니다. 또한 제미니 2.0의 공간 추론 능력이 로봇공학 분야에 어떻게 활용될 수 있을지 연구 중입니다.

AI 개발에 있어서의 책임감

AI 기능이 확장됨에 따라 구글은 안전성과 윤리적 고려사항의 중요성을 강조하고 있습니다.

제미니 2.0은 광범위한 위험 평가와 Responsibility and Safety Committee의 감독을 거쳤으며, 내장된 추론 능력을 통해 보안 시나리오를 평가하고 안전 조치를 최적화할 수 있습니다.

또한 사용자 프라이버시 보호, 악용 방지, 신뢰성 있는 AI 에이전트 유지를 위한 안전장치도 마련하고 있습니다. 예를 들어 프로젝트 마리너는 사용자 지침을 우선시하며 악의적인 프롬프트 주입을 막아 피싱이나 사기 거래를 방지합니다.

피차이는 "AI를 개발할 때는 처음부터 책임감 있게 해야 한다"고 재확인했습니다.

제미니 2.0 Flash 출시를 통해 구글은 다양한 분야에서 사용자 경험을 혁신할 수 있는 범용 AI 어시스턴트를 구현하고자 합니다.

관련 기사: 기계 언러닝: 연구원들이 AI 모델에 데이터 '잊기'를 가르치다

업계 리더들로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? AI & Big Data Expo에 참석해 보세요. 이 종합 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo와 함께 개최됩니다.

TechForge에서 제공하는 다른 upcoming 엔터프라이즈 기술 행사와 웨비나를 여기에서 확인하세요.

이 기사는 AI News에 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
코멘트