Gemma 3: Google이 최신 오픈 AI 모델을 출시

avatar
AI News
03-12
이 기사는 기계로 번역되었습니다
원문 표시

구글이 AI 접근성을 새로운 기준으로 설정하기 위해 노력하는 오픈 AI 모델 가족의 최신 버전인 Gemma 3를 출시했습니다.

회사의 Gemini 2.0 모델을 기반으로 구축된 Gemma 3는 다양한 장치에서 AI 애플리케이션을 만들 수 있도록 설계되었습니다.

이번 출시는 Gemma의 첫 번째 생일을 기념하는 것으로, 인상적인 채택 지표로 강조되었습니다. Gemma 모델은 1억 건 이상의 다운로드를 달성했으며 6만 개 이상의 커뮤니티 구축 변형을 생성했습니다. "Gemmaverse"로 불리는 이 생태계는 AI 민주화를 목표로 하는 활발한 커뮤니티를 나타냅니다.

"Gemma 오픈 모델 제품군은 유용한 AI 기술에 대한 접근성을 높이려는 우리의 노력의 기반이 됩니다."라고 구글이 설명했습니다.

Gemma 3: 기능 및 기능

Gemma 3 모델은 1B, 4B, 12B, 27B 매개변수 등 다양한 크기로 제공되어 개발자가 특정 하드웨어 및 성능 요구 사항에 맞는 모델을 선택할 수 있습니다. 이러한 모델은 기능이나 정확성을 저하시키지 않고도 모듈 계산 설정에서도 더 빠른 실행을 약속합니다.

Gemma 3의 주요 기능은 다음과 같습니다:

  • 단일 가속기 성능: Gemma 3는 단일 가속기 모델에 대한 새로운 기준을 설정합니다. LMArena 리더보드의 초기 인간 선호도 평가에서 Gemma 3는 Llama-405B, DeepSeek-V3, o3-mini 등 경쟁업체를 능가했습니다.
  • 140개 언어의 다국어 지원: 다양한 청중을 위해 Gemma 3는 140개 이상의 언어에 대한 사전 학습 기능을 제공합니다. 개발자는 애플리케이션을 만들어 사용자의 모국어로 연결할 수 있어 프로젝트의 글로벌 도달 범위를 확장할 수 있습니다.
  • 정교한 텍스트 및 시각적 분석: 고급 텍스트, 이미지 및 짧은 동영상 추론 기능을 통해 개발자는 콘텐츠 분석에서 창의적 워크플로우에 이르는 다양한 사용 사례를 해결하는 대화형 및 지능형 애플리케이션을 구현할 수 있습니다.
  • 확장된 컨텍스트 창: 128k 토큰 컨텍스트 창을 제공하는 Gemma 3는 대규모 데이터 세트를 분석하고 합성할 수 있어 확장된 콘텐츠 이해가 필요한 애플리케이션에 적합합니다.
  • 워크플로 자동화를 위한 함수 호출: 함수 호출 지원을 통해 개발자는 구조화된 출력을 활용하여 프로세스를 자동화하고 에이전트 AI 시스템을 쉽게 구축할 수 있습니다.
  • 경량 효율성을 위한 양자화 모델: Gemma 3는 공식 양자화 버전을 도입하여 모델 크기를 크게 줄이면서도 출력 정확도를 유지합니다. 이는 모바일 또는 리소스 제한 환경을 최적화하는 개발자에게 유용합니다.

Chatbot Arena Elo Score 리더보드에서 Gemma 3의 성능 우위가 명확하게 드러납니다. NVIDIA H100 GPU 하나만으로도 27B 버전의 Gemma 3가 최상위 채팅봇 중 하나로 랭크되어 Elo 점수 1338을 달성했습니다. 많은 경쟁자들은 이와 비슷한 성능을 내기 위해 최대 32개의 GPU를 요구합니다.

Google Gemma 3 performance illustrated on benchmark against both open source and proprietary AI models in the Chatbot Arena Elo Score leaderboard.

Gemma 3의 강점 중 하나는 개발자의 기존 워크플로에 적응할 수 있다는 것입니다.

  • 다양한 도구 호환성: Gemma 3는 Hugging Face Transformers, JAX, PyTorch, Google AI Edge 등 인기 AI 라이브러리 및 도구를 지원합니다. 최적화된 배포를 위해 Vertex AI 또는 Google Colab과 같은 플랫폼을 통해 개발자가 최소한의 번거로움으로 시작할 수 있습니다.
  • NVIDIA 최적화: Jetson Nano와 같은 엔트리 레벨 GPU부터 Blackwell 칩과 같은 최신 하드웨어까지 사용하는 경우 Gemma 3는 최대 성능을 보장하며, NVIDIA API Catalog를 통해 이를 더욱 간소화합니다.
  • 확장된 하드웨어 지원: NVIDIA 외에도 Gemma 3는 AMD GPU를 통한 ROCm 스택 및 Gemma.cpp를 통한 CPU 실행을 지원하여 다양성을 더합니다.

즉시 실험을 위해 사용자는 Hugging Face와 Kaggle과 같은 플랫폼을 통해 Gemma 3 모델에 액세스하거나 Google AI Studio를 활용하여 브라우저 기반 배포를 할 수 있습니다.

책임감 있는 AI 발전

"우리는 오픈 모델에 대한 신중한 위험 평가가 필요하다고 믿으며, 우리의 접근 방식은 혁신과 안전성의 균형을 이루고 있습니다."라고 구글이 설명했습니다.

Gemma 3 팀은 윤리 지침에 맞추기 위해 세부적인 거버넌스 정책을 채택하고 미세 조정 및 강력한 벤치마킹을 적용했습니다. STEM 분야에서 향상된 기능을 고려할 때 모델은 유해 물질 생성과 같은 오용 위험을 완화하기 위한 특정 평가를 거쳤습니다.

구글은 점점 강력해지는 모델에 대한 적절한 안전 프레임워크를 만들기 위한 업계 차원의 노력을 주도하고 있습니다.

이를 위해 구글은 ShieldGemma 2를 출시하고 있습니다. 4B 이미지 안전 검사기는 Gemma 3의 아키텍처와 출력을 활용하여 위험한 콘텐츠, 노골적인 자료, 폭력 등의 범주에 걸쳐 안전 레이블을 제공합니다. 기성 솔루션을 제공하는 동시에 개발자가 맞춤형 안전 요구 사항을 충족할 수 있도록 지원합니다.

"Gemmaverse"는 단순한 기술 생태계가 아니라 커뮤니티 주도 운동입니다. AI Singapore의 SEA-LION v3, INSAIT의 BgGPT, Nexa AI의 OmniAudio 등의 프로젝트는 이 생태계 내 협력의 힘을 보여줍니다.

학술 연구를 지원하기 위해 구글은 Gemma 3 Academic Program도 도입했습니다. 연구자들은 Google Cloud 크레딧 1만 달러를 신청하여 AI 중심 프로젝트를 가속화할 수 있습니다. 신청은 오늘부터 4주 동안 열려 있습니다.

접근성, 기능, 광범위한 호환성을 갖춘 Gemma 3는 AI 개발 커뮤니티의 핵심이 될 수 있는 강력한 사례를 제시합니다.

(이미지 제공: 구글)

참고: Alibaba Qwen QwQ-32B: 확장된 강화 학습 사례

업계 리더들로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? AI & Big Data Expo에 참석해 보세요. 암스테르담, 캘리포니아, 런던에서 개최되는 이 종합 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo 등 다른 주요 행사와 함께 개최됩니다.

TechForge에서 제공하는 다른 upcoming 엔터프라이즈 기술 행사와 웨비나를 여기에서 확인하세요.

이 기사는 Gemma 3: Google launches its latest open AI models에서 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
1
코멘트