Google이 가장 강력한 AI 모델인 제미니(Gemini) 3를 출시했습니다. 알아야 할 사항

11-19

이 기사는 기계로 번역되었습니다

원문 표시

구글은 오늘 제미니(Gemini) 3 프로를 공개 프리뷰로 공개하며, 이를 자사 역사상 가장 강력한 AI 모델이라고 칭했습니다. 이 시스템은 텍스트, 이미지, 오디오, 비디오를 동시에 처리하며 최대 100만 개의 컨텍스트 토큰을 처리합니다. 이는 약 70만 단어, 즉 장편 소설 10권 분량에 해당합니다.

미리보기 모델은 누구나 무료로 사용해볼 수 있습니다 .

구글은 이 모델이 자사가 테스트한 거의 모든 벤치마크에서 이전 모델 인 제미니(Gemini) 2.5 프로보다 우수한 성능을 보였다고 밝혔습니다. 학업 추론 테스트인 '인류의 마지막 시험(Humanity's Last Exam)'에서 제미니(Gemini) 3 프로는 37.5%를 기록한 반면, 제미니 2.5 프로는 21.6%를 기록했습니다. 시각 추론 퍼즐 벤치마크인 ARC-AGI-2에서는 격차가 더욱 벌어져 31.1% 대 4.9%를 기록했습니다.

물론, AI 경쟁에서 이 시점에서 진짜 과제는 기술적인 것이 아니라 상업적 시장 점유율을 확대하는 것입니다.

한때 검색 분야에서 무적처럼 보였던 구글은 주간 사용자 수가 약 8억 명에 달하는 OpenAI에 엄청난 점유율을 내주었습니다. ChatGPT와 제미니(Gemini) 는 월간 사용자 수가 약 6억 5천만 명으로 알려져 있습니다. 구글은 주간 사용자 수를 공개하지 않았지만, 월간 사용자 수보다 훨씬 적을 것으로 예상됩니다.

그럼에도 불구하고, 제미니(Gemini) 3호의 기술적 성과는 인상적이다.

제미니(Gemini) 3 Pro는 구글이 '스파스 믹스드 익스퍼트(sparse mixed-experts)'라고 부르는 아키텍처를 사용합니다. 모든 쿼리에 대해 1조 개가 넘는 매개변수를 모두 활성화하는 대신, 시스템은 각 입력을 전문화된 하위 네트워크로 라우팅합니다. 특정 시점에 모델의 일부, 즉 해당 작업을 담당하는 전문가만 실행되므로 성능은 유지하면서 계산 비용은 절감됩니다.

크고 밀도 높은 모델(다재다능한)인 GPT나 클로드와 달리, Google의 접근 방식은 마치 대규모 조직처럼 운영됩니다. 직원이 1,000명인 회사가 모든 회의에 모든 직원을 소집하지 않고, 특정 팀이 특정 문제를 처리합니다. 제미니(Gemini) 3 Pro도 같은 방식으로 작동하여 질문을 적절한 전문가 네트워크로 연결합니다.

구글은 웹 문서, 코드 저장소, 이미지, 오디오 파일, 비디오, 그리고 다른 AI 시스템에서 생성된 합성 데이터를 사용하여 모델을 학습시켰습니다. 구글은 품질과 안전성을 위해 학습 데이터의 필터링을 수행하여 음란물, 폭력적인 자료, 그리고 아동 안전법을 위반하는 모든 요소를 제거했습니다. 학습은 JAX 및 ML Pathways 소프트웨어를 사용하는 구글의 TPU(텐서 프로세싱 유닛)에서 진행되었습니다.

이 모델을 간단히 테스트해 본 결과, 매우 유능하다는 것을 알 수 있었습니다. 평소처럼 스텔스 게임을 생성하는 코딩 테스트에서, 이 모델은 2D 환경 대신 3D 게임을 생성하는 최초의 모델이었습니다. 다른 테스트에서도 2D 버전을 제공했지만, 모두 기능적이고 빠릅니다.

이 접근 방식은 후속 질문과 제안을 공유하여 더 많은 상호 작용을 장려하는 ChatGPT나 Perplexity의 스타일을 따르지만, Google의 구현 방식은 훨씬 더 깔끔하고 유용합니다.

코드 생성 시, 인터페이스는 후속 프롬프트에서 도움이 되는 팁을 제공하여 사용자가 모델을 안내하여 더 나은 코드 생성, 버그 수정, 앱 로직, UI 이더리움 클래식(ETC) 개선할 수 있도록 지원합니다. 또한, 사용자는 코드를 배포하고 Gemini 기반 앱을 코딩할 수 있습니다.

전반적으로 이 모델은 코딩 작업에 특히 중점을 둔 것으로 보입니다. 창의성은 이 모델의 강점은 아니지만, 토큰 컨텍스트 창이 매우 크기 때문에 좋은 시스템 프롬프트와 예시를 통해 쉽게 안내할 수 있습니다.

Google DeepMind에서 공개한 제미니(Gemini) 3 모델 카드의 보관 버전 (모델의 설계, 용도, 성능 및 제한 사항에 대한 필수 정보를 제공하는 문서)에 따르면 제미니(Gemini) 3 Pro는 최대 64,000개의 토큰 출력을 생성할 수 있으며 2025년 1월을 지식 마감일로 정하고 있습니다. Google은 이 모델이 환각을 경험할 수 있으며 가끔 속도 저하나 시간 초과가 발생할 수 있다는 점을 인정했습니다.

현재 공식 모델 카드는 제공되지 않습니다.

앞서 언급했듯이 Google AI Studio는 현재 모든 사용자에게 제미니(Gemini) 3 Pro 무료 액세스를 제공하고 있습니다. Vertex AI와 제미니(Gemini) API도 이 모델을 지원합니다. 하지만 제미니(Gemini) 3 Pro는 아직 제미니(Gemini) 앱을 통해 제공되지 않으며, 제미니(Gemini) Pro 유료 구독자도 이용할 수 없습니다.

11월 출시된 버전은 구글을 Anthropic의 Claude Sonnet 4.5, Grok 4.1, 심지어 OpenAI의 GPT-5.1과도 경쟁하게 만들었습니다. 벤치마크 점수는 제미니(Gemini) 3 Pro가 추론 및 다중 모드 작업에서 우위를 점하고 있음을 보여주지만, 실제 성능은 사용 사례에 따라 다릅니다.

Google은 기존 서비스 약관에 따라 자사 클라우드 플랫폼을 통해 제미니(Gemini) 3 Pro를 배포했습니다. Google의 생성 AI 사용 금지 정책이 적용되어 위험한 활동, 보안 침해, 노골적인 성적 콘텐츠, 폭력, 증오심 표현 및 허위 정보 사용은 차단됩니다.

섹터:

디파이

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트