저자: 미아오 정(Miao Zheng)
8개월 동안 잠을 자고 있던 구글이 갑자기 폭탄선언을 내놓았습니다. 바로 제미니 3 프로입니다.
구글은 마침내 제미니 3 프로를 매우 갑작스럽고 "조용한" 방식으로 출시했습니다.
구글은 제미니 3 프로보다 앞서 나노 바나나 이미지 편집 모델을 출시해 화제를 모았지만, 받침대 모델 측면에서는 너무나 침묵을 지켰습니다.
지난 6개월 동안 모든 사람이 OpenAI의 새로운 움직임에 대해 논의하고 클로드의 코딩 분야에서의 지배력에 감탄했지만, 8개월 동안 버전 번호 업데이트가 없었던 제미니에 대해서는 아무도 언급하지 않았습니다.
인상적인 클라우드 업무 과 재무 보고서에도 불구하고, 핵심 AI 개발자 그룹 내에서 Google의 입지는 점차 약해지고 있습니다.
다행히도 직접 사용해 본 결과, Gemini 3 Pro는 실망스럽지 않았습니다.
하지만 아직 결론을 내리기에는 너무 이릅니다. AI 분야는 이미 오래전에 단순한 매개변수 수로 사용자를 위협하는 단계를 넘어섰습니다. 이제 모든 사람이 애플리케이션, 배포, 그리고 비용 절감에 집중하고 있습니다.
구글이 새로운 버전과 새로운 환경에 적응할 수 있을지는 아직 알 수 없습니다.
01
저는 Gemini 3 Pro에 한 문장으로 자신을 설명해 달라고 요청했고, Gemini 3 Pro는 이렇게 대답했습니다.
"세상에 내가 얼마나 똑똑한지 증명하기 위해 서두르는 대신, 나 자신을 더 유용하게 만드는 방법에 대해 생각하기 시작했습니다." — Gemini 3 Pro
LMArena 순위표에서 Gemini 3 Pro는 Elo 점수 1501점으로 1위를 차지하며 종합 역량 평가 부문 AI 모델 신기록을 세웠습니다. 이는 놀라운 성과이며, 울트라맨조차 축하 트윗을 남겼습니다.
수학 적성 시험에서 이 모델은 AIME 2025(미국 초대 수학 경시대회) 코드 실행 모드에서 100%의 정확도를 달성했습니다. GPQA 다이아몬드 과학 지식 시험에서 Gemini 3 Pro는 91.9%의 정확도를 달성했습니다.
MathArenaApex 수학 경시대회 결과에 따르면 Gemini 3 Pro는 23.4%의 점수를 획득한 반면, 다른 주류 모델은 대체로 2% 미만의 점수를 받았습니다. 또한, Humanity's LastExam 테스트에서 해당 모델은 도구를 사용하지 않고도 37.5%의 점수를 획득했습니다.
이번 업데이트에서 Google은 "바이브코딩"이라는 코드 생성 기능을 도입했습니다. 이 기능을 사용하면 사용자가 자연어로 요구 사항을 설명하면 시스템이 해당 코드와 애플리케이션을 자동으로 생성합니다.
Canvas 프로그래밍 환경에서 수행한 테스트에서 사용자가 "속도 조절이 가능한 전기 선풍기 만들기"를 설명한 후, 시스템은 약 30초 이내에 회전 애니메이션, 속도 제어 슬라이더, 켜기/끄기 버튼을 포함한 전체 코드를 생성했습니다.
공식 사례 연구에는 핵융합 과정의 시각적 시뮬레이션도 포함되었습니다.
상호작용 측면에서 Gemini 3 Pro는 "생성 UI" 기능을 추가합니다. 텍스트 답변만 반환하는 기존 AI 비서와 달리, 이 시스템은 질의 내용을 기반으로 맞춤형 인터페이스 레이아웃을 자동으로 생성할 수 있습니다.
예를 들어, 사용자가 양자 컴퓨팅과 관련된 질문을 하면 시스템은 개념 설명, 동적 다이어그램, 관련 논문 링크 등이 포함된 대화형 인터페이스를 생성할 수 있습니다.
시스템은 동일한 질문에 대해 대상에 따라 서로 다른 인터페이스 디자인을 생성합니다. 예를 들어, 어린이와 성인에게 동일한 개념을 설명할 때 서로 다른 표현 방식이 사용됩니다. 어린이용 인터페이스는 더 귀엽게, 성인용 인터페이스는 더 간결하고 명확하게 표현됩니다.
Google Labs에서 제공하는 실험적 기능인 시각적 레이아웃은 이 인터페이스의 적용을 보여주며, 사용자는 이미지, 모듈, 조정 가능한 UI 요소를 포함하는 잡지 스타일의 뷰 레이아웃을 얻을 수 있습니다.
이번 릴리스에는 현재 실험 단계에 있는 제미니 에이전트(Gemini Agent)라는 지능형 에이전트 시스템도 포함되어 있습니다. 이 시스템은 여러 단계의 작업을 수행하고 Gmail, Google 캘린더, 미리 알림과 같은 Google 서비스에 연결할 수 있습니다.
받은 편지함 관리 기능을 통해 시스템은 이메일을 자동으로 필터링하고, 우선순위 태그 지정하고, 답장을 작성할 수 있습니다. 여행 계획 기능도 있습니다. 사용자가 목적지와 대략적인 날짜를 입력하기만 하면 시스템이 캘린더를 조회하여 항공편과 호텔 옵션을 검색하고 여정을 추가합니다. 이 기능은 현재 미국 내 Google AI Ultra 구독자에게만 제공됩니다.
멀티모달 처리 측면에서 Gemini 3 Pro는 텍스트, 이미지, 오디오 및 비디오 입력을 지원하는 희소 하이브리드 전문가 아키텍처를 기반으로 합니다. 이 모델의 컨텍스트 윈도우는 100만 개의 토큰으로, 긴 문서나 비디오 콘텐츠를 처리할 수 있습니다.
캐나다 로리에 대학의 역사학 교수인 마크 험프리스가 실시한 테스트에 따르면, 이 모델은 18세기의 손으로 쓴 사본을 인식할 때 문자 오류율이 0.56%로, 이전 버전에 비해 50~70% 감소한 것으로 나타났습니다.
Google은 훈련 데이터에는 공개적으로 이용 가능한 웹 문서, 코드, 이미지, 오디오, 비디오 콘텐츠가 포함되어 있으며, 훈련 후 단계에서는 강화 학습 기술이 사용되었다고 밝혔습니다.
Google은 복잡한 추론 작업을 위해 특별히 설계된 Gemini 3 Deep Think라는 최적화된 버전도 출시했습니다. 이 모드는 현재 보안 평가를 받고 있으며, 향후 몇 주 안에 Google AI Ultra 구독자에게 출시될 예정입니다.
Google 검색의 AI 모드에서는 사용자가 "생각" 탭을 클릭하여 추론 과정을 확인할 수 있습니다. 딥 씽크 모드는 일반 모드보다 더 많은 분석 단계를 거쳐 답변을 생성합니다.
공식 정보 외에도 Gemini 3 Pro와 ChatGPT-5.1을 비교했습니다.
첫 번째 비교는 생성된 이미지입니다.
프롬프트: iPhone 17 이미지를 생성해 주세요
채팅GPT-5.1
제미니 3 프로
주관적으로 말해서, ChatGPT-5.1이 내 요구 사항을 더 잘 충족하므로 이 라운드에서는 ChatGPT-5.1이 승리합니다.
두 번째 비교는 에이전트 수준의 관점에서 두 회사를 비교하는 것입니다.
힌트: WeChat 공개 계정 "알파벳 랭킹"을 조사해 보시고, 이 계정의 품질에 대해 댓글을 남겨 주세요.
GPT-5.1
제미니 3 프로
개인적으로는 Gemini 3 Pro의 해석을 선호하지만, 너무 과장된 것 같습니다. ChatGPT-5.1은 순위에서 몇 가지 단점을 드러내며, 더 객관적이고 진실된 결과를 제공합니다.
마지막으로, 현재 모든 대규모 모델에 가장 중요한 측면은 코딩 능력입니다.
제가 선택한 프로젝트는 최근 GitHub에서 높은 평가를 받은 LightRAG입니다. 그래프 구조를 통합하여 맥락 인식과 효율적인 정보 검색을 향상시킴으로써 검색 성능을 개선하고, 결과적으로 정확도와 응답 시간을 향상시킵니다. 프로젝트 주소: https://github.com/HKUDS/LightRAG
프롬프트: 이 프로젝트에 대해 말해주세요.
GPT-5.1
제미니 3 프로
한편, Gemini 3 Pro는 업계 전문가들로부터도 높은 평가를 받았습니다.
02
Gemini 3 Pro는 매우 조용히 출시되었지만, Google은 실제로 오랫동안 이에 대한 암시를 해왔습니다.
구글의 3분기 실적 발표에서 구글 CEO 순다르 피차이는 "제미니 3 프로는 2025년 어느 때쯤 출시될 것"이라고 밝혔습니다. 구체적인 날짜나 자세한 내용은 밝히지 않았지만, 그는 기술 업계에서 큰 마케팅 사가를 시작했습니다.
구글은 AI 커뮤니티 전체에 높은 경계 태세를 유지하라는 신호를 보내왔지만, 구체적인 출시 일정을 밝히기를 계속 거부해 왔습니다.
10월부터 일련의 "실수 유출"이 표면화되기 시작했습니다. 10월 23일, 달력이 유포되기 시작했는데, 11월 12일 "Gemini 3 Pro 출시"를 알리는 내부 달력 스크린샷이 온라인에서 빠르게 퍼졌습니다.
게다가 눈이 예리한 개발자라면 Vertex AI의 API 문서에서 "gemini-3-pro-preview-11-2025"라는 문구를 발견했을 겁니다.
이후 Reddit과 X에 다양한 스크린샷이 나타나기 시작했습니다. 일부 사용자는 Gemini Canvas 도구에서 새로운 모델을 봤다고 주장했고, 다른 사용자는 모바일 앱의 특정 버전에서 특이한 모델 식별자를 발견했습니다.
그러자 다음과 같은 테스트 데이터가 소셜 미디어에 퍼지기 시작했습니다.
이런 "유출"은 우연한 일처럼 보일지 몰라도 실제로는 신중하게 조작된 서곡입니다.
각각의 유출 정보는 Gemini 3 Pro의 핵심 기능을 완벽하게 보여주며, 각각의 논의는 기대감을 한 단계 끌어올립니다. 그러나 구글 공식 계정은 흥미로운 입장을 취하고 있습니다. 커뮤니티 토론을 리트윗하고, "곧 출시"와 같은 문구를 사용하여 기대감을 고조시키고, 심지어 구글 AI 랩의 고위 임원들조차 예상 출시일에 대한 트윗에 "생각하는 듯한" 이모티콘 두 개를 붙여 답글을 달았지만, 정확한 날짜는 밝히지 않았습니다.
거의 한 달간의 기다림 끝에 구글이 마침내 새로운 제미니 3 프로를 공개했습니다. 제미니 3 프로는 강력한 성능을 자랑하지만, 구글의 업데이트 빈도는 다소 실망스럽습니다.
올해 3월, 구글은 제미니 2.5 프로의 프리뷰 버전을 출시했고, 이어서 제미니 2.5 플래시와 같은 파생 프리뷰 버전을 출시했습니다. 제미니 3 프로가 출시되기 전까지 제미니 시리즈는 이 기간 동안 버전 번호 업그레이드를 받지 못했습니다.
하지만 구글의 경쟁자들은 제미니를 기다리지 않을 것입니다.
OpenAI는 8월 7일에 GPT-5를 출시했고, 11월 12일에 GPT-5.1로 업그레이드했습니다. 이 기간 동안 OpenAI는 구글의 핵심 시장을 직접 겨냥한 자체 AI 브라우저인 Atlas도 출시했습니다.
Anthropic의 반복 속도는 훨씬 더 잦습니다. Claude 3.7 Sonnet(최초의 하이브리드 추론 모델)은 2월 24일에 출시되었고, Claude Opus 4와 Sonnet 4는 5월 22일에 출시되었으며, Claude Opus 4.1은 8월 5일에 출시되었고, Claude Sonnet 4.5는 9월 29일에 출시되었으며, Claude Haiku 4.5는 10월 15일에 출시되었습니다.
이러한 일련의 공격은 구글을 다소 예상치 못하게 만들었지만, 지금까지 구글은 압력을 견뎌낸 것으로 보입니다.
03
구글이 제미니 3 프로를 업데이트하는 데 8개월이 걸린 가장 큰 이유는 아마도 인사 변화 때문일 것입니다.
2025년 7월에서 8월경, 마이크로소프트는 구글을 상대로 치열한 인재 공세를 펼쳐, DeepMind의 핵심 전문가와 임원 20명 이상을 성공적으로 영입했습니다.
여기에는 DeepMind의 제품 담당 수석 이사인 데이브 시트론과 Google의 가장 중요한 모델인 Gemini의 핵심 엔지니어링 리더 중 하나인 Gemini의 엔지니어링 부사장인 아마르 수브라마냐가 포함됩니다.
반면, 구글 나노 바나나 팀은 구글이 제미니 2.5 프로 출시 후 오랫동안 AI 생성 이미지 분야에서 어려움을 겪었고, 이로 인해 기본 모델의 업데이트가 늦어졌다고 밝혔습니다.
Google은 이미지 생성 분야의 세 가지 주요 과제(문자 일관성, 컨텍스트 내 편집, 텍스트 렌더링)를 극복해야만 받침대 모델의 성능을 향상시킬 수 있다고 생각합니다.
나노 바나나 팀은 이 모델이 "아름답게 그림을 그릴 수 있을 뿐만 아니라", 더 중요한 것은 "인간의 언어를 이해하고" "인간이 제어할 수 있다"고 밝혔습니다. 이를 통해 AI가 생성한 이미지가 실제로 상업적으로 활용될 수 있는 단계에 진입할 수 있게 됐습니다.
지금 Gemini 3 Pro를 돌이켜보면, 괜찮은 답변이지만, 이 빠르게 변화하는 AI 전장에서 그저 버티는 것만으로는 더 이상 충분하지 않습니다.
구글이 지금 이 시점에 보고서를 제출하기로 결정한 만큼, 가장 까다로운 심사위원들, 즉 경쟁사에 의해 취향이 훼손된 사용자와 개발자들을 대면 준비를 해야 합니다. 앞으로 몇 달은 모델 매개변수 경쟁이 아니라 생태계 통합 역량을 놓고 벌어지는 치열한 경쟁이 될 것입니다. 이 코끼리 같은 구글은 춤추는 법을 배워야 할 뿐만 아니라, 다른 누구보다 더 빨리 춤추어야 합니다.





