구글이 드디어 본격적인 기술력을 발휘하는 것으로 보입니다. 제미니 3.5 프로가 처음으로 온라인에 유출되었으며, GPT-5.5에 필적하는 프로그래밍 기능을 자랑합니다.

36氪

이 기사는 기계로 번역되었습니다

원문 표시

방금 제미니 3.5가 예정보다 일찍 유출되었습니다!

사용자 Lentils의 최신 소식에 따르면, "카푸치노"라는 코드명을 가진 제미니 3.5 프로 체크포인트의 생산이 시작되었습니다.

불과 몇 시간 전까지만 해도 제미니 3.2라는 소문이 돌았지만, 예상치 못하게 제미니 3.5로 바뀌었습니다.

구글은 명명 규칙에서 3.2에서 3.5로 한 세대를 건너뛰면서 I/O에 대한 더 큰 이야기를 전달하고자 하는 것이 분명합니다.

제미니 주요 업데이트: 구글이 킬러 앱을 공개했습니다.

바로 전날, 악명 높은 유출 업체가 첫 번째 생산분을 공개했습니다.

하나는 듀얼쇼크 4 컨트롤러의 분해도를 보여주는 인터랙티브 청사진이고, 다른 하나는 자전거를 탄 펠리컨의 벡터 일러스트레이션으로, 프레임 색상, 조명, 헬멧, 바구니 내용물, 페달링 속도를 실시간으로 변경할 수 있는 7D 맞춤 패널이 포함되어 있습니다.

스크린샷을 보면, 이것은 더 이상 단순한 SVG 파일이 아니라 prompt 명령어로 생성된 완전한 대화형 웹 애플리케이션입니다!

Abacus.AI의 CEO인 빈두 레디는 더욱 충격적인 데이터를 공개했습니다.

3.2 Flash는 인코딩 및 추론에서 GPT-5.5의 92% 성능을 달성하지만 비용은 15~20배 저렴합니다.

또한 구글의 완전히 새로운 최고 성능 에이전트인 "제미니 스파크"도 공개되었습니다.

보시다시피, 이 시스템은 24시간 내내 대기하면서 이메일 관리와 작업 실행을 지원할 뿐만 아니라, 사용자가 요청하지 않아도 자동으로 주문까지 처리해 줄 수 있습니다.

하지만 바로 이 순간, 알렉스 히스의 단독 폭로가 상황에 찬물을 끼얹었다.

새로운 제미니의 성능은 기껏해야 오픈아이얼의 GPT-5.5와 비슷한 수준입니다...

하나의 문제에 네 가지 해결책이 있습니다. 쌍둥이자리의 "게으름"이 고쳐졌습니다.

먼저 좋은 소식부터 살펴보겠습니다.

이전에는 Gemini가 SVG를 생성할 때 커뮤니티에서 가장 흔한 불만은 단순히 "게으르다"는 것이었습니다. 프롬프트가 주어지면 형식적인 결과만 생성했기 때문입니다.

하지만 이번에는 다릅니다.

사용자 렌틸스는 간단한 힌트만으로 제미니에게 각기 다르고 매우 상세한 로봇 SVG 이미지 네 개를 제공했습니다.

같은 시기에 유출된 3.5인치 플래시 메모리 또한 이러한 추세를 뒷받침합니다.

LM Arena의 익명 벤치마킹 결과에 따르면 Flash가 SVG 생성, 대화형 3D 인코딩 및 애니메이션 처리에서 3.1 Pro를 능가한 것으로 나타났습니다.

즉, 구글의 정제 및 희소화 기술은 효과를 발휘하여 최첨단 모델을 품질 저하 없이 경량 버전으로 압축하고 있습니다.

Google Agent는 이메일을 관리하고 요금을 결제하는 등 놀라울 정도로 대담한 기능을 제공합니다.

같은 날 발생한 또 다른 주요 유출 사건은 "제미니 스파크 베타"였습니다.

유출된 정보에 따르면 Spark는 "24시간 내내 대기하는 일상적인 AI 에이전트"로 자리매김하고 있습니다.

연중무휴 24시간 작동하는 AI 에이전트가 이메일 수신함 관리, 온라인 작업 실행 및 여러 단계로 구성된 워크플로 관리를 지원합니다.

Spark의 데이터 소스 목록은 놀라울 정도로 방대합니다.

연결된 Google 앱, 스킬 모듈, 채팅 기록, 예약된 작업, 로그인한 웹사이트, 개인 인텔리전스 및 위치 정보가 포함됩니다.

Gemini는 작업을 완료하기 위해 귀하의 이름, 연락처 정보, 파일, 선호 사항 및 기타 정보를 제3자와 공유합니다.

또한, 세션 연속성을 유지하기 위해 시스템은 로그인 자격 증명 및 원격 코드 실행 데이터를 포함한 원격 브라우저 데이터도 저장합니다.

하지만 Spark는 민감한 작업을 수행하기 전에 권한을 요청하도록 설계되었지만, "사용자 정보를 공유하거나 동의 없이 구매를 완료할 수도 있다"는 점에 유의해야 합니다.

즉, 사용자에게 묻지 않고 주문을 하거나 정보를 공유할 수도 있다는 뜻입니다.

Spark는 원래 Google Agent(코드명 "Remy")의 업그레이드 버전으로, 이전에는 AI Ultra 구독자에게만 제공되었습니다.

Remy에서 Spark로 진화하면서 Gemini의 Agent는 "단일 기능"에서 "연중무휴 24시간 디지털 라이프 컨시어지"로 발전했습니다.

이는 Anthropic의 곧 출시될 관리형 에이전트 Conway와 OpenAI가 이미 출시한 연중무휴 24시간 에이전트 플랫폼과 직접적으로 경쟁합니다.

6개월 전만 해도 그들은 정상에 있었지만, 6개월 후에는 선두권에도 발이 묶였습니다.

좋은 소식은 여기까지입니다.

알렉스 히스가 입수한 여러 소식통의 확인에 따르면, 다음 주 화요일에 출시될 새로운 제미니는 GPT-5.5 범위에 속할 가능성이 높으며, 이는 미토스보다 상당히 뒤떨어지는 성능입니다.

당시 새로 출시된 제미니 3는 LMARaena 1501 Elo 프로세서를 탑재하여 주요 순위표에서 거의 모든 부문에서 1위를 휩쓸었습니다.

6개월 후, GPT-5.5, Opus 4.7, 그리고 Mythos가 출시되면서 판도는 완전히 바뀌었습니다.

영국 AI 보안 연구소의 평가에 따르면, Mythos는 두 가지 사이버 보안 테스트 범위를 동시에 통과한 최초의 모델이며, GPT-5.5는 한 가지 범위만 통과했습니다.

AISI는 심지어 자사의 평가 프레임 Mythos의 역량에 뒤처지고 있음을 인정하기도 했습니다.

구글로 돌아가서, 사용자 Fandu가 발견한 최신 모델 선택기 인터페이스에 따르면 새로운 제미니는 MCP와 같은 타사 도구 통합을 기본적으로 지원할 가능성이 높으며, 사고 모드 또한 완전히 재설계될 것으로 보입니다.

보시다시피, 3.1 Flash-Lite, 3 Flash, 3.1 Pro와 같은 잘 알려진 모델 외에도 "MCP 도구 테스트"라는 새로운 카테고리가 추가되었습니다. 이는 "MCP 도구 테스트에 사용할 수 있는 모델"을 의미합니다.

사고 방식 또한 기존의 독립적 사고 방식에서 두 가지 레벨(표준형(대부분의 문제에 적합)과 확장형(복잡한 문제 해결용))로 나뉜 전역적 스위치 방식으로 변경되었습니다.

프로그래밍은 딥마인드에게 가장 큰 불안감을 안겨주는 전쟁터입니다.

히스의 폭로는 특히 프로그래밍 측면에 관해 매우 강경한 어조로 이루어졌습니다.

그는 딥마인드가 특히 프로그래밍 능력 면에서 따라잡아야 한다는 점에서 상당한 압박에 직면해 있다고 말했다.

목표는 분명합니다. 바로 Anthropic입니다. 지난 1년 동안 Claude는 개발자들 사이에서 가장 먼저 떠오르는 선택지로 확고히 자리매김했습니다.

새로운 제미니 위성에는 프로그래밍 개선 사항이 포함될 예정이지만, 히스의 소식통 중 누구도 그것이 질적인 변화를 가져올 것이라고 생각하지 않습니다.

구글의 AI 프로그래밍 플랫폼인 안티그래비티는 사내에서 널리 사용되고 있지만, 외부 시장 진출에는 실패했습니다.

4개월 만에 개발자 채택률 6%는 IDE로서는 느린 속도는 아니지만, Claude Code나 Codex의 성장세에 비하면 상당히 느린 편입니다.

문제가 어디에 있나요?

XDA 월간 리뷰에서 동일한 작업을 수행하는 세 가지 도구를 테스트했습니다.

클로드 코드는 복잡한 창의적 힌트를 첫 시도에 정확하게 이해했습니다. 반면 안티그래비티의 결과물은 마이크로소프트 페인트로 그린 낙서와 같았습니다.

게다가 Antigravity의 가격 전략 또한 개발자들에게 골칫거리입니다.

구글은 무료 미리보기부터 크레딧 시스템에 이르기까지 여러 차례 가격 모델을 조정해 왔으며, 크레딧이 소진되었을 때 알림을 받지 못한다는 불만이 커뮤니티 포럼에서 끊이지 않고 제기되어 왔습니다.

하지만 가장 중요한 점은 인공지능 프로그래밍이 이제 틈새시장을 완전히 벗어났다는 것입니다.

클로드 코워크(Claude Cowork)든 오픈아이(OpenAI)의 코덱스(Codex)든, 둘 다 코딩을 모르는 사람도 쉽게 사용할 수 있어서 놀라울 정도로 원활하게 작동합니다.

제품 관리자는 자연어를 사용하여 요구 사항을 설명하고 바로 작동하는 프로토타입을 얻습니다. 그러면 디자이너는 Figma 초안을 제출하고 프런트엔드 코드를 받습니다.

하지만 지금까지 구글의 어떤 제품도 이러한 논의에 참여할 수 없었습니다.

하지만 하이더의 발언은 다른 관점을 제시했다.

구글은 다른 회사들과 같은 방식으로 경쟁하여 승리하려는 것이 아닐 수도 있습니다. 그들의 더 큰 목표는 시간이 걸릴 더욱 강력한 멀티모달 시스템을 구축하는 것입니다.

ASI의 추진력은 세 회사 모두가 동시에 가속 페달을 밟는 것과 같습니다.

비록 해당 모델이 따라잡을 수는 없지만, 구글은 수십억 건의 배포가 가능한 유통 포털과 24시간 연중무휴 상담원을 보유하고 있습니다.

Spark가 배포되면 사용자의 이메일, 캘린더 일정, 쇼핑 데이터 및 검색 데이터가 차세대 Gemini 학습에 반영됩니다.

이는 OpenAI와 Anthropic이 따라하기 어려운 전략입니다.

하지만 경쟁업체들은 가만히 있지 않았습니다.

바로 어제, OpenAI는 Codex에 UltraFast 모드를 추가하여 속도를 2~3배 향상시켰고, 30일 이내에 전환하는 기업에 2개월 무료 서비스를 제공하는 지원 캠페인도 시작했습니다. 불과 3시간 만에 2,000명의 개발자가 참여했습니다.

Anthropic은 또한 Opus 4.7 Fast 모드를 출시하여 Claude Code의 크레딧 한도를 50% 증가시켰습니다.

이러한 보조금 경쟁은 개발자들을 확보하기 위한 경쟁처럼 보일 수 있지만, 그 이면에는 훨씬 더 심오한 논리가 숨어 있습니다.

GPT-5.6의 개발은 GPT-5.5의 깊은 관여 하에 이루어졌을 가능성이 매우 높습니다. AI가 작성한 코드는 다시 AI 학습에 반영되고, 프로그래밍 도구 사용자를 통제하는 자가 이 가속기 좌우합니다.

세 회사는 모두 동시에 각기 다른 세 방향으로 속도를 내고 있었다.

OpenAI는 3주마다 새 버전을 출시하는 빠른 반복 속도로 경쟁사들을 압도하고 있습니다. Anthropic은 모델 품질로 전설적인 명성을 얻었고, Mythos는 최첨단 기술의 기준을 새롭게 정의하고 있습니다. 구글은 배포 및 에이전트 기반 포위 전략을 통해 10억 명의 스마트폰에 AI를 탑재했습니다.

누구도 속도를 늦추지 않고 있습니다. ASI로 이어지는 관성계는 이미 회전하기 시작했습니다.