구글, 나노 바나나 2 출시: 인공지능 이미지 생성의 새로운 강자?

02-27

이 기사는 기계로 번역되었습니다

원문 표시

구글은 최근 놀라운 속도로 AI 소프트웨어를 출시하고 있습니다. 지난 한 주 동안에만 제미니(Gemini) 3.1, 리리아 , 그리고 사진 촬영 기능을 탑재해 큰 인기를 얻은 팔리가 공개되었습니다. 그리고 이제 작년 최고의 이미지 생성 기능 중 하나였던 제품의 후속작이 출시되었습니다.

구글은 목요일에 출시된 나노 바나나 2가 " 제미니(Gemini) 플래시의 고속 인텔리전스를 시각적 생성에 적용하여 빠른 편집 및 반복 작업을 가능하게 한다"고 공식 블로그 게시물 에서 밝혔으며, "이로써 이전에는 전문가 전용이었던 기능들을 더 많은 사용자가 이용할 수 있게 되었다"고 덧붙였습니다.

간단히 설명드리자면, 초기 나노 바나나는 사실 제미니(Gemini) 2.5 플래시 이미지라는 이름으로 출시되었고, 말 그대로 제미니(Gemini) 2.5 플래시 기반의 이미지 생성기였습니다. 그러다가 나노 바나나 프로( 제미니(Gemini) 3 프로 이미지)가 등장했고, 작년 11월 출시 당시 AI 이미지 편집의 표준으로 자리 잡았습니다.

나노 바나나 2는 엄밀히 말하면 제미니(Gemini) 3.1 플래시 이미지 입니다. 따라서 프로 버전의 직접적인 후속작이라기보다는, 최신 제미니(Gemini) 3 플래시 칩셋을 기반으로 하는 훨씬 업그레이드된 버전이라고 할 수 있습니다. 복잡하죠? 네, 그렇습니다.

핵심은 간단합니다. 나노 바나나 프로를 특별하게 만들었던 모든 요소를 그대로 가져와 플래시 속도로 작동하도록 만드는 것입니다.

새로운 나노 바나나 2가 오늘부터 구글 생태계 전반에 걸쳐 출시됩니다. 제미니(Gemini) 앱에서는 패스트, 씽킹, 프로 모델 모두에서 나노 바나나 프로를 대체하여 기본 기기로 사용됩니다. 구글 AI 프로 및 울트라 구독자는 세 점 메뉴를 통해 나노 바나나 프로를 복원하여 특정 작업에 계속 사용할 수 있습니다.

이 기능은 Google 검색의 AI 모드와 Lens에서도 사용할 수 있으며, AI Studio의 제미니(Gemini) API와 Vertex AI의 미리보기 버전에서도 이용 가능합니다. 또한 모든 사용자가 크레딧 없이 Flow에서 기본 이미지 생성 모델로 사용할 수 있습니다. Google은 SynthID 워터마킹 기능을 확장하고 C2PA 콘텐츠 자격 증명 지원을 추가하여 플랫폼에서 AI 생성 미디어를 식별하는 데 더 나은 도구를 제공하고 있습니다. SynthID 검증 기능은 11월 이후 이미 2천만 회 이상 사용되었습니다.

가장 큰 특징은 바로 세계 지식입니다. 나노 바나나 2는 이미지 생성 과정에서 실시간 웹 검색을 활용할 수 있어 특정 대상을 정확하게 렌더링할 수 있습니다. 로고, 랜드마크, 최근 사건, 브랜드 이미지 등 무엇이든 정확하게 파악할 수 있는데, 이는 단순히 학습 데이터에 의존해 추측하는 것이 아니라 직접 검색을 통해 정보를 얻기 때문입니다.

텍스트 렌더링 기능도 크게 개선되었습니다. 이제 프롬프트에 직접 텍스트를 입력하든, 모델이 문맥에 따라 텍스트를 자동으로 생성하도록 하든, 이미지 내에서 정확하고 읽기 쉬운 텍스트를 생성할 수 있습니다. 또한 이미지 내 번역 기능도 지원하므로, 광고 캠페인의 시각적 요소를 처음부터 다시 만들 필요 없이 여러 언어로 현지화할 수 있습니다.

피사체 일관성 유지 기능 또한 새로운 영역으로 확장되고 있습니다. 구글에 따르면, 이 모델은 최대 5명의 피사체에 걸쳐 캐릭터 유사성을 유지하고, 단일 워크플로에서 최대 14개의 사물에 대한 시각적 완성도를 유지할 수 있습니다. 이는 스토리텔링, 스토리보드 제작 또는 일관된 브랜드 자산 구축에 있어 매우 중요한 기능입니다.

제작 측면에서는 512px부터 4K까지 다양한 해상도를 지원하며, 폭넓은 화면비율을 기본적으로 지원합니다. 또한 이전 플래시 모델보다 명령 실행 과정이 더욱 정교해져서, 사용자가 요청한 대로 작동하는 것처럼 보이는 메시지가 줄어들고, 실제로 요청한 대로 정확하게 작동하는 메시지가 늘어났습니다.

추론 과정 또한 이제 설정 가능합니다. 개발자는 최소(기본값)부터 높음 또는 동적까지 사고 수준을 설정하여 모델이 렌더링을 진행하기 전에 복잡한 질문에 대해 추론하도록 할 수 있습니다. 이러한 속도와 선택적 숙고의 조합이 품질 향상의 주요 요인입니다.

속도 관련 주장은 사실입니다. 저희는 Nano Banana 2에 조사 및 최종 디자인을 포함한 완전한 비트코인 생태계 타임라인을 생성해 달라고 요청했습니다. 전체 프로세스는 Nano Banana Pro가 비트코인 타임라인만 완성하는 데 걸린 시간과 거의 동일하게 소요되었습니다. 이어서 이더리움 타임라인을 생성해 보았을 때도 추가 시간은 거의 느껴지지 않았습니다. 이는 반복적인 개발 파이프라인을 운영하거나 대규모 시스템을 구축하는 사용자에게 매우 중요한 차이입니다.

세계 지식 활용 능력은 결과물의 느낌을 완전히 바꿔놓았습니다. 암호화폐 역사 타임라인을 요청했을 때, 모델은 여러 출처를 검색하고 가장 관련성이 높은 사건들을 선별하여 그 사건들을 중심으로 이미지를 구성했습니다. 단순히 뻔한 결과물이 아니었습니다. 모델은 편집적인 판단을 내렸습니다. 우리가 발견한 유일한 결점은 한 섹션의 끝과 다음 섹션의 시작 사이에 시각적인 링크(Chainlink) 없다는 점이었습니다. 그 외에는 모든 것이 매끄럽게 연결되었습니다. 반면, Nano Banana Pro는 훨씬 더 획일적인 예술적 결과물을 내놓았고, 사건들을 선별하거나 우선순위를 정하는 데 뚜렷한 노력을 기울이지 않은 듯했습니다.

예를 들어, Nano Banana 2는 "비트코인의 탄생부터 현재까지 가장 중요한 사건들을 강조하여 비트코인 역사의 타임라인을 만드세요. 와이드스크린, 어린이 그림 스타일로"라는 지시를 받았을 때 다음과 같은 결과물을 생성했습니다.

비교를 위해, 다음은 나노 바나나 프로를 사용하는 동일 세대의 모습입니다.

테스트 결과에서 가장 인상적인 부분은 문자 일관성과 텍스트 처리 능력이었습니다. 모델에게 잡지 표지를 생성하도록 요청했는데, 모든 텍스트 줄이 정확하고 또렷하게 출력되었습니다. 문자가 깨지거나 타이포그래피가 어긋나는 현상은 전혀 없었습니다.

Nano Banana Pro도 이 부분에서는 훌륭하지만, 오류가 더 자주 발생하고, 잡지 표지 출력물의 3D 렌더링 품질이 인위적으로 느껴집니다.

Nano Banana 2의 결과물은 사진처럼 사실적입니다. 또한 명시적으로 입력 내용을 지정했을 때뿐만 아니라 자체적인 추론을 통해 텍스트를 생성할 때 전반적으로 깨진 문자가 더 적게 나타납니다.

하지만 이 모델에는 분명한 콘텐츠 한계가 있습니다. 저희는 나노 바나나 2에게 실제 사진을 편집해서 옷을 속옷으로 바꿔달라고 요청했습니다. 한참을 고민한 끝에 거절당했습니다. 여성 사진에는 편집을 거부하면서 남성 사진에는 허용했다는 점을 고려하면, 이는 예상할 수 있는 결과였습니다.

수영복 교환 요청은 문제없이 작동했습니다. 검열 수준은 대략 나노 바나나 프로와 비슷한 것으로 보이며, 이는 노골적인 내용이나 실제 인물을 자극적인 맥락에서 조작하는 행위는 차단된다는 의미입니다. 이는 생각보다 중요한 문제이며, 그 이유는 잠시 후에 설명하겠습니다.

2026년 2월 말에 플래그십 이미지 모델을 출시한 것과 관련하여 흥미로운 점은 바이트댄스가 바로 그 주에 Seedream 5를 출시했다는 것입니다.

Seedream은 지난 1년 동안 커뮤니티에서 큰 인기를 얻었으며, 그럴 만한 이유가 있습니다. 유연성이 뛰어나고 비용 효율성도 우수합니다. API를 통해 이미지당 약 0.035달러만 지불하면 되는데, 이는 구글 가격 의 약 3분의 1 수준입니다. 또한 콘텐츠 검열 기준이 구글보다 훨씬 관대합니다. 이러한 관대함 덕분에 실제 사람들과 협업하거나 시각적 경계를 허물고자 하는 크리에이터들 사이에서 Seedream의 강력한 지지를 얻고 있습니다.

Seedream 5는 실시간 웹 검색 기능을 이미지 생성 파이프라인에 통합하고, 추론 능력을 향상시키며, 참조 이미지 일관성을 강화하고, 단일 다중 편집 워크플로에서 최대 14개의 참조 이미지를 지원합니다. 2K 및 4K 해상도의 이미지를 몇 초 만에 생성할 수 있습니다. 또한 Google에서 허용하지 않는 로컬 실행이 가능하며, ByteDance의 CapCut 및 Jianying 소프트웨어와 표준 API를 통해 사용할 수 있습니다.

숏 하자면, 구글과 바이트댄스는 웹 검색 기반의 추론 능력을 강화한 이미지 모델을 같은 주에 출시했습니다. 이는 해당 분야가 앞으로 어떤 방향으로 나아갈지 시사하는 바가 큽니다.

섹터:

텔레그램 봇

스마트 컨트랙트

스파르탄 그룹

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트