현지 시간 3월 25일, OpenAI는 GPT-4o와 Sora의 중요한 업데이트를 발표했으며, 그중 주목할 만한 새로운 기능은 완전히 새로운 텍스트-이미지 생성 모델이었습니다.
생방송에서 올트먼은 GPT-4o의 완전히 새로운 네이티브 이미지 생성 기능을 직접 시연했으며, 그 결과는 상당히 훌륭했습니다.
간단히 말해, 해당 이미지 생성기는 기존 GPT-4o 모델을 기반으로 하며, 이미지와 텍스트를 동시에 이해할 수 있고 프롬프트 지시를 완벽하게 따를 수 있어 사용자에게 매우 적합한 결과를 만들어냅니다.
처음에는 여러 전문가들이 이 모델로 매우 사실적인 사진을 생성했는데, 그 사실감은 마치 현실과 같았습니다.
하지만 사람들이 이 모델로 만화를 생성하기 시작하면서 상황은 이상한 방향으로 흘러가기 시작했습니다. 네티즌들은 "지브리 스타일"(우리가 잘 아는 미야자키 하야오의 화풍)로 "세계적인 명화"들을 복제하기 시작했습니다.
처음에는 네티즌들이 GPT-4o로 일론 머스크, 트럼프 등 유명인들을 다시 그렸고, OpenAI CEO 샘 올트먼이 그의 새 프로필 사진을 비슷한 스타일로 만든 후에는 네티즌들이 다양한 이미지를 ChatGPT에 업로드하고 새로운 스타일로 다시 만들어달라고 요청했습니다.
주목할 만한 점은, 이번에 OpenAI가 마침내 문을 활짝 열어 무료 사용자들도 이용할 수 있게 되어 이러한 "바이럴 확산"을 촉발했다는 것입니다.
스타일 측면에서 일본 지브리 스튜디오의 애니메이션은 수채화를 기반으로 하며, 수채화의 번짐 효과를 융합해 화면의 색채 풍부함과 몽환적인 느낌을 줍니다. 또한, 해당 스튜디오의 작품은 일반적으로 "고급 그레이"를 기반으로 하여 시각적 공격성을 낮추면서 고채도로 색채의 생동감과 자연스러움을 유지해 감각적으로 매우 편안하고 어두운 부분의 디테일도 선명합니다.
다시 말해, 지브리 스타일은 애니메이션의 미학을 가지면서도 디테일을 놓치지 않아 많은 그림 대가들도 이러한 화풍을 잡기 어려웠고, 과거의 일부 그림 AI는 더욱 그러했습니다.
전문 미디어에서 현재 유행하는 몇 가지 AI 이미지 생성기를 비교했는데, 여기에는 구글의 제미니(Gemini), xAI의 그록(Grok), Playground.ai의 이미지 생성기가 포함되었으며, 이들이 지브리 스튜디오의 스타일을 얼마나 잘 모방할 수 있는지 테스트했습니다. 최종 결과, OpenAI의 새 이미지 생성기만이 이 스타일을 정확하게 복제할 수 있었습니다.
하지만 네티즌들의 열광적인 창작과 확산 이면에는 AI가 가져오는 저작권 문제에 대한 우려도 있었습니다. 이러한 회사들이 저작권 보호를 받는 작품으로 학습을 하고 있다면 저작권법을 위반하는 것은 아닐까요?
한 미디어와의 인터뷰에서 Neal & McDevitt 법률사무소의 지적재산권 변호사 에반 브라운은 GPT-4o의 네이티브 이미지 생성기 등의 제품이 현재 법적 회색 지대에 있다고 말했습니다. 그는 스타일 자체는 명확한 저작권 보호를 받지 않기 때문에, OpenAI가 지브리 스튜디오 영화와 비슷해 보이는 이미지를 생성하는 것은 위법하지 않은 것 같다고 언급했습니다.
OpenAI 대변인은 성명에서 ChatGPT가 "개별 현존 예술가의 스타일"을 복제하는 것은 거부하지만, OpenAI는 "더 광범위한 스튜디오 스타일"을 복제하는 것은 허용한다고 밝혔습니다.
주목할 만한 점은, 지브리 스타일 자체가 사실 매우 뚜렷한 미야자키 하야오의 화풍을 가지고 있어 대변인의 앞부분 발언과 일치합니다.
따라서 사용자들의 관점에서 보면, 도구를 사용해 창작하는 것 자체는 잘못이 없으며, 진정으로 주의해야 할 것은 이러한 생성형 AI 모델 개발자들입니다.
본 기사는 위챗 공식 계정 "미객망"에서 가져왔으며, 작성자는 미객망이고 36kr의 허가를 받아 게재되었습니다.


