OpenAI, ChatGPT에 GPT-4o의 새로운 이미지 생성 기능 출시, '믿을 수 없을 만큼 더 나은' 결과 보여주다

avatar
Decrypt
03-26
이 기사는 기계로 번역되었습니다
원문 표시

오픈AI는 채팅GPT에 직접 이미지 생성 기능을 통합하여, 사용자가 채팅 인터페이스를 벗어나지 않고도 이미지를 만들 수 있게 했습니다.

이 회사는 화요일에 다양한 미디어에서 AI 도구를 더욱 유용하고 접근성 있게 만들려는 광범위한 노력의 일환으로 이 기능을 발표했습니다.

이 기능은 2023년 9월에 출시되었지만 플럭스(Flux), 미드저니 v6, SD 3.5, 리크래프트, 레브 등 다음 세대 모델을 선호하는 AI 애호가들 사이에서 인기를 잃었던 오픈AI의 이미지 생성기 DALL·E 3의 진화입니다.

이번 출시 이전에는 오픈AI가 같은 플랫폼에서 두 가지 다른 모델을 제공했으며, GPT는 텍스트를 생성하고 DALL·E 3는 이미지 생성을 처리했습니다.

이제 GPT-4o가 모든 것을 스스로 처리할 것이며, DALL·E 3는 사라질 것입니다.

"GPT‑4o 이미지 생성은 텍스트를 정확하게 렌더링하고, 프롬프트를 정확하게 따르며, 4o의 고유한 지식 기반과 채팅 컨텍스트를 활용하는 데 탁월합니다. 여기에는 업로드된 이미지 변환이나 시각적 영감으로 사용하는 것도 포함됩니다."라고 오픈AI는 공식 블로그 게시물에서 주장했습니다.

DALL·E 3의 통합은 GPT-4o를 멀티모달 데이터로 훈련되고 모든 작업을 처리할 수 있는 "옴니" 모델로 만들려는 회사의 계획을 계속 실현하고 있습니다. 그 결과는 이전 모델보다 훨씬 더 능력 있고, 정확하며, 지능적인 모델입니다.

"기다리게 해서 죄송하지만, 정말 가치 있을 것이고 여러분이 좋아할 것이라고 생각합니다,"라고 오픈AI의 CEO 샘 알트먼은 GPT-4o의 새로운 기능을 보여주는 영상에서 말했습니다. "이는 너무나 큰 진전이어서 설명하는 가장 좋은 방법은 그저 보여주는 것입니다."

영상에서 회사는 상대성 이론을 설명하는 만화 페이지, 개인 및 실제 사진을 기반으로 한 맞춤형 트레이딩 카드, 투명한 배경으로 여러 이미지를 결합한 기념 주화, 매우 긴 상세한 프롬프트를 기반으로 한 매우 정확한 이미지 등 여러 예시로 시스템의 기능을 선보였습니다.

이 모델은 이미지 생성이 느리지만 매우 정확해 보입니다. 알트먼은 더 긴 대기 시간을 감수할 만한 중요한 품질 향상을 지적했습니다.

"이미지는 이전 이미지 생성 모델보다 훨씬 느리지만 믿을 수 없을 정도로 좋습니다. 기다릴 만한 가치가 있다고 생각합니다,"라고 알트먼은 시연 중에 말했습니다. "또한 앞으로 더 빠르게 만들 수 있을 것입니다."

출시는 점진적으로 이루어지는 것으로 보이며, 기사 작성 시점에서는 새 모델을 사용할 수 없었습니다.

사용자는 이미지가 어떻게 나타나는지를 보고 어떤 시스템을 사용하는지 알 수 있습니다. 명백한 품질 차이 외에도 DALL·E 3 이미지는 로딩 화면 후 완전히 형성되어 나타나는 반면, 새로운 GPT-4o는 실시간으로 이미지를 위에서 아래로 점진적으로 렌더링합니다.

회사는 이 기술이 화려한 이미지 생성을 넘어선다는 점을 강조했습니다.

"이번 출시에서 정말 흥미로운 점은 이제 이러한 모델이 자신이 알고 있는 것을 시각화하고 시각적 방식으로 외부화할 수 있다는 것입니다,"라고 샘 알트먼이 초대한 오픈AI의 연구 과학자가 설명했습니다.

이 기능을 통해 정확하게 렌더링된 텍스트가 있는 상세한 과학 다이어그램이나 정보 포스터와 같은 교육용 애플리케이션, 그리고 주제 일관성을 유지하는 이미지 편집이 가능해집니다.

오픈AI는 딥페이크, 불법 콘텐츠 생성 및 워터마크 제거를 방지하기 위한 가드레일도 구현했습니다.

생성된 이미지에는 보이는 워터마크는 없지만, C2PA 메타데이터가 포함되어 AI가 생성한 것임을 식별할 수 있습니다. 회사는 또한 이미지 출처를 추적하는 도구를 개발하고 있습니다.

회사는 이 기능을 API로 제공하여 개발자들이 자신의 애플리케이션에 이 기술을 통합할 수 있도록 할 계획입니다. 오픈AI의 이용 약관에 따르면 사용자는 회사의 사용 정책에 따라 생성한 이미지의 소유권을 유지하게 됩니다.

세바스찬 싱클레어와 조시 퀴트너가 편집함

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트