OpenAI가 울트라맨이 복근을 자랑하는 모습이 담긴 새로운 ChatGPT 이미지를 공개했습니다.

36氪

12-17

이 기사는 기계로 번역되었습니다

원문 표시

만약 방금 X를 열었고 OpenAI와 샘 알트먼을 팔로우하고 있다면, 다음과 같은 그림을 볼 수도 있습니다.

네, 확실히 눈에 거슬리는 부분이죠. 심지어 OpenAI 공식 계정조차 (사실은 그냥 관심을 끌려고) 댓글을 달았을 정도니까요. sam.

댓글란은 불만과 농담으로 가득 찼습니다.

하지만 어쨌든, 그것은 확실히 화제를 불러일으켰습니다.

사실, 샘 울트라맨이 이렇게 눈길을 끄는 이미지를 게시한 이유는 오픈아이얼(OpenAI)이 새롭게 출시한 ChatGPT Images를 홍보하기 위해서였습니다. 그리고 울트라맨 사진을 기반으로 한 이미지는 이것뿐만이 아닙니다. 오픈아이얼 공식 계정은 이와 유사한 이미지를 따로 게시하기도 했습니다.

사진을 직접 제공한 OpenAI 임원은 그뿐만이 아닙니다. OpenAI 최고 연구 책임자 마크 첸과 OpenAI 사장 그렉 브록먼도 사진을 공유했습니다. 예를 들어, 아래는 공식 블로그에 공유된 두 사람의 대화 내용을 편집한 스크린샷입니다.

새로운 ChatGPT 이미지

ChatGPT Images의 새로운 버전은 OpenAI의 새로운 플래그십 이미지 생성 모델을 기반으로 합니다. OpenAI는 "이제 처음부터 사진을 만들거나 편집하든, 원하는 이미지를 얻을 수 있습니다. 세부 정보를 보존하면서 정밀한 편집이 가능하며, 이미지 생성 속도는 최대 4배 빨라졌습니다."라고 밝혔습니다.

핵심 기능은 정확한 편집과 주요 세부 정보 보존입니다 .

이제 사용자가 업로드한 이미지의 편집을 요청할 때, 모델은 사용자의 의도를 더욱 정확하게 파악할 수 있습니다. 오픈아이디에 따르면, 이는 "모든 세부 사항까지 꼼꼼하게" 반영하는 것으로, 사용자가 요청한 부분만 변경하면서 조명, 구도, 피사체의 외형과 같은 요소는 입력, 출력, 그리고 후속 편집 과정 전반에 걸쳐 일관성을 유지합니다.

이를 통해 더욱 실용적인 사진 편집, 더욱 현실적인 의상 및 헤어스타일 시뮬레이션, 원본 이미지의 본질을 유지하면서 스타일을 적용하거나 콘셉트를 변형하는 등 다양한 잠재적 활용 사례가 가능해집니다.

편집 기능

OpenAI는 해당 모델이 추가, 삭제, 결합, 병합 및 교체를 포함한 다양한 유형의 편집 작업에서 뛰어난 성능을 발휘한다고 밝혔습니다.

아래는 생성부터 다양한 편집 과정에 이르는 예시입니다.

창조적 변혁

이 모델은 변환 기능도 갖추고 있어 사용자가 중요한 세부 정보를 유지하면서 텍스트나 레이아웃과 같은 요소를 변경하고 추가하여 아이디어를 구현할 수 있습니다. OpenAI는 이러한 변환 기능이 단순한 개념과 복잡한 개념 모두에 적용 가능하며, 새로운 ChatGPT Images 기능에서 미리 설정된 스타일과 창의적인 아이디어를 활용하여 수동으로 프롬프트를 작성할 필요 없이 간편하게 실험해 볼 수 있다고 밝혔습니다.

예를 들어, 평범한 사진을 영화 포스터로 바꿀 수 있습니다.

아니면 울트라맨이 진주 귀걸이를 하고 있는 그림을 그려 보세요.

지시사항을 따르세요

OpenAI는 "초기 버전과 비교했을 때, 이 모델은 지시 사항을 더욱 안정적으로 따릅니다. 이를 통해 더욱 정밀한 편집이 가능할 뿐만 아니라, 더욱 복잡한 원본 구성도 처리하여 요소 간의 관계를 예상대로 유지합니다."라고 밝혔습니다. 아래에 비교 예시가 제공됩니다.

텍스트 렌더링

이 모델은 텍스트 렌더링에 있어 상당한 진전을 나타내며, 더 빽빽하고 작은 텍스트를 처리할 수 있게 해줍니다.

기타 품질 개선 사항

이 모델은 다른 측면에서도 개선되어, 작은 얼굴들을 많이 렌더링하는 기능과 출력물의 자연스러움을 향상시키는 등 결과물을 더욱 쉽게 사용할 수 있게 되었습니다.

완전히 새로운 창작 공간

또한 OpenAI는 ChatGPT에 "이미지 생성 경험을 더욱 즐겁게 만들고, 영감을 줄 뿐만 아니라 창의적인 탐색을 손쉽게 할 수 있도록" 하는 새로운 " 이미지 " 기능을 출시했습니다.

사용자는 모바일 앱의 사이드바와 chatgpt.com을 통해 해당 기능에 접근할 수 있어 이미지 탐색 및 실험을 더욱 빠르고 간편하게 할 수 있습니다. 수십 가지의 사전 설정 필터와 영감을 불러일으키는 프롬프트가 포함되어 있으며, 새로운 트렌드를 반영하여 정기적으로 업데이트됩니다.

유효성

완전히 새로워진 이미지 모델이 오늘부터 모든 ChatGPT 사용자에게 제공되며, API를 통해 GPT Image 1.5로 이용할 수 있습니다. GPT Image 1과 비교하여 GPT Image 1.5는 이미지 입력 및 출력 비용을 20% 절감하여 사용자가 예산을 늘리지 않고도 더 많은 이미지를 생성하고 반복 작업할 수 있도록 합니다.

ChatGPT의 새로운 이미지 기능은 대부분의 사용자가 오늘부터 이용할 수 있으며, 비즈니스 및 엔터프라이즈 사용자는 추후에 이용할 수 있게 될 예정입니다.

OpenAI는 "이미지 생성 기술이 달성할 수 있는 가능성은 아직 시작 단계에 불과하다고 생각합니다. 이번 업데이트는 중요한 진전이며, 더욱 세밀한 편집 기능부터 더욱 풍부하고 상세한 다국어 출력 기능까지 앞으로 더 많은 기능이 추가될 예정입니다."라고 밝혔습니다.

결론

마지막으로, 동일한 프롬프트를 사용하여 ChatGPT Images와 Google의 Nano Banana Pro를 비교하는 간단한 테스트도 진행했습니다.

ChatGPT 이미지 검색 결과

나노 바나나 프로 결과

적어도 이 특정 사례에서는 ChatGPT Images의 결과가 저희 지침과 더 일치하는 것으로 보입니다.

요약하자면, AI 생성 이미지 경쟁에서 OpenAI의 ChatGPT Images 출시로 경쟁 구도가 단순한 "모델 성능"에서 포괄적인 "제품 경험"으로 전환되었음을 알 수 있습니다. OpenAI는 이번에 정량적인 벤치마크 결과조차 공개하지 않았습니다!

한편, 샘 알트만의 자학적인 유머는 실리콘 밸리 특유의 재치로 가득 차 있으면서도, 오픈아이얼이 사용자들의 심리적 장벽을 낮추기 위해 모든 노력을 기울이고 있다는 분명한 메시지를 전달합니다. 별도의 "이미지" 항목 추가, 사전 설정 스타일 필터 제공, 그리고 상당한 가격 인하를 통해 오픈아이얼은 이미지 생성을 세심하게 조정된 프롬프트가 필요한 전문 기술에서 트윗처럼 간단한 일상적인 상호 작용으로 탈바꿈시키려 하고 있습니다.

ChatGPT Images에 대해 긍정적인 전망을 가지고 계신가요?

참고 링크

https://openai.com/index/new-chatgpt-images-is-here/

https://x.com/OpenAI/status/2000990989629161873

이 글은 위챗 공식 계정 "머신하트"(ID: almosthuman2014) , 작성자: Panda의 글이며, 36Kr의 허가를 받아 게재되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트