ChatGPT Images 2.0에 속지 마세요. 조심하세요.

이 기사는 기계로 번역되었습니다
원문 표시

위 이미지는 인공지능(AI)이 생성한 것입니다.

4월 22일, 지둥시(Zhidongxi)는 오픈아이얼(OpenAI)이 오늘 새벽, 많은 기대를 모았던 이미지 생성 및 편집 모델 '챗GPT 이미지 2.0'을 공식 출시했다고 보도했습니다. 해당 모델은 챗GPT 챗봇 및 API 서비스에 완전히 적용되었습니다.

기자 회견 생중계 도중 알트만은 "ChatGPT Images 2.0의 출시는 GPT3에서 GPT5로 단번에 도약하는 것과 같은 엄청난 도약입니다."라고 언급했습니다.

출시 후, 이 모델은 빠르게 Image Arena의 모든 차트에서 1위를 차지했으며, 경쟁이 치열한 원본 이미지 순위에서 Nano Banana 2를 무려 242점 차이로 앞섰습니다.

해당 모델은 출시 직후 소셜 미디어에서 빠르게 입소문을 탔고, 일부 네티즌들은 "바나나가 더 이상 맛있게 느껴지지 않아. ChatGPT Images 2.0이 판도를 바꿔놨어."라고 외쳤다.

대량 네티즌들이 ChatGPT Images 2.0을 이용해 생성한 이미지를 공유하면서 놀라운 이미지들이 쏟아져 나왔습니다. ChatGPT Images 2.0의 강력한 기능 덕분에 이 이미지들은 실제 이미지와 구별하기 어려웠으며, 심지어 스캔 가능한 바코드까지 생성할 수 있다는 사실도 발견되었습니다.

네티즌들이 보여준 결과물 중에는 라이브 스트리밍 화면 캡처, 기자 회견 사진, 심지어 이체 기록까지 포함되어 있는데, 이 이미지들은 매우 사실적이고 일상생활과 밀접하게 연관되어 있는 것처럼 보입니다. ChatGPT Images 2.0이 생성한 이러한 이미지들은 너무나 사실적이어서 여러 상황에서 의심하지 않는 사람들을 쉽게 속일 수 있습니다.

ZhiDongXi는 여러분이 진짜와 가짜를 구별할 수 있는지 알아보기 위해 다양한 사례를 수집하고 테스트했습니다.

01. 라이브 스트리밍, 송금, 기자 회견: AI가 생성한 이미지는 실제 이미지와 구별하기 어렵습니다.

이 기사 헤더 이미지에 사용된 DeepSeek V4 출시 발표는 ChatGPT Images 2.0을 사용하여 생성되었으며, 다음과 같은 메시지가 포함되어 있습니다. "DeepSeek 공식 계정에서 게시한 DeepSeek V4 출시 발표 트윗의 스크린샷으로, 아바타, 사용자 이름, 좋아요, 리트윗, 댓글 등의 트윗 인터페이스 요소가 유지되어 있습니다."

덧붙여 말하자면, 지둥시는 ChatGPT Images 2.0을 이용해 위챗 모멘트 게시물의 스크린샷을 생성하여 전체적인 과정이 더욱 완결된 것처럼 보이게 했습니다.

프롬프트에는 "위챗 모멘트 게시물의 스크린샷이 나와 있는데, 샘 알트만이 딥시크 V4를 획기적인 모델이라고 칭찬한 후 머스크, 주커버그, 황이 좋아요와 댓글을 남긴 모습이 보인다."라고 적혀 있습니다.

참조 이미지가 없어도 ChatGPT Images 2.0으로 생성된 스크린샷은 상당히 사실적입니다. 하지만 생성된 인물 사진은 약간 어색하고, 황런쉰(Huang Renxun)의 이름에는 획이 몇 개 빠져 있습니다.

ChatGPT Images 2.0을 이용해 라이브 스트리밍 페이지를 생성하는 방법도 있습니다. 이 방법은 최근 베타 테스트에서 큰 화제를 모았습니다. 누군가 GPT Image 2를 이용해 알트만이 라이브 스트리밍에서 팥빵을 파는 장면을 캡처했는데, 아주 자연스러워 보였습니다. 왼쪽 상단의 추첨 봉투와 아래 댓글까지 모두 진짜 같았습니다. 만약 다른 유명 국내 인사의 이미지로 바꾸면 사람들이 실제로 속을 수도 있을 정도입니다.

일반적인 이미지 모델 테스트 절차에 따라 ZhiDongXi는 모델에게 손글씨 사진을 생성하도록 요청하고 다음과 같은 지시 사항을 입력했습니다. "휴대폰으로 고등학교 수학 숙제의 손글씨 사진을 찍으세요. 글씨는 깔끔하고 흰 종이에 쓰여 있습니다. 내용은 미분 문제입니다."

생성된 사진들이 학생들의 과제에 적힌 깔끔한 필체와 거의 똑같아 보입니다. 댓글에 진짜 사진과 가짜 사진을 구별할 수 있는 선생님들이 계신가요?

어떤 사람들은 스티브 잡스가 샤오미의 자동차를 출시해야 한다고 농담까지 했지만, 오랫동안 살펴본 결과 흠잡을 데가 없었다.

앞의 그림이 충분히 현실적이지 않다고 생각되면 아래 그림을 보세요.

ChatGPT Images 2.0으로 생성된 이 이미지에는 "팀 쿡이 애플 파크에서 열린 아이폰 20 출시 행사에서 연설하고 있습니다. 이 사진은 아마추어가 아이폰으로 군중 사이 멀리서 촬영한 것입니다."라는 캡션이 달려 있습니다.

이 사진은 언론의 시각을 완벽하게 포착하고 있습니다. 만약 눈에 띄게 드러난 아이폰 20과 팀 쿡의 사임이 없었다면, 많은 사람들이 속았을지도 모릅니다.

이 이미지를 다시 보면, Zhidongxi가 ChaGPT를 사용하여 생성한 학술 논문입니다. 입력 프롬프트는 "아름다운 레이아웃과 엄격한 스타일을 갖춘 베이징 대학 학술지의 AI 보안 문제 논문"입니다.

저널 웹페이지 제작이 완료되었습니다. 전체적인 스타일은 정식 학술 저널의 기준에 완벽하게 부합하며, 매우 간결하고 정확한 중국어 텍스트를 사용했습니다. 제목, 저자, 소속 기관, 초록, 키워드, 서론 모두 논리적으로 배치되어 있으며, 줄 간격과 단락 구성도 깔끔합니다. DOI와 저작권 정보까지 생성되어 매우 전문적인 느낌을 줍니다.

누군가 이 논문의 스크린샷을 보내면서 참고 자료로 찾아보라고 하면, 속아 넘어가는 사람도 있을 겁니다.

심지어 어떤 사람들은 ChatGPT Images 2.0을 이용해 은행 송금 내역 스크린샷을 만들어내기도 하는데, 생각만 해도 소름이 끼칩니다. 심지어 공무 인장까지 위조할 수 있다는 것은 결코 좋은 일이 아닙니다.

이 처방전 역시 ChatGPT Images 2.0을 이용해 제작되었습니다. 글씨체가 너무 깔끔해서 의사의 글씨처럼 보이지 않는다는 점을 제외하면, 모든 것이 진짜처럼 보일 정도로 정교합니다.

02. ChatGPT Images 2.0이 엄청난 호평을 받고 있습니다. 사용자들이 열광하고 있어요.

현재 모든 ChatGPT 및 Codex 사용자는 일정 개수의 원본 이미지 샘플을 무료로 이용할 수 있으며, 실제 테스트 결과 약 7개의 이미지를 생성할 수 있는 것으로 추정됩니다. 유료 구독자는 모델이 온라인 검색, 테스트 및 자체 검사를 수행하여 원본 이미지의 품질을 보장하는 "사고 모드"를 사용할 수 있습니다. gpt-image-2 모델은 API를 통해 공개적으로도 이용 가능합니다.

사용자는 ChatGPT 채팅을 열고 입력란 왼쪽에 있는 더하기 기호를 클릭한 다음 '이미지 생성'을 선택할 수 있습니다. 기본적으로 ChatGPT Images 2.0이 사용됩니다. 그런 다음 더하기 기호를 클릭하여 사진과 파일을 추가하고 메시지를 보낼 수 있습니다.

요구 사항이 불분명한 경우 ChatGPT는 이미지를 생성하기 전에 사용자에게 요구 사항을 확인하도록 요청합니다.

ChatGPT Images 2.0 출시 이후, 네티즌들은 앞다투어 사용해 보며 열광적인 반응을 보였습니다. 모두들 ChatGPT Images 2.0으로 생성한 이미지의 뛰어난 품질을 자랑했고, 일부 네티즌들은 실제 이미지와 가짜 이미지를 구별할 수 없을 정도라고 극찬했습니다.

도쿄대학교의 한 의사가 자신이 생성한 논문 포스터를 게시하며, 아직 테스트는 해보지 않았지만 ChatGPT Images 2.0이 논문의 데이터를 처리할 수 있을 것 같다고 말했고, 과학 연구에 또 다른 혁명이 일어날 것이라고 기대감을 표했습니다.

바이브코드 공동 창립자이자 해외 블로거인 라일리 브라운은 "이것이 최고의 이미지 모델이다"라고 말했다.

ChatGPT Images 2.0은 매우 강력하지만, 여전히 주의해야 할 기만적인 사진들이 많습니다. AI가 생성한 이미지와 관련된 윤리적 문제들을 간과할 수 없습니다. 만약 소셜 미디어에서 친숙한 사람, 회사 또는 장소에서 보낸 것처럼 보이는, 믿을 수 없을 정도로 사실적인 이미지들이 있다면 누가 속아 넘어갈까요?

03. 결론: 인공지능 이미지 산업은 새로운 차원에 도달했지만, 규제와 관리가 필요합니다.

AI 기반 이미지에 대한 수요가 증가함에 따라 ChatGPT Images 2.0의 출시로 이미지 선명도, 디테일 재현, 스타일 다양성 및 창의적 표현의 자유 측면에서 상당한 개선이 이루어져 업계 전체가 새로운 차원으로 도약할 것으로 기대됩니다 .

하지만 기술 역량이 향상됨에 따라 저작권 보호, 콘텐츠 검열, 생성된 콘텐츠와 관련된 윤리적 리스크 등 업계는 새로운 과제에 직면하고 있습니다.

인공지능이 생성한 이러한 "기적의 이미지" 중 상당수는 너무나 사실적 이어서 진짜 이미지로 착각할 수 있습니다. 예를 들어, 기자 회견, 소셜 미디어 스크린샷, 라이브 스트리밍 영상과 같은 일상적인 정보에서 이러한 이미지를 만들어낼 수 있습니다. 만약 이러한 이미지들이 인공지능이 생성한 가짜 이미지로 대량 있다면, 얼마나 많은 사람들이 속아 넘어갈지 상상하기 어렵습니다.

미래의 발전을 위해서는 알고리즘의 발전 뿐만 아니라 표준화된 산업 표준 준수 및 지속 가능한 응용 전략 또한 필요합니다.

기술과 정책 모두 최적화됨에 따라 인공지능이 생성한 이미지는 창의적인 디자인, 교육 및 훈련, 엔터테인먼트 콘텐츠 등 다양한 분야에서 더욱 중요한 역할을 할 것으로 예상됩니다.

이 글은 위챗 공식 계정 "즈둥시"(ID: zhidxcom) 에서 가져온 것으로, 작성자는 비웨이화, 편집자는 모잉이며, 36Kr의 허가를 받아 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트