플럭스와 미드저니를 제치고 AI 이미지 생성 순위 최상위에 오른 새로운 플레이어가 등장했습니다. 인공지능 분석가들을 당황하게 했던 레드 팬더라는 이름의 미스터리 모델이 마침내 런던의 작은 스타트업 Recraft AI가 출시한 Recraft V3로 밝혀졌습니다.
이 모델은 ELO 평가 시스템에서 이미지 생성기 중 최고 점수를 기록하며 플럭스 1.1 Pro와 미드저니를 능가했습니다. 효율성 면에서 Recraft V3는 SDXL의 10초 미만 생성 속도를 유지하면서도 맹검 테스트 결과 최고의 이미지 품질을 보여주고 있습니다.
벤치마크 테스트 4일 동안 Recraft V3는 텍스트 생성 품질, 해부학적 정확성, 프롬프트 이해력 등에서 우수성을 입증했습니다. 단순한 단어나 문구 통합을 넘어 확장된 텍스트 구절을 포함한 이미지 생성이 가능한 유일한 모델입니다.
실제로 SDXL 개발에 참여했던 전 Stability AI 연구원 조 펜나는 회사 디스코드 서버에서 이 모델을 공개적으로 칭찬했습니다. "와, 멋진 새로운 모델이군요, Recraft. 매우 인상 깊습니다."
당신이 생성형 AI나 디지털 디자인에 깊이 관심이 없다면 Recraft AI라는 이름을 들어보지 못했을 수 있습니다. 이 런던 스타트업은 2022년에 설립되어 일반 이미지 생성보다는 그래픽 디자이너를 위한 AI 기반 도구에 초점을 맞추고 있었습니다. 하지만 올해 초 Khosla Ventures와 전 GitHub CEO 나트 프리드먼으로부터 1,100만 달러의 시리즈 A 투자를 받으면서 방향을 전환했습니다.
Recraft V3는 사실적인 이미지 생성에 탁월하며, 세부 묘사와 불완전함을 놀라운 정밀도로 다룹니다. 구독 모델을 채택하고 있으며, 미드저니, 레오나르도, 아이디오그램과 유사합니다.
디지털 디자인은 Recraft의 핵심 가치입니다. 이 모델은 텍스트를 벡터 생성으로 처리할 수 있어, 사용자가 프롬프트를 입력하면 품질 저하 없이 무한 확장이 가능한 이미지를 생성할 수 있습니다.
무료 사용자는 50개의 일일 크레딧을 받으며, 이는 50장의 이미지를 생성할 수 있습니다. 그러나 사용자는 자신의 창작물에 대한 소유권을 가지지 않습니다. 이 권리는 월 10달러부터 시작하는 유료 구독자에게 제공됩니다.
Recraft V3에 접근할 수 있는 채널은 웹 인터페이스, 디스코드 명령, iOS 및 Android 모바일 앱 등 3가지입니다.
디스코드에 접속해 Recraft 서버에 참여하면 미드저니 사용자에게 익숙한 환경을 만날 수 있습니다. #image-gen 채널로 가서 /recraft를 입력하면 마법이 펼쳐집니다.
프롬프트 뒤에 다양한 수식어를 사용할 수 있습니다. 와이드스크린 걸작을 원한다면 --ar 16:9를, 세로 이미지는 --ar 3:4를 입력하세요. --style 명령어로 사진 실사, 3D, 카와이 등 원하는 스타일을 선택할 수 있고, --sref로 참조 이미지를 업로드해 AI의 예술적 비전을 안내할 수 있습니다.
이미지가 생성되면 2개의 결과물 중 가장 마음에 드는 것을 선택하여 저장하거나 4배 확대할 수 있습니다.
recraft.ai의 웹 인터페이스는 강력한 기능을 자랑합니다. Recraft.AI에 접속해 로그인하면 왼쪽 텍스트 상자에 프롬프트를 입력하면 됩니다.
종횡비와 이미지 수를 조절할 수 있는 슬라이더도 있습니다. 텍스트 상자 위의 아이콘 버튼을 클릭하면 다양한 스타일 옵션이 팝업 메뉴에 표시됩니다.
이 인터페이스는 다른 사이트보다 훨씬 정교하며, 디자이너를 겨냥했다는 것이 한눈에 보입니다. 프레임, 제품 모형, 이미지 세트 생성, 배경 처리, 이미지 벡터화 등의 기능을 제공합니다.
모바일 크리에이터들도 잊지 않았습니다. iOS 및 Android 공식 앱을 통해 동일한 품질의 이미지를 생성할 수 있습니다. 앱을 다운로드하고 로그인한 후 화면 중앙 상단의 버튼을 클릭하고 하단의 텍스트 상자에 프롬프트를 입력한 뒤 생성 버튼을 누르면 됩니다.
이미지의 세부 수준, 종횡비, 스타일, 참조 이미지 등을 동일한 인터페이스에서 조정할 수 있어 직관적입니다.
우리는 다양한 스타일과 기술적 역량 측면에서 이 모델을 테스트했습니다. 경쟁 모델들과 비교해 보겠습니다.
프롬프트: 여성의 얼굴에 "Emerge" 단어가 투영되는 장면
Recraft V3:
Recraft는 자연스러운 피부 질감, 표정, 환경 조명을 가장 잘 이해하고 있습니다. 투영된 문구가 피부에 잘 통합되어 있으며, 중요하게도 눈에 띄는 모공, 약간의 피부 결점, 자연스러운 머리카락 날림 등의 불완전함이 있습니다. 솔직한 표정과 배경 맥락이 진정성을 더합니다.
Stable Diffusion 3.5:
SD 3.5는 2위를 차지했습니다. SD3 medium에 비해 큰 향상을 보였고, 심지어 최고의 현실적인 SDXL 파인튜닝 모델보다도 우수합니다. 오렌지 빛 조명과 강렬한 붉은 립스틱으로 극적인 분위기를 연출했습니다. 얼굴 특징은 잘 정의되어 있지만, 피부 질감에 인공적인 느낌이 있습니다. 투영된 문구는 날카로운 오버레이 같고, 표정도 다소 연출된 합성적인 느낌입니다.
미드저니:
항상 그렇듯이 미드저니는 강력한 기술적 실행력으로 영화적인 분위기를 연출합니다. 그러나 여성의 피부는 광택 나는 거의 초월적인 질감을 가지고 있어, Recraft의 시도보다 자연스럽지 않습니다. 투영된 문구는 잘 어우러지지만, 전반적인 완벽함과 표현의 진정성 부족은 AI 기원을 드러냅니다.
승자: Recraft
프롬프트: TV 화면에 "Decrypt" 단어가 표시되고 그 위에 개가 서 있습니다. 왼쪽에는 정장을 입은 여성이 동전을 들고 있고, 오른쪽에는 구급상자 위에 로봇이 서 있습니다. 전체적인 장면은 초현실적입니다.
Recraft V3:
이 모델은 공간 인식 측면에서 실패했습니다. 그러나 전체 구도에서 초현실적인 스타일을 달성했습니다. 이는 다른 모델들이 요소들의 배치와 공간 인식에 뛰어났지만 전체적인 분위기나 스타일이 의문스러웠던 것과 대조됩니다.
이는 일부에게는 장점으로 여겨질 수 있습니다. 전체 이미지의 스타일을 재조정하는 것보다 요소를 인페인팅하고 편집하는 것이 더 쉽기 때문입니다. 그러나 다른 모델과 비교할 때 이는 중요한 한계로 간주되어야 합니다.
승자: 플럭스
프롬프트: 정글에서 여성을 쫓는 거대 거미의 손으로 그린 일러스트레이션, 극도로 무서운, 고통스러운, 어두운 그리고 소름 끼치는 풍경, 공포, 아날로그 사진 영향력 암시, 스케치
이 모델은 다양한 스타일을 선택할 수 있지만, 이번에는 Recraft RAW를 선택했습니다. 처음에는 "손으로 그린" 스타일이 가장 좋을 것 같았지만... 아니었습니다.
다양한 사전 설정 스타일을 시도해 본 결과, 가장 범용적인 RAW가 우리가 찾던 것에 가장 잘 맞았습니다.
다른 모델과 비교했을 때, Recraft는 흥미로운 구도를 생성했고 거대 거미가 여성을 쫓는다는 핵심 메시지를 정확하게 표현했습니다. 그러나 전체적인 예술 작품은 손으로 그린 일러스트레이션보다는 디지털 일러스트레이션 같아 보였습니다.
미적으로는 최신 Stable Diffusion 모델이 이 특정 프롬프트에 가장 정확하게 부합했습니다. 거대 거미를 피해 도망가는 여성의 고통을 잘 표현한 손으로 그린 일러스트레이션을 생성했습니다.
승자: SD3
Recraft V3가 이미지 생성 리더보드 최상위에 오른 이유를 쉽게 알 수 있습니다. 미드저니와 플럭스 같은 경쟁자들이 종종 예측 가능한 양식화된 패턴 - "플럭스 얼굴" 또는 "미드저니 룩" - 에 빠지는 반면, Recraft는 사실성에 기울어져 있습니