플럭스(Flux) 1.1 Pro를 만나보세요: 실행할 수 없는 최고의 AI 이미지 생성기

avatar
Decrypt
10-08
이 기사는 기계로 번역되었습니다
원문 표시

AI 이미지 생성기 Fluxfamily의 배후에 있는 스튜디오인 Black Forest Labs는 지난주 플럭스(Flux) 1.1 [Pro]의 출시를 발표했습니다 . 이는 플럭스(Flux) 1 Pro(업계를 선도하는 기능을 갖춘 폐쇄형 소스 모델), 플럭스(Flux) 1 Dev(비상업적 오픈 소스 모델) 및 플럭스(Flux) Schnell(완전히 오픈 소스 모델)을 포함한 원래 모델 패밀리가 출시된 지 불과 2개월 만에 나온 것입니다.

플럭스(Flux) 모델은 텍스트 생성 기능, 신속한 준수 및 전반적인 이미지 품질로 생성 AI 기술에서 큰 도약을 이루었습니다. 더 작은 모델인 플럭스(Flux) Dev와 플럭스(Flux) Schnell조차도 MidJourney의 세대와 동등한 결과를 생성했으며, SD3에서 제공하는 출력보다 훨씬 더 좋았습니다. SD3는 SDXL에 대한 Stability의 많은 기대를 모았지만 다소 실망 스러웠습니다.

새로운 모델은 이미 주목을 받으며, AI 모델을 위한 선도적인 벤치마킹 플랫폼인 인공 분석 이미지 분야 에서 최고 Elo 점수를 확보했습니다. 시중에 나와 있는 다른 모든 텍스트-이미지 모델보다 성능이 뛰어나면서도 가장 작은 모델과 거의 비슷한 속도를 보였습니다.

아래 그래프는 Y축에 Elo 점수(이미지 품질)를, X축에 생성 속도를 보여줍니다. MidJourney 애호가라면 모델이 표현되지 않았다는 것을 알아차릴 수 있습니다. 너무 느려서 문자 그대로 차트에서 벗어났습니다. 그러나 Elo 점수는 Ideogram V2 바로 아래인 1100점 어딘가에 있습니다.

새로운 플럭스(Flux) Pro는 가격 면에서 두드러지는데, Flux1.1 Pro는 이미지당 $0.04로, 원래 Flux1 Pro를 포함한 시중의 다른 많은 모델보다 낮습니다. 이 가격 구조는 MidJourney와 Ideogram과 같은 다른 유료 서비스에 비해 강력한 경쟁자가 되며, 각각 연간 $96$84 가 듭니다. MidJourney와 Ideogram 옵션은 또한 더 느리고 토큰당 비용이 더 높습니다.

안타깝게도 Flux1.1 Pro는 로컬에서 실행할 수 없습니다. FLUX1 [Dev] 및 FLUX1 [Schnell] 모델과 같은 덜 강력한 오픈 소스 대응 제품과 달리 이 새로운 pro 버전은 폐쇄 소스 모델이므로 사용자는 Together AI , Replicate , Fal AIFreepik 과 같은 플랫폼을 통해 액세스할 수 있습니다. 미세 조정이나 개인화가 불가능합니다.

모델을 시도하는 것을 고려하는 사람들을 위해, 이러한 플랫폼 중 일부는 무료 세대에 대한 몇 가지 크레딧을 제공하지만, 그것들이 고갈되면, 우리의 기준에 따른 최고의 서비스는 Freepik입니다. 그 이유는 Mystic 워크플로가 더 높은 세부 사항과 더 나은 미학으로 세대를 극적으로 향상시키기 때문입니다.

FLUX1[Dev] 또는 FLUX1[Schnell] 모델의 오픈 소스 1.1 버전에 대한 발표는 없지만 Black Forest Labs가 이미지 및 비디오 제작자를 위한 뛰어난 모델에 노력을 집중하고 있다는 것은 분명합니다.

우리는 새로운 플럭스(Flux) 모델을 시도했고 그 결과는 만족스러웠습니다. SDXL에서 플럭스(Flux) 로의 이전과 같은 세대적 도약은 아니지만 확실히 환영받는 업그레이드입니다.

전반적으로 매우 사실적이고, 훌륭한 텍스트 생성 기능을 갖추고 있으며, 예술적 작업과 스타일에서 매우 창의적입니다. 품질을 떨어뜨리지 않고도 빠른 생성을 제공하는 훌륭하고 다재다능한 모델입니다.

프롬프트: "VSCO 필터가 적용된 폴라로이드 사진, 1990년, 여성, 밤, 플래시 사진, 금발, 젊은 얼굴, 아름다운 그림자, 열대 식물, 아파트 내부, DSLR, 카메라 플래시, '2024년 10월 7일 디크립트(Decrypt) 검증'이라고 쓰인 공책에 손으로 쓴 표지판을 들고 있습니다. 여성은 다른 한 손으로 평화 사인을 하고 있습니다."

이 모델은 사실적인 이미지를 만드는 데 뛰어나며, 초기 플럭스(Flux) 모델의 에어브러싱된 룩을 개선합니다. 완벽하지는 않지만, 특히 적절한 프롬프트를 사용하면 결과는 매우 설득력이 있습니다. 첫눈에 보면, 이 두 이미지는 모두 플럭스(Flux) 1.1 Pro로 생성되었으며, 사소한 세부 사항을 따지지 않고도 진짜처럼 보일 수 있습니다.

글자체는 프롬프트와 일치하며, 핸드 렌더링은 개선되었지만 완벽하지는 않습니다. 이것들이 손으로 고른 샘플이 아니라 처음 두 세대라는 점에 유의하는 것이 중요합니다. 생성 AI로 작업할 때 일반적으로 최상의 결과는 여러 세대와 편집 후에 나옵니다.

조명은 카메라 플래시와 일치하여 방 전체를 비추지 않고 피사체에 초점을 맞춥니다. VSCO 필터는 사실감을 강화하고 즉각적인 고착이 뛰어납니다.

플럭스(Flux) 1.1과 플럭스(Flux) 1을 비교하면 언뜻 보기에 세대가 사실성 면에서 매우 유사하다는 것을 알 수 있습니다. 그러나 동일한 프롬프트를 사용하여 새 모델은 더 자연스러운 포즈와 더 일관된 신체를 생성합니다. 예를 들어 플럭스(Flux) 1은 추가 다리처럼 보일 수 있는 것을 생성했지만 플럭스(Flux) 1.1은 이를 피했습니다. 이러한 개선은 전반적인 사실적인 미학보다는 정확도와 더 관련이 있습니다.

프롬프트: "피아노를 치는 흰 고양이, 선글라스와 모자를 쓰고, 보라색 하와이 스타일로 입고, 회색 스튜디오 배경에 조명 요소와 천장에 매달린 익룡이 있는 전신 촬영, 상업용 비디오 화면 캡처. 벽에는 'Emerge by 디크립트(Decrypt)'라는 텍스트가 있습니다."

플럭스(Flux) 1.1은 플럭스(Flux) 1 Pro보다 신속한 준수를 한 단계 더 발전시켜, 표적을 놓치지 않고 더 많은 요소를 장면에 성공적으로 통합했습니다. 플럭스(Flux) 1에 대한 첫 번째 프롬프트에는 조명 요소나 익룡이 포함되지 않았습니다. 게다가, 새로운 세대는 더 현실적이고 더 자연스럽게 느껴집니다.

프롬프트: "TV 위에 서 있는 개, 화면에 ' 디크립트(Decrypt)'라는 단어가 표시됨. 왼쪽에는 동전을 든 비즈니스 정장을 입은 여성이 있고, 오른쪽에는 구급 상자 위에 서 있는 로봇이 있습니다. 전체적인 풍경은 초현실적입니다."

공간 인식 측면에서 플럭스(Flux) 1.1과 플럭스(Flux) 1은 비슷합니다. 둘 다 문제 없이 모든 요소를 ​​생성했습니다. 그러나 플럭스(Flux) 1.1 Pro는 추가 세부 사항을 고려할 때 더 뛰어난 듯합니다. 예를 들어, 프롬프트에서 요소를 가져와 다른 영역에서 사용할 때 프롬프트가 엎질러지는 현상이 적습니다. 플럭스(Flux) 1.1 세대에서 여성은 눈에 보이는 추가 동전 없이 동전 하나를 들고 있는 반면, 플럭스(Flux) 1은 개 옆에 동전을 쌓아 두었습니다. 게다가 플럭스(Flux) 1 Pro에서 추가 손과 관련된 오류는 새로운 모델에는 없고, 초현실적인 스타일은 플럭스(Flux) 1.1 세대에서 더 잘 표현됩니다.

플럭스(Flux) 1.1 Pro는 전반적으로 세대별로 더 일관되고 논리적입니다. 로컬 모델을 실행할 수 없다면 매우 훌륭한 경쟁자입니다. 자연어를 이해하여 초보자에게 적합하지만 이것이 주요 강점은 아닙니다. MidJourney는 나쁜 프롬프트를 개선하는 동시에 더 창의적입니다.

그러나 플럭스(Flux) 1.1 Pro는 현재 출시 중인 모델보다 저렴하고 빠르며 전반적으로 품질이 더 우수하여 신속한 준수, 품질, 텍스트 생성 기능을 원하는 사용자에게 가장 적합한 옵션이 될 수 있습니다.

모델에 비용을 지불할 의향이 있는 사람이라면 현재 옵션 중 어느 것이든 가능합니다. Fal.AI가 제공하는 서비스는 다른 서비스보다 더 많은 제어 기능을 제공하기 때문에 마음에 들었습니다. 그러나 Freepik은 보다 전문적인 경험을 원하는 사람에게 가장 좋은 옵션인 듯합니다. 약간 더 비싸지만 이미지 생성 서비스뿐만 아니라 이미지 업스케일링, 아웃페인팅, 초안-이미지 생성, 배경 제거, 실험을 위한 콘텐츠 라이브러리와 같은 추가 기능을 제공하여 훨씬 더 다재다능합니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트