Flux 1.1 Pro:你無法運作的最佳 AI 影像產生器

avatar
Decrypt
10-08
本文為機器翻譯
展示原文

Flux 系列 AI 圖像生成器背後的開發工作室 Black Forest Labs 上週宣佈發佈Flux 1.1 [Pro]。 就在發佈該系列模型的兩個月前,該系列模型包括Flux 1 Pro(一款具有行業領先功能的閉源模型)、 Flux 1 Dev(一款非商業開源模型)和Flux Schnell(一款完全開源模型)。

Flux模型憑藉其文本生成能力、快速遵循性和整體圖像質量,標誌著生成式人工智能技術的重大飛躍。即使是較小的模型Flux Dev 和Flux Schnell 也生成了與 MidJourney 生成的結果相當的結果,並且比 SD3 提供的輸出要好得多,SD3 是 Stability 備受期待的對 SDXL 的改進,結果有點令人失望

新模型已經取得了顯著成績,在人工智能模型領先的基準測試平臺——人工智能分析圖像領域獲得了最高的 Elo 分數。它的表現優於市場上所有其他文本轉圖像模型,同時速度幾乎與最小模型一樣快。

下圖 Y 軸表示 Elo 分數(圖像質量),X 軸表示生成速度。MidJourney 愛好者可能會注意到他們的模型沒有顯示出來——它的速度太慢了,簡直超出了圖表範圍。然而,它的 Elo 分數大約在 1100 分左右,略低於 Ideogram V2。

新款Flux Pro 在定價方面脫穎而出,Flux1.1 Pro 每張圖片售價 0.04 美元,低於市場上許多其他型號,包括原版 Flux1 Pro。這種定價結構使其成為 MidJourney 和 Ideogram 等其他付費服務的強大競爭對手,後者的年費分別為96 美元84 美元。MidJourney 和 Ideogram 選項的速度也較慢,每個令牌的成本也更高。

遺憾的是,Flux1.1 Pro 無法在本地運行。與功能較弱的開源模型(例如 FLUX1 [Dev] 和 FLUX1 [Schnell] 模型)不同,這個新的專業版是一個閉源模型,限制用戶通過Together AIReplicateFal AIFreepik等平臺訪問它。它無法進行微調或個性化。

對於那些想要嘗試該模型的人來說,其中一些平臺會提供一些免費生成積分,但一旦這些積分用完,根據我們自己的標準,最好的服務是Freepik。這是因為它的 Mystic 工作流程可以顯著增強生成效果,使其細節更豐富,美感更強。

目前還沒有關於 FLUX1 [Dev] 或 FLUX1 [Schnell] 模型的開源 1.1 版本的公告,但很明顯,Black Forest Labs 正致力於為圖像和視頻創作者提供出色的模型。

我們試用了新的Flux型號,結果令人滿意。它不是跨時代的飛躍 — — 就像 SDXL 從Flux演變而來一樣 — — 但肯定是一次受歡迎的升級。

總體來說,它非常逼真,具有出色的文本生成能力,並且在藝術任務和風格方面非常有創意。它是一種很好的多功能模型,可以在不影響質量的情況下快速生成。

提示:“使用 VSCO 濾鏡的寶麗來照片,1990 年,女人,夜晚,閃光燈照片,金髮碧眼,年輕的臉龐,美麗的陰影,熱帶植物,公寓內,數碼單反相機,相機閃光燈,手裡拿著筆記本上的手寫標誌,上面寫著‘2024 年 10 月 7 日Decrypt驗證’。女人用另一隻手比出和平手勢。”

該模型擅長生成逼真的圖像,改進了Flux初始模型的噴繪效果。雖然並不完美,但結果非常令人信服,尤其是在適當的提示下。乍一看,這些圖像(均使用Flux 1.1 Pro 生成)可以被視為真實圖像,而無需挑剔細節。

字體與提示一致,手繪效果有所改善,但還不夠完美。需要注意的是,這些不是手工挑選的樣本,而是前兩代。在使用生成式人工智能時,最好的結果通常是經過幾代和幾段編輯後才能實現。

燈光與相機閃光燈一致,聚焦於拍攝對象,但不會照亮整個房間。VSCO 濾鏡增強了真實感,即時貼合度極佳。

將Flux 1.1 與Flux 1 進行比較,乍一看,兩代模型在真實感方面非常相似。然而,使用相同的提示,新模型可以產生更自然的姿勢和更一致的身體。例如, Flux 1 產生了看起來像是一條額外腿的東西,而Flux 1.1 避免了這一點。這種改進更多地與準確性有關,而不是整體逼真的美感。

提示:“一隻白貓在彈鋼琴,戴著太陽鏡和帽子,穿著紫色夏威夷風格的衣服,全身照在灰色工作室背景下,配有燈光元素,天花板上懸掛著一隻翼手龍,商業視頻截圖。牆上寫著‘Emerge by Decrypt ’”

與Flux 1 Pro 相比, Flux 1.1 在提示貼合方面更進了一步,成功地將更多元素融入場景中,而沒有遺漏任何細節。我們為Flux 1 製作的第一個提示不包括照明元素或翼手龍。此外,新一代提示更加逼真,感覺更加自然。

提示:“一隻狗站在電視機頂上,屏幕上顯示著‘Decrypt’兩個字。左邊是一位身著西裝的女士,手裡拿著一枚硬幣,右邊是一個機器人站在急救箱上。整體場景非常超現實。”

在空間感知方面, Flux 1.1 和Flux 1 不相上下。兩者都可以毫無問題地生成所有元素。但是,在考慮更多細節時, Flux 1.1 Pro 似乎更勝一籌。例如,提示溢出較少(當模型從提示中獲取元素並將其用於其他區域時)。在Flux 1.1 代中,女人拿著一枚硬幣,沒有可見的額外硬幣,而Flux 1 在狗旁邊生成了一堆硬幣。此外, Flux 1 Pro 中額外手的錯誤在較新的模型中不存在,超現實主義風格在Flux 1.1 代中得到了更好的體現。

Flux 1.1 Pro 總體上在其各代產品中更加一致和合乎邏輯。如果你無法運行本地模型,它是一個非常好的競爭對手。它理解自然語言,適合初學者,儘管這不是它的主要優勢。MidJourney 往往更有創意,同時增強了糟糕的提示。

但是, Flux 1.1 Pro 比任何當前型號都更便宜、更快並且質量通常更好,這可能使它成為那些尋求良好的及時性、質量和文本生成功能的人的最佳選擇。

對於那些願意為該模型付費的人來說,目前的任何選擇都可以。我們喜歡 Fal.AI 提供的服務,因為它比其他服務提供了更多的控制權。然而,對於那些想要更專業體驗的人來說,Freepik 似乎是最好的選擇。雖然價格稍貴一些,但它的功能要多得多,不僅提供圖像生成服務,還提供圖像升級、外畫、草稿到圖像生成、背景去除器和實驗內容庫等附加功能。

相关赛道:
來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論