認識 Recraft V3:您從未聽說過的最佳 AI 圖像生成器
本文為機器翻譯
展示原文
讓Flux和MidJourney退下吧:有一個新的玩家剛剛登上了AI影象生成排行榜的榜首。這個神秘的模型曾被稱為Red Panda,在Artificial Analysis的排行榜上讓AI觀察者們感到困惑,終於揭開了面紗,原來是來自一家鮮為人知的倫敦初創公司Recraft AI推出的全新版本Recraft V3。
這個模型在影象生成器的ELO評分系統上獲得了最高分,超過了Flux 1.1 Pro和MidJourney。在效率方面,Recraft V3的生成速度與SDXL相當,在10秒內完成,而且根據盲測結果,它的影象質量無與倫比。
在為期四天的基準測試中,Recraft V3在文字生成質量、解剖學準確性和提示理解方面展現出優勢。它是唯一一個能夠生成包含長篇文字的影象,而不僅僅是簡單的單詞或短語整合。
事實上,它表現得如此出色,以至於連之前在Stability AI工作過的研究員Joe Penna,參與過SDXL開發的人,也在公司的Discord伺服器上公開讚揚了這個模型。
"哇!這是一個令人驚歎的新模型,Recraft,"他說,"我非常impressed。"
如果你不是深度參與生成式AI或數字設計,你可能還沒有聽說過它。倫敦初創公司Recraft AI成立於2022年,最初專注於為平面設計師開發AI驅動的工具,而不是面向普通影象生成。但在今年早些時候從Khosla Ventures和前GitHub CEO Nat Friedman那裡獲得了1100萬美元的A輪融資後,它的發展軌跡發生了轉變。
Recraft V3擅長創造逼真的影象,能夠以顯著的精度處理細節和瑕疵,並採用類似於MidJourney、Leonardo或Ideogram的訂閱模式。
數字設計是Recraft的核心價值觀。這個模型還能夠處理文字到向量的生成,這意味著使用者可以提示模型生成可無限放大而不失質量的影象。
免費使用者每天可獲得50個積分,足以生成50張影象。但是,這是一個全新的商業模式,使用者不擁有自己創作的作品的所有權,這一權利僅保留給付費訂閱使用者,計劃從每月10美元起,可獲得1000個積分。
使用者可透過三種渠道訪問Recraft V3:網頁介面、Discord命令或iOS和Android移動應用程式。
開啟Discord,加入Recraft的伺服器,如果你曾使用過MidJourney,你會發現這裡很熟悉。進入#image-gen頻道,輸入/recraft,就能看到魔法般的事情發生。
你還可以在提示後使用不同的修飾符。想要一幅寬屏傑作?加上--ar 16:9。需要豎版?輸入--ar 3:4,它都能滿足你。
其他有用的補充包括--style命令,讓使用者選擇生成影象的具體視覺效果,無論是寫實、3D還是kawaii。有特定的風格在心中?--sref命令允許你上傳參考影象,引導AI的藝術視野。
影象生成後,使用者可在兩個生成影象中選擇最喜歡的,然後可以儲存或放大4倍。
Recraft.ai的網頁介面展現了強大的實力。首先,只需前往Recraft.AI並登入。
進入影象生成介面後,使用者只需將提示放在左側的文字框中即可。
他們還可以透過滑塊調整縱橫比和影象數量。
透過點選文字框上方的圖示按鈕,並從彈出選單中選擇首選項,使用者還可以更改風格。
這個介面比其他網站更加複雜,一眼就能看出它是針對設計師設計的。它允許使用者生成框架、產品模型、一組影象,處理背景,向量化影象等。
移動端創作者也沒有被遺忘。iOS和Android的官方應用程式已經推出,提供同樣優質的生成。只需下載應用程式,登入,點選頂部中間的按鈕,在螢幕下方的文字框中輸入提示,然後點選生成按鈕即可。
使用者可以選擇影象的細節程度、縱橫比、風格和參考資料,所有這些都在同一個介面上。它非常直觀。
我們在不同領域測試了這個模型,包括風格和技術能力。以下是它與競爭對手(開源和閉源)的表現:
提示:在一個女性臉上投射"Emerge"這個詞
Recraft V3:
Recraft展現了對自然肌理、面部表情和環境光線的最佳理解。投射與皮膚融為一體,關鍵是有真實的瑕疵——可見的毛孔、輕微的皮膚瑕疵和自然的頭髮飄逸。真摯的表情和背景環境增添了很強的真實感。
Stable Diffusion 3.5:
SD 3.5排名第二。與SD3 medium和最佳的SDXL微調相比,已經有了很大進步。它展現了強烈的戲劇性,有橙色調的照明和大膽的紅色唇膏。儘管面部特徵定義良好,但皮膚質地還是有一種明顯的人工感。投射看起來更像是一個銳利的疊加層,表情也顯得有些造作和合成。
MidJourney:
一如既往,MidJourney創造了一種陰鬱、電影般的感覺,技術執行也很出色。然而,女性的皮膚有一種光滑、近乎神聖的質地,雖然很美,但感覺比Recraft的嘗試更不自然。投射融合得很好,但整體的完美性和特徵以及明顯缺乏真實性的表情,暴露了它的AI起源。
獲勝者:Recraft
提示:一隻狗站在一臺顯示"Decrypt"字樣的電視機上。左邊有一個穿商務套裝的女性手持一枚硬幣,右邊有一個機器人站在一個急救箱上。整個場景是超現實的。
Recraft V3:
該模型在空間感知方面存在失敗。然而,它設法實現了整體構圖的超現實風格。這與其他模型形成了鮮明對比,它們在元素的遵循和空間感方面表現出色,但整體的氛圍或風格令人質疑。
這可以被視為一種權衡,因為在一個構圖中修復和編輯元素比重塑整個影象更容易。但是,與其他模型相比,這仍然是一個重大侷限性,需要考慮。
獲勝者:Flux
提示:一個巨大的蜘蛛在叢林裡追逐一個女人,極度可怕、痛苦、黑暗和陰森的場景,恐怖,帶有類似模擬攝影的影響,素描
我們嘗試了這個模型的許多不同風格,最後選擇了Recraft RAW。起初我們認為"手繪"風格是最好的選擇,但...並非如此。
在嘗試了不同的預設風格後,老牌的RAW(最通用的一種)最適合我們的需求。
與其他模型相比,Recraft生成了一個有趣的構圖,準確地表達了場景的關鍵資訊:一隻巨大的蜘蛛在追逐一個女人。然而,整體藝術看起來更像是一幅數字插圖,而不是手繪插圖。
從美學角度來看,最能準確表達這個特定提示的似乎是最新的Stable Diffusion模型,它生成了一幅手繪插圖,能夠傳達一個女人逃離巨大蜘蛛的痛苦。
獲勝者:SD3
很容易看出為什麼Recraft V3能夠登頂影象生成排行榜。與MidJourney和Flux等競爭對手經常陷入可預測的、風格化的模式(如平滑的"Flux面孔"或無生氣的"MidJourney風格")不同,Recraft更傾向於寫實。它的輸出令人驚歎,展現了細膩的肌理、微妙的瑕疵和細膩的光線。這種追求真實性而不犧牲精緻的美學平衡,使Recraft在其他模型難以企及的地方佔據優勢。
定價策略也很重要。Recraft提供了一個每天贈送大量積分的免費層,這是唯一支援文字到SVG生成的模型,這對尋求可擴充套件的專業級向量圖的插圖師來說是一大福音。它的價格也與MidJourney最便宜的計劃相當,但除非你正在尋找MidJourney的美學,否則Recraft更加多樣和強大,因此是更好的選擇。
但是,Recraft並非完美無缺。當涉及到包含多個元素的複雜場景時,空間感有時會出現失誤。需要精確構圖的提示可能會導致輕微的錯位,使用者可能需要進行更多的修補或調整位置。但對於那些優先考慮寫實性和多樣性的人來說,這種缺陷很容易被忽略。
另外,免費使用者無法擁有自己創作的作品可能是一個重大缺陷。
總的來說,Recraft V3似乎是最好的閉源選擇,在尊重創作者預算的同時,提供了卓越的價值和靈活性。對於那些尋求高質量寫實影象而不想要"AI風格"的人來說,Recraft無疑是一個明智的選擇。
但是,對於那些有能力在本地執行AI模型的人來說,Flux或SD 3.5可能也足夠了。
來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享