Midjourney v7 評測:前行業標準難以跟上

avatar
Decrypt
04-08
本文為機器翻譯
展示原文

Midjourney v7的Alpha版本上週釋出,在這個曾經佔據主導地位的影象生成器明顯正在失去優勢的時候推出。儘管它仍然擁有大約2000萬人的龐大Discord使用者群,但像OpenAI的GPT-4oReve和Ideogram 3.0這樣的新工具在真實性、精確度和功能性方面已經超越了它。

這款新的自然語言編輯器完全不同。它擺脫了傳統的Stable Diffusion式方法,為使用者提供了類似OpenAI在DALL-E 3中引入的更沉浸式體驗。

在草稿模式下生成提示後,使用者可以在相應的文字框中輸入自然語言提示,模型將理解使用者要求編輯之前生成的內容。

Midjourney還引入了語音轉文字功能,本質上是讓使用者與使用者介面對話並觀察其處理請求。這對初學者來說非常好,因為它消除了大部分難度。

然而,與競爭對手相比,它執行得很差。當用戶需要特定更改時,Midjourney基本上會編輯整個影象,因此新生成的影象往往會丟失主體或風格一致性。

另一方面,像ChatGPT和Reve這樣也實現了這一功能的模型在這方面明顯更好,能夠保持原始影象的關鍵特徵。

例如,這是ChatGPT處理完全相同迭代的方式:生成一隻騎腳踏車的狗上面的貓,然後被要求讓貓戴上紅帽子。

這個新版本是一個令人歡迎的升級,可能會讓鐵桿Midjourney粉絲願意支付訂閱費,起價為每月10美元。然而,每月20美元的ChatGPT顯示出更好的提示遵循性、空間感知能力,幷包括額外功能以及訪問所有其他模型的許可權。Reve(訂閱起價為每月10美元)在風格和真實感方面也更好。

請記住,這只是一個Alpha版本,這意味著結果不一定會類似於最終產品。使用者還可以個性化模型,這可能很有吸引力,也是其他模型不提供的功能。

我們測試類別中的混合結果表明,這更像是模型的演進,而不是我們在這一新一代影象生成器中看到的革命。如果你不依賴Midjourney,那麼這個Alpha版本絕對不會讓你大吃一驚。

影象編輯功能是一個不錯的補充,但可能是一把雙刃劍。它可能足夠有創意,讓使用者生成出色的作品,但缺乏一致性使其在編輯特定照片時不可靠。對於這一點,傳統的、更復雜的編輯器是唯一合理的選擇。

總的來說,如果你真的很喜歡Midjourney,那麼這次升級將給你留下停留並享受新功能帶來的更好、更新鮮體驗的理由。但除非你享受Discord的混亂和痛苦,或是其創意自由的粉絲,否則現在嘗試Midjourney沒有太多理由。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論