Midjourney v7的Alpha版本上周发布,在这个曾经占据主导地位的图像生成器明显正在失去优势的时候推出。尽管它仍然拥有大约2000万人的庞大Discord用户群,但像OpenAI的GPT-4o、Reve和Ideogram 3.0这样的新工具在真实性、精确度和功能性方面已经超越了它。
这款新的自然语言编辑器完全不同。它摆脱了传统的Stable Diffusion式方法,为用户提供了类似OpenAI在DALL-E 3中引入的更沉浸式体验。
在草稿模式下生成提示后,用户可以在相应的文本框中输入自然语言提示,模型将理解用户要求编辑之前生成的内容。
Midjourney还引入了语音转文字功能,本质上是让用户与用户界面对话并观察其处理请求。这对初学者来说非常好,因为它消除了大部分难度。
然而,与竞争对手相比,它执行得很差。当用户需要特定更改时,Midjourney基本上会编辑整个图像,因此新生成的图像往往会丢失主体或风格一致性。
另一方面,像ChatGPT和Reve这样也实现了这一功能的模型在这方面明显更好,能够保持原始图像的关键特征。
例如,这是ChatGPT处理完全相同迭代的方式:生成一只骑自行车的狗上面的猫,然后被要求让猫戴上红帽子。
这个新版本是一个令人欢迎的升级,可能会让铁杆Midjourney粉丝愿意支付订阅费,起价为每月10美元。然而,每月20美元的ChatGPT显示出更好的提示遵循性、空间感知能力,并包括额外功能以及访问所有其他模型的权限。Reve(订阅起价为每月10美元)在风格和真实感方面也更好。
请记住,这只是一个Alpha版本,这意味着结果不一定会类似于最终产品。用户还可以个性化模型,这可能很有吸引力,也是其他模型不提供的功能。
我们测试类别中的混合结果表明,这更像是模型的演进,而不是我们在这一新一代图像生成器中看到的革命。如果你不依赖Midjourney,那么这个Alpha版本绝对不会让你大吃一惊。
图像编辑功能是一个不错的补充,但可能是一把双刃剑。它可能足够有创意,让用户生成出色的作品,但缺乏一致性使其在编辑特定照片时不可靠。对于这一点,传统的、更复杂的编辑器是唯一合理的选择。
总的来说,如果你真的很喜欢Midjourney,那么这次升级将给你留下停留并享受新功能带来的更好、更新鲜体验的理由。但除非你享受Discord的混乱和痛苦,或是其创意自由的粉丝,否则现在尝试Midjourney没有太多理由。