Flux 1.1 Pro:你无法运作的最佳 AI 影像产生器

avatar
Decrypt
10-08
本文为机器翻译
展示原文

Flux 系列 AI 图像生成器背后的开发工作室 Black Forest Labs 上周宣布发布Flux 1.1 [Pro]。 就在发布该系列模型的两个月前,该系列模型包括Flux 1 Pro(一款具有行业领先功能的闭源模型)、 Flux 1 Dev(一款非商业开源模型)和Flux Schnell(一款完全开源模型)。

Flux模型凭借其文本生成能力、快速遵循性和整体图像质量,标志着生成式人工智能技术的重大飞跃。即使是较小的模型Flux Dev 和Flux Schnell 也生成了与 MidJourney 生成的结果相当的结果,并且比 SD3 提供的输出要好得多,SD3 是 Stability 备受期待的对 SDXL 的改进,结果有点令人失望

新模型已经取得了显著成绩,在人工智能模型领先的基准测试平台——人工智能分析图像领域获得了最高的 Elo 分数。它的表现优于市场上所有其他文本转图像模型,同时速度几乎与最小模型一样快。

下图 Y 轴表示 Elo 分数(图像质量),X 轴表示生成速度。MidJourney 爱好者可能会注意到他们的模型没有显示出来——它的速度太慢了,简直超出了图表范围。然而,它的 Elo 分数大约在 1100 分左右,略低于 Ideogram V2。

新款Flux Pro 在定价方面脱颖而出,Flux1.1 Pro 每张图片售价 0.04 美元,低于市场上许多其他型号,包括原版 Flux1 Pro。这种定价结构使其成为 MidJourney 和 Ideogram 等其他付费服务的强大竞争对手,后者的年费分别为96 美元84 美元。MidJourney 和 Ideogram 选项的速度也较慢,每个令牌的成本也更高。

遗憾的是,Flux1.1 Pro 无法在本地运行。与功能较弱的开源模型(例如 FLUX1 [Dev] 和 FLUX1 [Schnell] 模型)不同,这个新的专业版是一个闭源模型,限制用户通过Together AIReplicateFal AIFreepik等平台访问它。它无法进行微调或个性化。

对于那些想要尝试该模型的人来说,其中一些平台会提供一些免费生成积分,但一旦这些积分用完,根据我们自己的标准,最好的服务是Freepik。这是因为它的 Mystic 工作流程可以显著增强生成效果,使其细节更丰富,美感更强。

目前还没有关于 FLUX1 [Dev] 或 FLUX1 [Schnell] 模型的开源 1.1 版本的公告,但很明显,Black Forest Labs 正致力于为图像和视频创作者提供出色的模型。

我们试用了新的Flux型号,结果令人满意。它不是跨时代的飞跃 — — 就像 SDXL 从Flux演变而来一样 — — 但肯定是一次受欢迎的升级。

总体来说,它非常逼真,具有出色的文本生成能力,并且在艺术任务和风格方面非常有创意。它是一种很好的多功能模型,可以在不影响质量的情况下快速生成。

提示:“使用 VSCO 滤镜的宝丽来照片,1990 年,女人,夜晚,闪光灯照片,金发碧眼,年轻的脸庞,美丽的阴影,热带植物,公寓内,数码单反相机,相机闪光灯,手里拿着笔记本上的手写标志,上面写着‘2024 年 10 月 7 日Decrypt验证’。女人用另一只手比出和平手势。”

该模型擅长生成逼真的图像,改进了Flux初始模型的喷绘效果。虽然并不完美,但结果非常令人信服,尤其是在适当的提示下。乍一看,这些图像(均使用Flux 1.1 Pro 生成)可以被视为真实图像,而无需挑剔细节。

字体与提示一致,手绘效果有所改善,但还不够完美。需要注意的是,这些不是手工挑选的样本,而是前两代。在使用生成式人工智能时,最好的结果通常是经过几代和几段编辑后才能实现。

灯光与相机闪光灯一致,聚焦于拍摄对象,但不会照亮整个房间。VSCO 滤镜增强了真实感,即时贴合度极佳。

将Flux 1.1 与Flux 1 进行比较,乍一看,两代模型在真实感方面非常相似。然而,使用相同的提示,新模型可以产生更自然的姿势和更一致的身体。例如, Flux 1 产生了看起来像是一条额外腿的东西,而Flux 1.1 避免了这一点。这种改进更多地与准确性有关,而不是整体逼真的美感。

提示:“一只白猫在弹钢琴,戴着太阳镜和帽子,穿着紫色夏威夷风格的衣服,全身照在灰色工作室背景下,配有灯光元素,天花板上悬挂着一只翼手龙,商业视频截图。墙上写着‘Emerge by Decrypt ’”

与Flux 1 Pro 相比, Flux 1.1 在提示贴合方面更进了一步,成功地将更多元素融入场景中,而没有遗漏任何细节。我们为Flux 1 制作的第一个提示不包括照明元素或翼手龙。此外,新一代提示更加逼真,感觉更加自然。

提示:“一只狗站在电视机顶上,屏幕上显示着‘Decrypt’两个字。左边是一位身着西装的女士,手里拿着一枚硬币,右边是一个机器人站在急救箱上。整体场景非常超现实。”

在空间感知方面, Flux 1.1 和Flux 1 不相上下。两者都可以毫无问题地生成所有元素。但是,在考虑更多细节时, Flux 1.1 Pro 似乎更胜一筹。例如,提示溢出较少(当模型从提示中获取元素并将其用于其他区域时)。在Flux 1.1 代中,女人拿着一枚硬币,没有可见的额外硬币,而Flux 1 在狗旁边生成了一堆硬币。此外, Flux 1 Pro 中额外手的错误在较新的模型中不存在,超现实主义风格在Flux 1.1 代中得到了更好的体现。

Flux 1.1 Pro 总体上在其各代产品中更加一致和合乎逻辑。如果你无法运行本地模型,它是一个非常好的竞争对手。它理解自然语言,适合初学者,尽管这不是它的主要优势。MidJourney 往往更有创意,同时增强了糟糕的提示。

但是, Flux 1.1 Pro 比任何当前型号都更便宜、更快并且质量通常更好,这可能使它成为那些寻求良好的及时性、质量和文本生成功能的人的最佳选择。

对于那些愿意为该模型付费的人来说,目前的任何选择都可以。我们喜欢 Fal.AI 提供的服务,因为它比其他服务提供了更多的控制权。然而,对于那些想要更专业体验的人来说,Freepik 似乎是最好的选择。虽然价格稍贵一些,但它的功能要多得多,不仅提供图像生成服务,还提供图像升级、外画、草稿到图像生成、背景去除器和实验内容库等附加功能。

相关赛道:
来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论