认识 Recraft V3:您从未听说过的最佳 AI 图像生成器

avatar
Decrypt
11-02
本文为机器翻译
展示原文
让Flux和MidJourney退下吧:有一个新的玩家刚刚登上了AI图像生成排行榜的榜首。这个神秘的模型曾被称为Red Panda,在Artificial Analysis的排行榜上让AI观察者们感到困惑,终于揭开了面纱,原来是来自一家鲜为人知的伦敦初创公司Recraft AI推出的全新版本Recraft V3。 这个模型在图像生成器的ELO评分系统上获得了最高分,超过了Flux 1.1 Pro和MidJourney。在效率方面,Recraft V3的生成速度与SDXL相当,在10秒内完成,而且根据盲测结果,它的图像质量无与伦比。 在为期四天的基准测试中,Recraft V3在文本生成质量、解剖学准确性和提示理解方面展现出优势。它是唯一一个能够生成包含长篇文字的图像,而不仅仅是简单的单词或短语集成。 事实上,它表现得如此出色,以至于连之前在Stability AI工作过的研究员Joe Penna,参与过SDXL开发的人,也在公司的Discord服务器上公开赞扬了这个模型。 "哇!这是一个令人惊叹的新模型,Recraft,"他说,"我非常impressed。" 如果你不是深度参与生成式AI或数字设计,你可能还没有听说过它。伦敦初创公司Recraft AI成立于2022年,最初专注于为平面设计师开发AI驱动的工具,而不是面向普通图像生成。但在今年早些时候从Khosla Ventures和前GitHub CEO Nat Friedman那里获得了1100万美元的A轮融资后,它的发展轨迹发生了转变。 Recraft V3擅长创造逼真的图像,能够以显著的精度处理细节和瑕疵,并采用类似于MidJourney、Leonardo或Ideogram的订阅模式。 数字设计是Recraft的核心价值观。这个模型还能够处理文本到矢量的生成,这意味着用户可以提示模型生成可无限放大而不失质量的图像。 免费用户每天可获得50个积分,足以生成50张图像。但是,这是一个全新的商业模式,用户不拥有自己创作的作品的所有权,这一权利仅保留给付费订阅用户,计划从每月10美元起,可获得1000个积分。 用户可通过三种渠道访问Recraft V3:网页界面、Discord命令或iOS和Android移动应用程序。 打开Discord,加入Recraft的服务器,如果你曾使用过MidJourney,你会发现这里很熟悉。进入#image-gen频道,输入/recraft,就能看到魔法般的事情发生。 你还可以在提示后使用不同的修饰符。想要一幅宽屏杰作?加上--ar 16:9。需要竖版?输入--ar 3:4,它都能满足你。 其他有用的补充包括--style命令,让用户选择生成图像的具体视觉效果,无论是写实、3D还是kawaii。有特定的风格在心中?--sref命令允许你上传参考图像,引导AI的艺术视野。 图像生成后,用户可在两个生成图像中选择最喜欢的,然后可以保存或放大4倍。 Recraft.ai的网页界面展现了强大的实力。首先,只需前往Recraft.AI并登录。 进入图像生成界面后,用户只需将提示放在左侧的文本框中即可。 他们还可以通过滑块调整纵横比和图像数量。 通过点击文本框上方的图标按钮,并从弹出菜单中选择首选项,用户还可以更改风格。 这个界面比其他网站更加复杂,一眼就能看出它是针对设计师设计的。它允许用户生成框架、产品模型、一组图像,处理背景,矢量化图像等。 移动端创作者也没有被遗忘。iOSAndroid的官方应用程序已经推出,提供同样优质的生成。只需下载应用程序,登录,点击顶部中间的按钮,在屏幕下方的文本框中输入提示,然后点击生成按钮即可。 用户可以选择图像的细节程度、纵横比、风格和参考资料,所有这些都在同一个界面上。它非常直观。 我们在不同领域测试了这个模型,包括风格和技术能力。以下是它与竞争对手(开源和闭源)的表现: 提示:在一个女性脸上投射"Emerge"这个词 Recraft V3: Recraft展现了对自然肌理、面部表情和环境光线的最佳理解。投射与皮肤融为一体,关键是有真实的瑕疵——可见的毛孔、轻微的皮肤瑕疵和自然的头发飘逸。真挚的表情和背景环境增添了很强的真实感。 Stable Diffusion 3.5: SD 3.5排名第二。与SD3 medium和最佳的SDXL微调相比,已经有了很大进步。它展现了强烈的戏剧性,有橙色调的照明和大胆的红色唇膏。尽管面部特征定义良好,但皮肤质地还是有一种明显的人工感。投射看起来更像是一个锐利的叠加层,表情也显得有些造作和合成。 MidJourney: 一如既往,MidJourney创造了一种阴郁、电影般的感觉,技术执行也很出色。然而,女性的皮肤有一种光滑、近乎神圣的质地,虽然很美,但感觉比Recraft的尝试更不自然。投射融合得很好,但整体的完美性和特征以及明显缺乏真实性的表情,暴露了它的AI起源。 获胜者:Recraft 提示:一只狗站在一台显示"Decrypt"字样的电视机上。左边有一个穿商务套装的女性手持一枚硬币,右边有一个机器人站在一个急救箱上。整个场景是超现实的。 Recraft V3: 该模型在空间感知方面存在失败。然而,它设法实现了整体构图的超现实风格。这与其他模型形成了鲜明对比,它们在元素的遵循和空间感方面表现出色,但整体的氛围或风格令人质疑。 这可以被视为一种权衡,因为在一个构图中修复和编辑元素比重塑整个图像更容易。但是,与其他模型相比,这仍然是一个重大局限性,需要考虑。 获胜者:Flux 提示:一个巨大的蜘蛛在丛林里追逐一个女人,极度可怕、痛苦、黑暗和阴森的场景,恐怖,带有类似模拟摄影的影响,素描 我们尝试了这个模型的许多不同风格,最后选择了Recraft RAW。起初我们认为"手绘"风格是最好的选择,但...并非如此。 在尝试了不同的预设风格后,老牌的RAW(最通用的一种)最适合我们的需求。 与其他模型相比,Recraft生成了一个有趣的构图,准确地表达了场景的关键信息:一只巨大的蜘蛛在追逐一个女人。然而,整体艺术看起来更像是一幅数字插图,而不是手绘插图。 从美学角度来看,最能准确表达这个特定提示的似乎是最新的Stable Diffusion模型,它生成了一幅手绘插图,能够传达一个女人逃离巨大蜘蛛的痛苦。 获胜者:SD3 很容易看出为什么Recraft V3能够登顶图像生成排行榜。与MidJourney和Flux等竞争对手经常陷入可预测的、风格化的模式(如平滑的"Flux面孔"或无生气的"MidJourney风格")不同,Recraft更倾向于写实。它的输出令人惊叹,展现了细腻的肌理、微妙的瑕疵和细腻的光线。这种追求真实性而不牺牲精致的美学平衡,使Recraft在其他模型难以企及的地方占据优势。 定价策略也很重要。Recraft提供了一个每天赠送大量积分的免费层,这是唯一支持文本到SVG生成的模型,这对寻求可扩展的专业级矢量图的插图师来说是一大福音。它的价格也与MidJourney最便宜的计划相当,但除非你正在寻找MidJourney的美学,否则Recraft更加多样和强大,因此是更好的选择。 但是,Recraft并非完美无缺。当涉及到包含多个元素的复杂场景时,空间感有时会出现失误。需要精确构图的提示可能会导致轻微的错位,用户可能需要进行更多的修补或调整位置。但对于那些优先考虑写实性和多样性的人来说,这种缺陷很容易被忽略。 另外,免费用户无法拥有自己创作的作品可能是一个重大缺陷。 总的来说,Recraft V3似乎是最好的闭源选择,在尊重创作者预算的同时,提供了卓越的价值和灵活性。对于那些寻求高质量写实图像而不想要"AI风格"的人来说,Recraft无疑是一个明智的选择。 但是,对于那些有能力在本地运行AI模型的人来说,Flux或SD 3.5可能也足够了。

相关赛道:
来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
2
收藏
1
评论