Freepik 如何从图片库平台转型为人工智慧生成平台

Decrypt

03-09

本文为机器翻译

展示原文

以下是文章的中文翻译:

15年前,Freepik只是另一家股票图像提供商,帮助设计师为他们的项目找到合适的视觉效果。如今,它已经变成了一个完全不同的东西——一个吸引着每月超过6000万访客的生成式AI中心。

这种转变并非偶然。这是一家愿意重新思考自己的目的,并超越静态图像,走向更大的事物的公司的结果:一个完全由AI驱动的创意生态系统。

坐在自己的客厅里,Freepik首席执行官Joaquín Cuenca Abela与Decrypt就AI行业的现状以及他的公司如何利用生成式AI为数字艺术家带来的机会进行了交谈。

"当生成式AI出现时,我们看到我们可以扩展我们的使命,"他告诉Decrypt。"我们不再局限于帮助设计师使用现成的内容。相反,我们可以根据他们的需求进行调整,为每个人创造独特的东西。"

这一举措得到了回报。Freepik现已成为一站式的AI驱动图像和视频生成、放大、动画等服务。Cuenca Abela简单地说:"我们只是想给创意者更多的控制权。"

Freepik起初的前提很简单:消除盯着空白页面的挫折感。在AI出现之前,该平台提供了数百万张股票图像和模板,创意者可以将其作为起点。

"创作过程中最慢、最痛苦的部分就是从零开始,"Cuenca Abela说。"我们通过提供数百万张可以开始创作的图像来消除了这一障碍。"

现在,有了生成式AI,Freepik不仅提供内容库,还可以根据需求创造内容。"摄影师不是传统的Freepik用户,"Cuenca Abela说。"他们已经有自己的图像。但现在,有了我们的放大器Magnific,他们可以以前所未有的方式增强图像。"

这一转变使其受众超越了平面设计师。摄影师使用它来增强、调整和放大图像。电影制作人试验AI生成的视觉效果,建筑师和室内设计师以前需要耗费大量时间和金钱的方式来构建概念,而普通人则使用它来生成美丽的动漫角色——因为,当然,我们谈论的是AI。

在拥挤的AI领域,Freepik正专注于工作流程集成。大多数AI工具专注于一件事,无论是图像生成、视频创作还是放大。Freepik将它们全部连接起来,充当一个枢纽,将不同的开源和专有生成式AI工具集成到一个地方。

除其他服务外,该公司的AI套件包括:

最大的成功案例之一是Magnific,Freepik的AI驱动放大器。它因其能够增强图像细节而不会失真的能力而走红,这是即使顶级AI模型也一直在努力解决的问题。

然后,Mystic是蛋糕上的糖衣,其结果能够与像Ideogram或MirJourney这样的最先进模型相媲美。Mystic实际上是一个工作流程,使用Flux作为核心模型,并在幕后进行了大量调整。

不过,许多专家和爱好者已经尝试用各种方式来模仿Freepik的秘密配方——这依赖于开源模型——但效果参差不齐。Freepik有一种方法可以持续提供优质的结果,并提供最佳的用户界面,这就是客户所支付的费用。

"人们有时会低估一个好产品和一个出色产品之间的差异,"Cuenca Abela说。"最后10%的努力需要90%的时间。这就是为什么许多人试图复制Magnific,但无法完全做到。"

随着AI生成内容的出现,也出现了争议。许多艺术家认为,AI开发者在未经许可的情况下使用受版权保护的作品来训练他们的模型。Cuenca Abela并没有忽视他们的担忧,但他说他从不同的角度看待这个问题。

"如果要求每个创作者的许可才能训练一个AI模型,那些模型根本就不可能存在,"他说。"这就像要求在启动谷歌之前获得每个网页的许可一样。"

他承认存在这种紧张局势。

"这在短期内损害了艺术家——使用艺术家创作的东西。对于受影响的艺术家来说,这是一种深深的不公,"他告诉Decrypt,认识到这种进步迫使他们必须适应。"我们也经历过类似的事情。当(AI)出现时,我们的业务突然变得不那么有价值了。我们不得不适应。"

不过,他认为,AI生成的图像并非直接复制。"传统艺术家通常的抱怨是他们的图像被未经许可使用,这完全属实,"他承认。"但另一个观点是,这些模型生成的图像并不是复制品。如果是人类制作的,就不会有版权侵犯的说法。"

这场辩论的核心基本上是创意控制和技术进步之间的权衡。Cuenca Abela相信,社会最终将偏向AI的好处——就像当类似的辩论围绕摄影取代绘画、数字艺术取代传统艺术,或互联网搜索引擎取代百科全书时一样。

"作为一个社会,我们需要平衡这些事情,做出决定。如果需要创作者的许可才能训练一个模型,那么文本和图像的生成模型就不会存在。"他说。"如果发生这种情况,那么社会就会失去文本模型提供的所有进步。它们可以帮助我们找到疫苗、药物;它们可以带来巨大的科学进步。所有这些进步都将丢失。"

Cuenca还将AI视为自我表达的工具。他没有区分"AI艺术家"和"艺术家"。

"没有区别。这只是一个工具。AI是表达你想要的东西的一种方式,而艺术是表达你内心的东西、你经历的事情、你的生活经历——你可以用AI、绘画、照片来表达这些。这取决于艺术家,"他告诉Decrypt。

"对我来说,这完全是艺术,也是合法的。我对此没有任何道德问题。"

过去,人们普遍认为专有软件是终端用户的首选选择,因为模型和技术通常更加用户友好,提供的质量体验也更好。但是,这种情况已经发生了巨大的变化。

Stable Diffusion革新了AI艺术,Llama是将本地文本生成带给大众的关键,最近,DeepSeek R1重新点燃了关于专有AI公司过度收费其模型的辩论。

不过,一些用户仍然更喜欢专有选择。Cuenca Abela对AI行业的未来有很强的看法,特别是在开源和专有模型之间的战斗中。

"就代码而言,最先进的开源技术与专有模型处于同等水平,"他说。"最大的区别在于训练时间和数据集整理,以及更长的后训练阶段、略好的标签等。但就技术水平而言,我看不到太大的差距。"

尽管像MidJourney和Ideogram这样的专有模型得到了更多的完善,但Cuenca认为开源替代品正在迅速缩小差距。他以Flux为例:"它可能略逊于最好的封闭模型一步,但不是两步。而且因为它是开源的,社区会对其进行微调和构建,有时甚至超过封闭版本。"

对于Freepik来说,多样性和灵活性是首要任务。"熟悉Freepik的人会获得比MidJourney更好的质量,"Cuenca Abela说。"如果你需要照片级真实感,我们有Google Imagen。如果你需要艺术性的文本生成,可以使用Ideogram。如果你需要角色一致性,可以训练一个LoRA。没有一个单一的模型能满足所有需求。"

换句话说,在AI领域没有"百科全书式"的解决方案。选择开源和专有模型的灵活性对于获得创作所需的细粒度至关重要,从而创造出真正反映用户想法的完美作品。

最近,Freepik加大了对AI驱动视频工具的投入。该公司整合了谷歌的Veo 2,大大提高了视频生成质量。

"在Veo 2之前,你必须生成10或20个视频才能得到一个可用的,"Cuenca Abela指出。"现在,有了Veo 2,每隔一次尝试就能得到一个不错的结果。"

但对于视频艺术家来说,真正的游戏规则改变者将是即将推出的AI视频编辑器,他说。用户很快就能在Freepik内部组装完整的视频,而不仅仅是生成短片段。

"现在你只能制作视频剪辑——只能生成2秒、3秒、8秒的短片段。我们正在开发一种允许人们在页面本身编辑它们、添加音频并完成整个组合的东西,"Cuenca Abela告诉Decrypt。

"我们的目标是让Freepik成为创意中心,在这里你不需要离开平台就能完成一个项目,"他说。

我们离人工通用智能(AGI)已经很近了吗?机器会取代我们吗?Cuenca Abela认为AI的快速发展既令人兴奋又令人不安。

"(AGI)现在感觉很近了——比几年前任何人预期的都要近,"他承认。"我们从人们将AI视为玩具,到机器能够思考。"

关于什么构成AGI,