15年前,Freepik只是另一家股票影象提供商,幫助設計師為他們的專案找到合適的視覺效果。如今,它已經變成了一個完全不同的東西——一個吸引著每月超過6000萬訪客的生成式AI中心。
這種轉變並非偶然。這是一家願意重新思考自己的目的,並超越靜態影象,走向更大的事物的公司的結果:一個完全由AI驅動的創意生態系統。
坐在自己的客廳裡,Freepik執行長Joaquín Cuenca Abela與Decrypt就AI行業的現狀以及他的公司如何利用生成式AI為數字藝術家帶來的機會進行了交談。
"當生成式AI出現時,我們看到我們可以擴充套件我們的使命,"他告訴Decrypt。"我們不再侷限於幫助設計師使用現成的內容。相反,我們可以根據他們的需求進行調整,為每個人創造獨特的東西。"
這一舉措得到了回報。Freepik現已成為一站式的AI驅動影象和影片生成、放大、動畫等服務。Cuenca Abela簡單地說:"我們只是想給創意者更多的控制權。"
Freepik起初的前提很簡單:消除盯著空白頁面的挫折感。在AI出現之前,該平臺提供了數百萬張股票影象和模板,創意者可以將其作為起點。
"創作過程中最慢、最痛苦的部分就是從零開始,"Cuenca Abela說。"我們透過提供數百萬張可以開始創作的影象來消除了這一障礙。"
現在,有了生成式AI,Freepik不僅提供內容庫,還可以根據需求創造內容。"攝影師不是傳統的Freepik使用者,"Cuenca Abela說。"他們已經有自己的影象。但現在,有了我們的放大器Magnific,他們可以以前所未有的方式增強影象。"
這一轉變使其受眾超越了平面設計師。攝影師使用它來增強、調整和放大影象。電影製作人試驗AI生成的視覺效果,建築師和室內設計師以前需要耗費大量時間和金錢的方式來構建概念,而普通人則使用它來生成美麗的動漫角色——因為,當然,我們談論的是AI。
在擁擠的AI領域,Freepik正專注於工作流程整合。大多數AI工具專注於一件事,無論是影象生成、影片創作還是放大。Freepik將它們全部連線起來,充當一個樞紐,將不同的開源和專有生成式AI工具整合到一個地方。
除其他服務外,該公司的AI套件包括:
最大的成功案例之一是Magnific,Freepik的AI驅動放大器。它因其能夠增強影象細節而不會失真的能力而走紅,這是即使頂級AI模型也一直在努力解決的問題。
然後,Mystic是蛋糕上的糖衣,其結果能夠與像Ideogram或MirJourney這樣的最先進模型相媲美。Mystic實際上是一個工作流程,使用Flux作為核心模型,並在幕後進行了大量調整。
不過,許多專家和愛好者已經嘗試用各種方式來模仿Freepik的秘密配方——這依賴於開源模型——但效果參差不齊。Freepik有一種方法可以持續提供優質的結果,並提供最佳的使用者介面,這就是客戶所支付的費用。
"人們有時會低估一個好產品和一個出色產品之間的差異,"Cuenca Abela說。"最後10%的努力需要90%的時間。這就是為什麼許多人試圖複製Magnific,但無法完全做到。"
隨著AI生成內容的出現,也出現了爭議。許多藝術家認為,AI開發者在未經許可的情況下使用受版權保護的作品來訓練他們的模型。Cuenca Abela並沒有忽視他們的擔憂,但他說他從不同的角度看待這個問題。
"如果要求每個創作者的許可才能訓練一個AI模型,那些模型根本就不可能存在,"他說。"這就像要求在啟動谷歌之前獲得每個網頁的許可一樣。"
他承認存在這種緊張局勢。
"這在短期內損害了藝術家——使用藝術家創作的東西。對於受影響的藝術家來說,這是一種深深的不公,"他告訴Decrypt,認識到這種進步迫使他們必須適應。"我們也經歷過類似的事情。當(AI)出現時,我們的業務突然變得不那麼有價值了。我們不得不適應。"
不過,他認為,AI生成的影象並非直接複製。"傳統藝術家通常的抱怨是他們的影象被未經許可使用,這完全屬實,"他承認。"但另一個觀點是,這些模型生成的影象並不是複製品。如果是人類製作的,就不會有版權侵犯的說法。"
這場辯論的核心基本上是創意控制和技術進步之間的權衡。Cuenca Abela相信,社會最終將偏向AI的好處——就像當類似的辯論圍繞攝影取代繪畫、數字藝術取代傳統藝術,或網際網路搜尋引擎取代百科全書時一樣。
"作為一個社會,我們需要平衡這些事情,做出決定。如果需要創作者的許可才能訓練一個模型,那麼文字和影象的生成模型就不會存在。"他說。"如果發生這種情況,那麼社會就會失去文字模型提供的所有進步。它們可以幫助我們找到疫苗、藥物;它們可以帶來巨大的科學進步。所有這些進步都將丟失。"
Cuenca還將AI視為自我表達的工具。他沒有區分"AI藝術家"和"藝術家"。
"沒有區別。這只是一個工具。AI是表達你想要的東西的一種方式,而藝術是表達你內心的東西、你經歷的事情、你的生活經歷——你可以用AI、繪畫、照片來表達這些。這取決於藝術家,"他告訴Decrypt。
"對我來說,這完全是藝術,也是合法的。我對此沒有任何道德問題。"
過去,人們普遍認為專有軟體是終端使用者的首選選擇,因為模型和技術通常更加使用者友好,提供的質量體驗也更好。但是,這種情況已經發生了巨大的變化。
Stable Diffusion革新了AI藝術,Llama是將本地文字生成帶給大眾的關鍵,最近,DeepSeek R1重新點燃了關於專有AI公司過度收費其模型的辯論。
不過,一些使用者仍然更喜歡專有選擇。Cuenca Abela對AI行業的未來有很強的看法,特別是在開源和專有模型之間的戰鬥中。
"就程式碼而言,最先進的開源技術與專有模型處於同等水平,"他說。"最大的區別在於訓練時間和資料集整理,以及更長的後訓練階段、略好的標籤等。但就技術水平而言,我看不到太大的差距。"
儘管像MidJourney和Ideogram這樣的專有模型得到了更多的完善,但Cuenca認為開源替代品正在迅速縮小差距。他以Flux為例:"它可能略遜於最好的封閉模型一步,但不是兩步。而且因為它是開源的,社群會對其進行微調和構建,有時甚至超過封閉版本。"
對於Freepik來說,多樣性和靈活性是首要任務。"熟悉Freepik的人會獲得比MidJourney更好的質量,"Cuenca Abela說。"如果你需要照片級真實感,我們有Google Imagen。如果你需要藝術性的文字生成,可以使用Ideogram。如果你需要角色一致性,可以訓練一個LoRA。沒有一個單一的模型能滿足所有需求。"
換句話說,在AI領域沒有"百科全書式"的解決方案。選擇開源和專有模型的靈活性對於獲得創作所需的細粒度至關重要,從而創造出真正反映使用者想法的完美作品。
最近,Freepik加大了對AI驅動影片工具的投入。該公司整合了谷歌的Veo 2,大大提高了影片生成質量。
"在Veo 2之前,你必須生成10或20個影片才能得到一個可用的,"Cuenca Abela指出。"現在,有了Veo 2,每隔一次嘗試就能得到一個不錯的結果。"
但對於影片藝術家來說,真正的遊戲規則改變者將是即將推出的AI影片編輯器,他說。使用者很快就能在Freepik內部組裝完整的影片,而不僅僅是生成短片段。
"現在你只能製作影片剪輯——只能生成2秒、3秒、8秒的短片段。我們正在開發一種允許人們在頁面本身編輯它們、新增音訊並完成整個組合的東西,"Cuenca Abela告訴Decrypt。
"我們的目標是讓Freepik成為創意中心,在這裡你不需要離開平臺就能完成一個專案,"他說。
我們離人工通用智慧(AGI)已經很近了嗎?機器會取代我們嗎?Cuenca Abela認為AI的快速發展既令人興奮又令人不安。
"(AGI)現在感覺很近了——比幾年前任何人預期的都要近,"他承認。"我們從人們將AI視為玩具,到機器能夠思考。"
關於什麼構成AGI,




