ChatGPT圖像功能大升級

OpenAI與谷歌的世界頂級AI應用之戰,又展開新一輪攻防。

北京時間週三凌晨,OpenAI宣佈推出新版ChatGPT圖像功能,除了圖像生成質量更好、生成速度更快外,新版Images 模型在圖像編輯的精確性方面也迎來重要進步。可以說,OpenAI不僅向谷歌備受讚譽的Nano Banana系列模型發起反擊,還順勢踢了一腳Photoshop的“飯碗”。

OpenAI介紹稱,基於最新旗艦圖像生成模型的“ChatGPT圖像”功能,能夠在保持細節完整的同時進行精確編輯,更有可能呈現出用戶希望看到的效果。在保持細節完整的同時進行精確編輯,生成速度提升至多4倍

當然,圖像生成模型的效果,得用圖像來說明。

作為此次升級的最關鍵提升,OpenAI介紹稱,新模型擅長多種類型的精確編輯,包括添加、刪除、合併、混合和轉置,在獲取修圖效果的同時,保留圖片本身的特點

舉例而言,以下是ChatGPT新圖像模型生成的90年代末的洛杉磯街頭攝影(演示版)。

→把人物的襯衫改成紅色帽子改成黃色,限速改為15卡車改成消防車

→在左側加一群觀看的人,右側人行道上棲著一隻鷹,遠處有一隻飛船在天空中飛過;

→帶有該圖像全包印花的T恤掛在晾衣繩上;

→將那件T恤給穿到滑板手身上。

作為AI生成圖像的重要應用,ChatGPT圖像在創造性改造現有圖片方面也有進步。例如將公司CEO奧爾特曼的個人照,轉換成美國80年代的健美操教練,或是把他的臉放進世界名畫《戴珍珠耳環的少女》中。

另外,ChatGPT也向谷歌的傳統優勢項目——生成富含文字信息的示意圖,發起了挑戰。OpenAI表示,該模型在文本呈現上更進一步,能夠處理更密集、更小的文字

需要說明的是,雖然ChatGPT在生成英文字體時已經能夠“以假亂真”,但官方也承認,這個新模型在生成中文、阿拉伯語、希伯來語方面仍存在侷限性

因此,至少在中文文字圖像生成方面, Nano Banana依然是徹底碾壓ChatGPT的存在

值得一提的是,新圖像生成模型更強、也更便宜了。與GPT Image 1相比,升級後的GPT Image 1.5圖像輸入和輸出成本均降低20%。

本文來自微信公眾號“科創日報”,作者:史正丞,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論