ChatGPT圖像功能大升級

12-18

OpenAI與谷歌的世界頂級AI應用之戰，又展開新一輪攻防。

北京時間週三凌晨，OpenAI宣佈推出新版ChatGPT圖像功能，除了圖像生成質量更好、生成速度更快外，新版Images 模型在圖像編輯的精確性方面也迎來重要進步。可以說，OpenAI不僅向谷歌備受讚譽的Nano Banana系列模型發起反擊，還順勢踢了一腳Photoshop的“飯碗”。

OpenAI介紹稱，基於最新旗艦圖像生成模型的“ChatGPT圖像”功能，能夠在保持細節完整的同時進行精確編輯，更有可能呈現出用戶希望看到的效果。在保持細節完整的同時進行精確編輯，生成速度提升至多4倍。

當然，圖像生成模型的效果，得用圖像來說明。

作為此次升級的最關鍵提升，OpenAI介紹稱，新模型擅長多種類型的精確編輯，包括添加、刪除、合併、混合和轉置，在獲取修圖效果的同時，保留圖片本身的特點。

舉例而言，以下是ChatGPT新圖像模型生成的90年代末的洛杉磯街頭攝影（演示版）。

→把人物的襯衫改成紅色，帽子改成黃色，限速改為15，卡車改成消防車；

→在左側加一群觀看的人，右側人行道上棲著一隻鷹，遠處有一隻飛船在天空中飛過；

→帶有該圖像全包印花的T恤掛在晾衣繩上；

→將那件T恤給穿到滑板手身上。

作為AI生成圖像的重要應用，ChatGPT圖像在創造性改造現有圖片方面也有進步。例如將公司CEO奧爾特曼的個人照，轉換成美國80年代的健美操教練，或是把他的臉放進世界名畫《戴珍珠耳環的少女》中。

另外，ChatGPT也向谷歌的傳統優勢項目——生成富含文字信息的示意圖，發起了挑戰。OpenAI表示，該模型在文本呈現上更進一步，能夠處理更密集、更小的文字。

需要說明的是，雖然ChatGPT在生成英文字體時已經能夠“以假亂真”，但官方也承認，這個新模型在生成中文、阿拉伯語、希伯來語方面仍存在侷限性。

因此，至少在中文文字圖像生成方面， Nano Banana依然是徹底碾壓ChatGPT的存在。

值得一提的是，新圖像生成模型更強、也更便宜了。與GPT Image 1相比，升級後的GPT Image 1.5圖像輸入和輸出成本均降低20%。

本文來自微信公眾號“科創日報”，作者：史正丞，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

收藏

評論

分享

相關推薦

5.5萬美元，將是比特幣的生死線

FinChain Avalanche 的合作旨在推動亞洲 RWA 代幣化和機構流動性。

麻吉大哥虧慘一夜沒睡？以太坊跌破2000鎂慌了，開倉做多ETH、HYPE 割肉12萬鎂全輸光