OpenAI 推出 DALL-E 3 文本到圖像模型

avatar
AI News
09-21
本文為機器翻譯
展示原文

OpenAI 宣佈推出DALL-E 3 ,這是其廣受好評的文本轉圖像模型的第三次迭代。

DALL-E 3 承諾在其前代產品基礎上進行重大改進,並實現與 ChatGPT 的無縫集成。

DALL-E 3 的突出特點之一是,當面對詳細而冗長的提示時,它能夠更好地理解和解釋用戶意圖:

一位亞裔中年女性,她烏黑的頭髮中夾雜著銀絲,看起來支離破碎,錯綜複雜地嵌在一片碎瓷片的海洋中。瓷片上閃爍著潑墨圖案的光澤,藍色、綠色……光澤與啞光交織,和諧交融…… pic.twitter.com/QryQz0BtxB

— OpenAI (@OpenAI) 2023 年 9 月 20 日

即使用戶難以準確表達他們的想法,ChatGPT 也可以介入並協助制定全面的提示。

DALL-E 3 經過精心設計,能夠創造出其前輩和其他 AI 生成器一直難以實現的元素,例如渲染複雜的手部描繪以及將文本合併到圖像中:

一幅由半透明玻璃製成的人心插畫,矗立在波濤洶湧的大海中的基座上。陽光穿透雲層,照亮了心臟,展現出其中的微小宇宙。“發現你內心的宇宙”這句話以粗體字刻在…… pic.twitter.com/S3cKMkG67T

— OpenAI (@OpenAI) 2023 年 9 月 20 日

OpenAI 還實施了強大的安全措施,通過識別和忽略提示中的某些關鍵字,確保 AI 系統不會生成露骨或令人反感的內容。

除了技術進步之外,OpenAI 還採取了措施來減輕潛在的法律問題。

雖然目前的 DALL-E 版本可以模仿在世藝術家的風格,但即將推出的 DALL-E 3 的設計將拒絕複製其版權作品的請求。藝術家還可以選擇通過 OpenAI 網站上的專用表單提交原創作品,並在必要時請求刪除。

OpenAI 的 DALL-E 3 推廣計劃包括下個月向 ChatGPT“Plus”和“Enterprise”客戶首次發佈。增強型圖像生成器將於即將到來的秋季向 OpenAI 的研究實驗室和 API 客戶提供。

隨著 OpenAI 不斷突破人工智能技術的界限,DALL-E 3 代表著文本到圖像生成的重大進步。

(圖片來源: OpenAI

另請參閱: Stability AI 推出可控音頻生成的“穩定音頻”模型

想從行業領袖那裡瞭解更多人工智能和大數據知識?歡迎關注在阿姆斯特丹、加利福尼亞和倫敦舉辦的人工智能與大數據博覽會。這場綜合性盛會與數字化轉型周同期舉辦。

在此探索由 TechForge 主辦的其他即將舉行的企業技術活動和網絡研討會。

OpenAI 揭示 DALL-E 3 文本到圖像模型一文最先出現在AI News上。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論