OpenAI 宣佈推出DALL-E 3 ,這是其廣受好評的文本轉圖像模型的第三次迭代。
DALL-E 3 承諾在其前代產品基礎上進行重大改進,並實現與 ChatGPT 的無縫集成。
DALL-E 3 的突出特點之一是,當面對詳細而冗長的提示時,它能夠更好地理解和解釋用戶意圖:
一位亞裔中年女性,她烏黑的頭髮中夾雜著銀絲,看起來支離破碎,錯綜複雜地嵌在一片碎瓷片的海洋中。瓷片上閃爍著潑墨圖案的光澤,藍色、綠色……光澤與啞光交織,和諧交融…… pic.twitter.com/QryQz0BtxB
— OpenAI (@OpenAI) 2023 年 9 月 20 日
即使用戶難以準確表達他們的想法,ChatGPT 也可以介入並協助制定全面的提示。
DALL-E 3 經過精心設計,能夠創造出其前輩和其他 AI 生成器一直難以實現的元素,例如渲染複雜的手部描繪以及將文本合併到圖像中:
一幅由半透明玻璃製成的人心插畫,矗立在波濤洶湧的大海中的基座上。陽光穿透雲層,照亮了心臟,展現出其中的微小宇宙。“發現你內心的宇宙”這句話以粗體字刻在…… pic.twitter.com/S3cKMkG67T
— OpenAI (@OpenAI) 2023 年 9 月 20 日
OpenAI 還實施了強大的安全措施,通過識別和忽略提示中的某些關鍵字,確保 AI 系統不會生成露骨或令人反感的內容。
除了技術進步之外,OpenAI 還採取了措施來減輕潛在的法律問題。
雖然目前的 DALL-E 版本可以模仿在世藝術家的風格,但即將推出的 DALL-E 3 的設計將拒絕複製其版權作品的請求。藝術家還可以選擇通過 OpenAI 網站上的專用表單提交原創作品,並在必要時請求刪除。
OpenAI 的 DALL-E 3 推廣計劃包括下個月向 ChatGPT“Plus”和“Enterprise”客戶首次發佈。增強型圖像生成器將於即將到來的秋季向 OpenAI 的研究實驗室和 API 客戶提供。
隨著 OpenAI 不斷突破人工智能技術的界限,DALL-E 3 代表著文本到圖像生成的重大進步。
(圖片來源: OpenAI )
另請參閱: Stability AI 推出可控音頻生成的“穩定音頻”模型

想從行業領袖那裡瞭解更多人工智能和大數據知識?歡迎關注在阿姆斯特丹、加利福尼亞和倫敦舉辦的人工智能與大數據博覽會。這場綜合性盛會與數字化轉型周同期舉辦。
在此探索由 TechForge 主辦的其他即將舉行的企業技術活動和網絡研討會。
OpenAI 揭示 DALL-E 3 文本到圖像模型一文最先出現在AI News上。





