OpenAI 推出 DALL-E 3 文本到图像模型

avatar
AI News
09-21
本文为机器翻译
展示原文

OpenAI 宣布推出DALL-E 3 ,这是其广受好评的文本转图像模型的第三次迭代。

DALL-E 3 承诺在其前代产品基础上进行重大改进,并实现与 ChatGPT 的无缝集成。

DALL-E 3 的突出特点之一是,当面对详细而冗长的提示时,它能够更好地理解和解释用户意图:

一位亚裔中年女性,她乌黑的头发中夹杂着银丝,看起来支离破碎,错综复杂地嵌在一片碎瓷片的海洋中。瓷片上闪烁着泼墨图案的光泽,蓝色、绿色……光泽与哑光交织,和谐交融…… pic.twitter.com/QryQz0BtxB

— OpenAI (@OpenAI) 2023 年 9 月 20 日

即使用户难以准确表达他们的想法,ChatGPT 也可以介入并协助制定全面的提示。

DALL-E 3 经过精心设计,能够创造出其前辈和其他 AI 生成器一直难以实现的元素,例如渲染复杂的手部描绘以及将文本合并到图像中:

一幅由半透明玻璃制成的人心插画,矗立在波涛汹涌的大海中的基座上。阳光穿透云层,照亮了心脏,展现出其中的微小宇宙。“发现你内心的宇宙”这句话以粗体字刻在…… pic.twitter.com/S3cKMkG67T

— OpenAI (@OpenAI) 2023 年 9 月 20 日

OpenAI 还实施了强大的安全措施,通过识别和忽略提示中的某些关键字,确保 AI 系统不会生成露骨或令人反感的内容。

除了技术进步之外,OpenAI 还采取了措施来减轻潜在的法律问题。

虽然目前的 DALL-E 版本可以模仿在世艺术家的风格,但即将推出的 DALL-E 3 的设计将拒绝复制其版权作品的请求。艺术家还可以选择通过 OpenAI 网站上的专用表单提交原创作品,并在必要时请求删除。

OpenAI 的 DALL-E 3 推广计划包括下个月向 ChatGPT“Plus”和“Enterprise”客户首次发布。增强型图像生成器将于即将到来的秋季向 OpenAI 的研究实验室和 API 客户提供。

随着 OpenAI 不断突破人工智能技术的界限,DALL-E 3 代表着文本到图像生成的重大进步。

(图片来源: OpenAI

另请参阅: Stability AI 推出可控音频生成的“稳定音频”模型

想从行业领袖那里了解更多人工智能和大数据知识?欢迎关注在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这场综合性盛会与数字化转型周同期举办。

在此探索由 TechForge 主办的其他即将举行的企业技术活动和网络研讨会。

OpenAI 揭示 DALL-E 3 文本到图像模型一文最先出现在AI News上。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论