OpenAI 发布图像生成 AI“GPT Image 1.5”,兼具速度、精度和成本效益

本文为机器翻译
展示原文

OpenAI 发布了 GPT Image 1.5,这是一款专为图像生成和编辑而设计的新型 AI 模型。该模型经评估针对商业用户和普通用户进行了优化,在提升现有图像生成能力的同时,也提高了处理速度和准确性。

与谷歌近期发布的图像生成模型“Nano Banana Pro”几乎同时推出的GPT Image 1.5,显著提升了图像中文本的呈现能力以及对后续提示的理解能力。OpenAI强调,该模型擅长编辑包含小文本和密集信息的图像,因此非常适合信息图表制作等复杂任务。

普通用户可以通过 ChatGPT 内置的图像生成功能访问 GPT Image 1.5,而开发者则可以通过应用程序编程接口 (API) 访问。OpenAI 已将该 API 的价格较之前的版本降低了 20%,并声称该模型计算效率的提升使其图像生成速度比以往提高了四倍。这将降低服务器成本和能耗,对企业而言是一项显著优势。

全新的 GPT Image 1.5 模型在复杂的多步骤图像编辑方面也展现了其优势。例如,它能够轻松完成从三张不同图像中提取元素、将它们合成一张图像,然后批量更改整体样式的艰巨任务。由于它能够精确判断哪些元素需要更改,哪些元素需要保持不变,因此也适用于需要编辑品牌图像或徽标而无需修改的商业应用。

OpenAI指出,该模型在生成需要特定风格或科学知识的图像方面可能存在局限性,但同时也强调,与之前的模型相比,其在相关任务上的错误率已显著降低。新模型将通过ChatGPT内的独立界面访问,并配备个性化的提示推荐和图像滤镜。

就在GPT-5.2模型发布不久后,OpenAI发布了这项公告。GPT-5.2模型展现了解决高中水平科学和数学问题的能力,并在人工智能基准测试中打破了多项纪录。基于这一成就,OpenAI近期推出了其专属基准测试平台FrontierScience,该平台包含700多个物理、化学和生物学问题,旨在评估其算法的科学适用性。

随着人工智能图像生成技术的飞速发展,GPT Image 1.5 的发布彰显了 OpenAI 致力于巩固其在图像处理领域领先地位的决心。该模型同时兼顾了降低成本、提升速度和提高准确性三大关键目标,极有可能成为各种商业内容制作环境中的核心人工智能工具。

获取实时新闻……请前往 TokenPost Telegram 频道

版权所有 © TokenPost。未经授权,禁止复制和传播。

#OpenAI #GPT图像#图像AI #生成式AI #AI编辑工具

相关赛道:
来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
80
收藏
10
评论