OpenAI 今(24)日午夜正式宣布推出生图模型 gpt-image-1 的 API,正式将 ChatGPT 的图像生成技术开放给全球开发者。对于有大量图片制作需求、或是项目方想在系统内对接生图功能的开发者来说,可说是一个重大的好消息。
简单来说,如果你有操作程式的经验,未来不用再透过 ChatGPT 的网路介面人工操作,就可以让电脑自动执行你希望的工作流。(之前只有开放 DALL·E 2、3 但生图品质没有那么好)
gpt-image-1 API 的功能与特色
据官方说明,gpt-image-1 API 提供多项强大功能,满足开发者在图像生成与编辑的需求。该 API 可支援更精准的图像生成、多样化的视觉风格、精细图像编辑、丰富的世界知识与一致的文字渲染。
目前支援三种图像尺寸:正方形(1024×1024)、肖像(1536×1024)与风景(1024×1536),据动区实测,目前生成一张图的价格从每张 0.1~0.2 美元不等。
官方还表示,该模型已在多个领域展现应用潜力。例如,Adobe 将其整合至 Firefly 与 Express 应用,Figma 则用于图像生成与编辑、HeyGen 利用 API 提升头像编辑功能…。官方首周统计显示,gpt-image-1 API 就生成 7 亿张图片,服务1.3亿用户,显示其广泛吸引力。
想使用需要先 KYC
不过经动区实测,目前如想使用 gpt-image-1 模型的 API,必须先通过官方的 API 组织验证!据官方说明:
在 OpenAI,我们认真履行自己的责任,确保人工智慧能够广泛普及且安全使用。不幸的是,少数开发人员故意使用 OpenAI API,违反我们的使用政策。
我们正在添加验证流程以减轻人工智慧的不安全使用,同时继续向更广泛的开发者社群提供更先进的人工智慧功能。
有进行过交易所 KYC 流程的用户想必不陌生,就是照著官方流程上传个人身分证件并提供大头照实录即可。
OpenAI 怕未来滥用或侵权?
至于为什么突然要求要 KYC?推测可能是怕目前生图能力足够优秀,被有心人士拿去制作假新闻或色情图片;另一个可能则是,我们可推测 OpenAI 一定使用了网路上大量图片进行训练,未来可能会吃上版权侵犯的官司有关…。
但不管如何,gpt-image-1 其强大的生图功能,想必会给 AI 应用带来更广泛的使用场景。