OpenAI 發佈了 GPT Image 1.5,這是一款專為圖像生成和編輯而設計的新型 AI 模型。該模型經評估針對商業用戶和普通用戶進行了優化,在提升現有圖像生成能力的同時,也提高了處理速度和準確性。
與谷歌近期發佈的圖像生成模型“Nano Banana Pro”幾乎同時推出的GPT Image 1.5,顯著提升了圖像中文本的呈現能力以及對後續提示的理解能力。OpenAI強調,該模型擅長編輯包含小文本和密集信息的圖像,因此非常適合信息圖表製作等複雜任務。
普通用戶可以通過 ChatGPT 內置的圖像生成功能訪問 GPT Image 1.5,而開發者則可以通過應用程序編程接口 (API) 訪問。OpenAI 已將該 API 的價格較之前的版本降低了 20%,並聲稱該模型計算效率的提升使其圖像生成速度比以往提高了四倍。這將降低服務器成本和能耗,對企業而言是一項顯著優勢。
全新的 GPT Image 1.5 模型在複雜的多步驟圖像編輯方面也展現了其優勢。例如,它能夠輕鬆完成從三張不同圖像中提取元素、將它們合成一張圖像,然後批量更改整體樣式的艱鉅任務。由於它能夠精確判斷哪些元素需要更改,哪些元素需要保持不變,因此也適用於需要編輯品牌圖像或徽標而無需修改的商業應用。
OpenAI指出,該模型在生成需要特定風格或科學知識的圖像方面可能存在侷限性,但同時也強調,與之前的模型相比,其在相關任務上的錯誤率已顯著降低。新模型將通過ChatGPT內的獨立界面訪問,並配備個性化的提示推薦和圖像濾鏡。
就在GPT-5.2模型發佈不久後,OpenAI發佈了這項公告。GPT-5.2模型展現瞭解決高中水平科學和數學問題的能力,並在人工智能基準測試中打破了多項紀錄。基於這一成就,OpenAI近期推出了其專屬基準測試平臺FrontierScience,該平臺包含700多個物理、化學和生物學問題,旨在評估其算法的科學適用性。
隨著人工智能圖像生成技術的飛速發展,GPT Image 1.5 的發佈彰顯了 OpenAI 致力於鞏固其在圖像處理領域領先地位的決心。該模型同時兼顧了降低成本、提升速度和提高準確性三大關鍵目標,極有可能成為各種商業內容製作環境中的核心人工智能工具。
獲取實時新聞……請前往 TokenPost Telegram 頻道
版權所有 © TokenPost。未經授權,禁止複製和傳播。





