OpenAI的新型AI模型可以在回答前停下来思考,允许直接在浏览器中处理图像和执行Python代码。
OpenAI刚刚在周四官方上线了两个新的人工智能模型o3和o4-mini。这些是设计用于在给出答案前"暂停和思考"的推理模型,标志着全球AI竞争中的重要进展。
据OpenAI称,o3是他们迄今最先进的推理模型,在数学、编程、推理、科学和图像理解测试中表现优异。o4-mini被介绍为成本、速度和性能之间的平衡选择——这是开发者选择AI模型时通常考虑的三个重要因素。
在激烈竞争背景下的技术突破
值得注意的是,这些模型可以使用ChatGPT中的工具生成响应,如浏览网页、执行Python代码、处理和创建图像。特别是,o3和o4-mini是OpenAI首个能够"用图像思考"的模型——用户可以上传白板草图或PDF文档中的图表,模型将在"思考链"过程中分析图像后再回答。
在性能方面,o3在SWE-bench verified测试中取得了令人印象深刻的69.1%成绩(没有自定义脚手架),远超o3-mini(49.3%)和Claude 3.7 Sonnet(62.3%)。
OpenAI发布o3是一个值得注意的转折点,尤其是在CEO Sam Altman在2月份曾发出信号,公司计划将资源集中在一个更精细的集成o3技术的替代方案上。然而,竞争压力似乎促使OpenAI改变了方向。
o3、o4-mini和o4-mini-high(一个花费更多时间提高可靠性的变体)这三个模型现已可供OpenAI的Pro、Plus和Team订阅用户使用,同时也将通过开发者端点提供,包括Chat Completions API和Responses API。
在定价方面,OpenAI为o3设定了相对较低的价格,每百万输入代币10美元,每百万输出代币40美元。对于o4-mini,价格与o3-mini相当,每百万输入代币1.10美元,每百万输出代币4.40美元。
在接下来的几周里,OpenAI预计将发布o3-pro,这是一个使用更多计算资源的o3版本,专门面向ChatGPT Pro订阅用户。Sam Altman还表示,o3和o4-mini可能是ChatGPT中最后的独立AI推理模型,直到GPT-5上线——这个模型预计将统一传统模型如GPT-4.1和推理模型。



