OpenAI 的 o3-Mini 是一款与 DeepSeek 保持同步的更精简的 AI 模型

avatar
WIRED
02-01
本文为机器翻译
展示原文

OpenAI正在制作其最聪明的人工智能模型的更小、更高效的版本,并免费提供,因为它试图回应中国AI初创公司DeepSeek推出的一款新的开源产品所引发的炒作和热情。

WIRED之前报道过OpenAI正在准备推出新的模型o3-mini,定于1月31日发布。据知情人士透露,该公司的研究人员一直在加班加点地准备这款新产品。

o3-mini是OpenAI目前最先进的AI推理能力模型的缩小版。该模型可以将复杂问题分解成组成部分,以找出最佳解决方案。

"这个强大而快速的模型推进了小型模型所能实现的边界,"该公司在一篇博客文章中宣布o3-mini的推出。

OpenAI将向ChatGPT的所有Plus、Team和Pro用户提供o3-mini。ChatGPT的免费版用户也可以尝试使用o3-mini,但无法发送太多查询,公司表示。

OpenAI显然已经有一段时间在使用博士生来帮助训练新模型。几周前,该公司开始招聘每小时100美元的计算机科学博士生进行"研究合作",以"参与未发布模型的工作"。

OpenAI还似乎通过其经常使用的一家名为Mercor的公司,招募了在其他领域有专长的博士生。Mercor在LinkedIn上发布的一份工作岗位说:"这个项目的总体目标是创造具有挑战性的科学编码问题,旨在测试大型语言模型在解决实际科学研究问题方面的能力。"

这份工作岗位描述与一个名为SciCode的基准测试中的一个问题惊人相似,该基准测试旨在测试大型语言模型解决复杂科学问题的能力。

这一消息传出之际,DeepSeek的R1继续在美国科技界引发轰动。这样一个强大的模型能够免费发布,给谷歌和Anthropic施加了降低价格的压力。

据公司内部人士透露,OpenAI特别渴望证明自己仍然处于开发和商业化AI的前沿。

DeepSeek的免费模型采用了一些创新,使其在训练和服务方面更加高效。该公司似乎使用的资源远少于OpenAI和其他美国公司目前建立前沿AI模型所需的资源,尽管DeepSeek的具体支出细节仍然不为人知。OpenAI表示,它认为R1可能使用了其模型的输出进行训练。

您是OpenAI的现任或前任员工吗?我们很想听听您的意见。请使用非工作手机或电脑,通过电子邮件will_knight@wired.com或Signal用户名wak01联系Will Knight。

OpenAI的最新模型在价格上可能无法超越R1,但它表明该公司未来将把效率作为重点。OpenAI还表示,该模型在数学、科学和编程方面特别出色。

该公司表示,这款最新模型还将包括新功能,包括能够访问网络搜索、调用用户代码中的函数,以及在不同的推理级别之间切换,在速度和问题解决能力之间进行权衡。

DeepSeek的突然崛起也引发了人们对美国政府遏制中国在AI领域崛起战略的质疑。过去两届美国政府已经出台了一系列制裁措施,以遏制中国获取通常用于构建前沿AI模型的最先进英伟达芯片的能力。DeepSeek在其研究中描述了几种类型的英伟达芯片,但具体使用了哪些仍不清楚。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论