谷歌在Gemini 2.5 Flash 中引入 AI 推理控制

avatar
AI News
04-23
本文为机器翻译
展示原文

谷歌为其 Gemini 2.5 Flash模型引入了一种人工智能推理控制机制,允许开发者限制系统在解决问题时消耗的处理能力。

在4月17日发布的这个"思考预算"功能,是对日益增长的行业挑战的回应:先进的人工智能模型经常过度分析直接的查询,消耗不必要的计算资源,并增加运营和环境成本。

虽然不是革命性的,但这一发展代表了解决效率问题的实际步骤,这些问题随着推理能力成为商业人工智能软件的标准而出现。

这个新机制使开发者能够在生成响应之前精确校准处理资源,可能会改变组织管理人工智能部署的财务和环境影响。

"该模型思考过度,"Gemini产品管理总监Tulsee Doshi承认,"对于简单的提示,模型确实思考得比需要的更多。"

这一承认揭示了先进推理模型面临的挑战 - 就像使用工业机械来破开一个核桃。

转向推理能力带来了意想不到的后果。传统的大型语言模型主要是匹配训练数据中的模式,而新版本则试图逻辑地、逐步地解决问题。虽然这种方法在复杂任务中能产生更好的结果,但在处理简单查询时会引入显著的低效率。

平衡成本和性能

未经控制的人工智能推理的财务影响是巨大的。根据谷歌的技术文档,当完全启用推理时,生成输出的成本大约是标准处理的六倍。这种成本乘数为精细控制提供了强大的动机。

在Hugging Face研究推理模型的工程师Nathan Habib描述,这个问题在整个行业中都很普遍。"在炫耀更智能的人工智能的过程中,即使没有钉子,公司也在使用推理模型作为锤子,"他向MIT技术评论解释道。

这种浪费并非只是理论上的。Habib展示了一个领先的推理模型在尝试解决有机化学问题时,陷入了递归循环,反复重复"等等,但是……"数百次 - 本质上是经历了计算崩溃并消耗处理资源。

在DeepMind评估Gemini模型的Kate Olszewska证实,谷歌的系统有时也会遇到类似问题,陷入循环,耗尽计算能力而不改善响应质量。

精细控制机制

谷歌的人工智能推理控制为开发者提供了精确的程度。该系统提供了从零(最小推理)到24,576个代币的"思考预算"的灵活范围 - 这些代币代表模型的内部处理。这种精细的方法允许根据特定用例进行定制部署。

DeepMind的首席研究科学家Jack Rae表示,确定最佳推理水平仍然具有挑战性:"现在很难划定界限,比如什么是当前思考的完美任务。"

发展理念的转变

引入人工智能推理控制可能预示着人工智能发展方式的改变。自2019年以来,公司一直致力于通过构建具有更多参数和训练数据的更大模型来改进。谷歌的方法表明了一种替代路径,专注于效率而非规模。

"规模定律正在被取代,"Habib说,表明未来的进步可能来自优化推理过程,而不是不断扩大模型规模。

环境影响同样重大。随着推理模型的普及,其能耗也成比例增长。研究表明,推理 - 生成人工智能响应 - 现在对技术的碳足迹的贡献比初始训练过程更多。谷歌的推理控制机制为缓解这一令人担忧的趋势提供了潜在的因素。

竞争动态

谷歌并非独自行动。今年早些时候出现的"开放权重"DeepSeek R1模型展示了强大的推理能力,可能成本更低,触发了市场波动,据报导造成了近万亿美元的股市波动。

与谷歌的专有方法不同,DeepSeek公开了其内部设置,供开发者本地实施。

尽管存在竞争,谷歌DeepMind的首席技术官Koray Kavukcuoglu仍然认为,专有模型在需要极高精确度的专业领域将保持优势:"编程、数学和金融是模型需要非常准确、非常精确,并能理解真正复杂情况的情况。"

行业成熟的迹象

人工智能推理控制的发展反映了一个现在正面对超越技术基准的实际局限性的行业。尽管公司继续推进推理能力,但谷歌的方法承认了一个重要现实:在商业应用中,效率与原始性能同样重要。

这个功能还突显了技术进步与可持续性关切之间的张力。追踪推理模型性能的排行榜显示,单个任务的完成成本可能高达200美元,这引发了在生产环境中扩展此类能力的疑问。

通过允许开发者根据实际需求调整推理的高低,谷歌同时解决了人工智能部署的财务和环境方面。

"推理是构建智能的关键能力,"Kavukcuoglu说,"当模型开始思考时,模型的主体性就已经开始了。"这个陈述揭示了推理模型的承诺和挑战 - 它们的自主性创造了机遇,同时也带来了资源管理挑战。

对于部署人工智能解决方案的组织来说,微调推理预算的能力可能会使获取先进功能民主化,同时保持运营纪律。

谷歌声称Gemini 2.5 Flash以"仅为其他领先模型一小部分成本和规模"提供"可比的指标" - 这一价值主张因能够为特定应用优化推理资源而得到加强。

实际implications

人工智能推理控制功能具有直接的实际应用。构建商业应用的开发者现在可以在处理深度和运营成本之间做出明智的权衡。

对于像基本客户查询这样的简单应用,最小推理设置可以保留资源,同时仍然使用模型的功能。对于需要深入理解的复杂分析,完全推理能力仍然可用。

谷歌的推理"调节器"提供了一种建立成本确定性的机制,同时保持性能标准。

另请参阅:Gemini 2.5:谷歌烹饪出迄今最"智能"的人工智能模型

想要从行业领袖那里了解更多关于人工智能和大数据的信息吗?请查看在阿姆斯特丹、加利福尼亚和伦敦举行的人工智能与大数据博览会。这个全面的活动与其他领先活动同地举办,包括智能自动化大会BlockX数字转型周网络安全与云展

探索由TechForge提供的其他即将到来的企业技术活动和网络研讨会,请点击此处

本文最初发表于谷歌在Gemini 2.5 Flash中引入人工智能推理控制,来源于人工智能新闻

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
2
收藏
1
评论