
才刚推出 Gemini 3 的 Google,间隔一个月又紧接著推出 Gemini 3 Flash,并作为 Gemini 3 模型家族中主打「效能与应用落地」的新成员。官方定位明确,这款模型在不牺牲推理品质的前提下,大幅提升速度并降低成本,目标是成为日常任务与代理式工作流程中,最具效率的通用模型。
专业级推理能力,速度与成本同步优化
Google 指出,Gemini 3 Flash 最大特点,在于将 Gemini 3 Pro 等级的推理能力,整合进 Flash 系列一贯的高效率架构。
在多项高阶基准测试中,Gemini 3 Flash 在博士级推理与多模态理解能力上,已可媲美更大型的前瞻模型,并在多项指标上明显超越前代 Gemini 2.5 Pro。
复杂任务深度思考,日常任务更省资源
在实际运作设计上,Gemini 3 Flash 被定位为一款「可调节思考时间」的模型。在面对高难度推理问题时,模型会投入较长思考时间。
而处理一般日常任务时,平均使用词元数比 2.5 Pro 减少约 30%,在词元用量下降的同时,仍能维持更高的效能与准确度。
推理速度提升 3 倍,价格大幅下修
在原始处理速度方面,Gemini 3 Flash 延续 Flash 系列强项。根据 Artificial Analysis 基准测试,推理速度较 Gemini 2.5 Pro 快 3 倍,所需成本仅为原本的一小部分。官方公布定价为:
-
输入:每百万词元 0.50 美元。
-
输出:每百万词元 3 美元。
-
音讯输入:每百万词元 1 美元。
Google 表示,这样的效能与价格组合,使 Gemini 3 Flash 特别适合大规模、高频率的实务应用。
Gemini 3 Flash 的 2 大应用重点
重点一:代理式与高频迭代开发
Gemini 3 Flash 的主要应用定位,锁定代理式 (Agentic) 工作流程与迭代开发 (Iterative Development)。
在评估程式代理能力的 SWE-bench Verified 测试中,Gemini 3 Flash 取得 78% 成绩,表现不仅高于 2.5 系列,也超越 Gemini 3 Pro。Google 指出,这使其特别适合:
-
代理式程式设计。
-
生产级系统维运。
-
需要快速回应的互动式应用。
目前,Gemini 3 Flash 已能在 Google Antigravity 平台中,快速执行与更新实际应用。
重点二:兼顾多模态推理与快速分析
在多模态能力方面,Gemini 3 Flash 被定位为可同时兼顾「速度」与「深度推理」的模型。官方指出,其特别适合用于:
-
复杂影片内容分析。
-
资料撷取与结构化处理。
-
视觉问答与跨模态理解。
这类能力可支援游戏内智慧助手、A/B 测试系统,以及需即时回应又具分析深度的应用场景。
企业实战到日常使用,速度效率同步升级
Google 表示,企业端对 Gemini 3 Flash 的回馈相当正向,包括 JetBrains、桥水基金与 Figma 等企业,已开始将其导入实际业务流程,普遍反映在推论速度、运算效率上有明显提升,整体推理表现也已接近大型模型水准。
另一方面,在消费者应用上,Gemini 3 Flash 已成为 Gemini App 的预设模型,正式取代 2.5 Flash,所有使用者都能免费使用 Gemini 3 等级能力。Google 指出,凭借其多模态推理能力,使用者可更快速理解图片与影片内容,将资讯整理为可执行的行动计划,甚至在没有程式背景的情况下,仅透过语音就能快速产出可运作的应用原型。
目前,Gemini 3 Flash 已在 Google AI Studio 与 Google Antigravity 的 Gemini API 中提供预览,并持续推送至 Gemini App 与搜寻 AI 模式。
(Google 正式推出 Gemini 3:目前最强大的 AI Agentic 与 Vibe Coding 大型语言模型)
这篇文章 Google 新推 Gemini 3 Flash:主打低成本与高效能,推理比 Gemini 2.5 Pro 快 3 倍 最早出现于 链新闻 ABMedia。




