谷歌今天推出了Gemini 3.1 Flash Lite,这是一款全新的人工智慧模型,旨在为该公司的Gemini 3 系列产品提供更快的响应速度和更低的营运成本。
该模型目前正透过 Google AI Studio 中的Gemini API 向开发者推出预览版,并透过 Vertex AI 向企业客户推出预览版。
Google 将Gemini 3.1 Flash Lite 描述为Gemini 3 系列中最快、成本效益最高的型号,专为延迟和成本至关重要的大容量工作负载而设计。
该模型的定价为每百万个输入令牌 0.25 美元起,每百万个输出令牌 1.50 美元起,使其成为谷歌当前 AI 模型系列中成本最低的选择之一。
根据Google引用的基准测试,与Gemini 2.5 Flash 相比, Gemini 3.1 Flash Lite 的首次回应代币产生速度提高了 2.5 倍,输出速度提高了 45%,同时保持了相似或更好的品质。
性能基准测试也显示该模型与其他轻量级人工智慧模型相比具有竞争力。 Gemini Gemini Flash Lite 在 Arena AI 排行榜上获得了 1432 分的 Elo 分数,在 GPQA Diamond 推理基准测试中取得了 86.9% 的成绩,在 MMMU Pro 多模态基准测试中取得了 76.8% 的成绩。
谷歌表示,该模型旨在处理高频开发者任务,例如翻译、内容审核和大规模指令执行,同时也能支援更复杂的工作负载,例如介面产生、模拟创建和结构化资料任务。
此次发布也为 AI Studio 和 Vertex AI 引入了可调节的思维层级,使开发人员能够根据任务的复杂程度来控制模型的推理程度。这种灵活性旨在帮助团队在大规模部署 AI 应用时平衡成本、速度和准确性。





