谷歌今天推出了Gemini 3.1 Flash Lite,這是一款全新的人工智慧模型,旨在為該公司的Gemini 3 系列產品提供更快的響應速度和更低的營運成本。
該模型目前正透過 Google AI Studio 中的Gemini API 向開發者推出預覽版,並透過 Vertex AI 向企業客戶推出預覽版。
Google 將Gemini 3.1 Flash Lite 描述為Gemini 3 系列中最快、成本效益最高的型號,專為延遲和成本至關重要的大容量工作負載而設計。
該模型的定價為每百萬個輸入令牌 0.25 美元起,每百萬個輸出令牌 1.50 美元起,使其成為谷歌當前 AI 模型系列中成本最低的選擇之一。
根據Google引用的基準測試,與Gemini 2.5 Flash 相比, Gemini 3.1 Flash Lite 的首次回應代幣產生速度提高了 2.5 倍,輸出速度提高了 45%,同時保持了相似或更好的品質。
性能基準測試也顯示該模型與其他輕量級人工智慧模型相比具有競爭力。 Gemini Gemini Flash Lite 在 Arena AI 排行榜上獲得了 1432 分的 Elo 分數,在 GPQA Diamond 推理基準測試中取得了 86.9% 的成績,在 MMMU Pro 多模態基準測試中取得了 76.8% 的成績。
谷歌表示,該模型旨在處理高頻開發者任務,例如翻譯、內容審核和大規模指令執行,同時也能支援更複雜的工作負載,例如介面產生、模擬創建和結構化資料任務。
此次發布也為 AI Studio 和 Vertex AI 引入了可調節的思維層級,使開發人員能夠根據任務的複雜程度來控制模型的推理程度。這種靈活性旨在幫助團隊在大規模部署 AI 應用時平衡成本、速度和準確性。





