谷歌推出了Gemma 3,这是其开放式AI模型系列的最新版本,旨在为AI可访问性设立新的基准。
Gemma 3建立在公司Gemini 2.0模型的基础之上,被设计为轻量级、便携和可适应性强,使开发者能够在各种设备上创建AI应用程序。
这一版本紧随Gemma的首个生日,这一里程碑由令人印象深刻的采用指标所强调。Gemma模型已经实现了超过1亿次下载,并孕育了超过6万个社区构建的变体。这个被称为"Gemmaverse"的生态系统标志着一个蓬勃发展的社区,旨在民主化AI。
"Gemma系列的开放模型是我们致力于使有用的AI技术可访问的基础,"谷歌解释道。
Gemma 3:特性和功能
Gemma 3模型有1B、4B、12B和27B参数等多种规模,允许开发者选择适合其特定硬件和性能要求的模型。这些模型承诺在较低的计算设置下也能实现更快的执行,而不会影响功能或准确性。
以下是Gemma 3的一些突出特点:
- 单加速器性能:Gemma 3为单加速器模型设立了新的基准。在LMArena排行榜上的初步人类偏好评估中,Gemma 3优于包括Llama-405B、DeepSeek-V3和o3-mini在内的竞争对手。
- 140种语言的多语言支持:为满足不同受众的需求,Gemma 3拥有超过140种语言的预训练能力。开发者可以创建应用程序,让用户使用他们的母语进行交互,从而扩大项目的全球影响力。
- 复杂的文本和视觉分析:凭借先进的文本、图像和短视频推理能力,开发者可以利用Gemma 3来创造交互式和智能的应用程序,涵盖从内容分析到创意工作流等各种用例。
- 扩展的上下文窗口:Gemma 3提供了128k令牌的上下文窗口,可以分析和合成大型数据集,这使其非常适合需要广泛内容理解的应用程序。
- 函数调用实现工作流自动化:通过函数调用支持,开发者可以利用结构化输出来轻松自动化流程并构建代理AI系统。
- 量化模型实现轻量级高效:Gemma 3引入了官方量化版本,大幅减小了模型尺寸,同时保持了输出准确性,这对于优化移动或资源受限环境的开发者来说是一大优势。
该模型的性能优势在Chatbot Arena Elo Score排行榜上得到了明确说明。尽管只需要一个NVIDIA H100 GPU,但Gemma 3的27B版本旗舰版在聊天机器人排行榜上名列前茅,获得了1338的Elo分。许多竞争对手需要高达32个GPU才能提供相当的性能。

Gemma 3的一个优势在于它可以适应开发者现有的工作流程。
- 多样化的工具兼容性:Gemma 3支持包括Hugging Face Transformers、JAX、PyTorch和Google AI Edge在内的流行AI库和工具。为了实现优化部署,Vertex AI或Google Colab等平台已准备就绪,可以帮助开发者以最小的麻烦开始使用。
- NVIDIA优化:无论使用入门级GPU如Jetson Nano还是尖端硬件如Blackwell芯片,Gemma 3都能确保最大性能,并通过NVIDIA API目录进一步简化。
- 硬件支持范围扩大:除了NVIDIA,Gemma 3还通过ROCm堆栈与AMD GPU集成,并支持使用Gemma.cpp在CPU上执行,增加了versatility。
如需立即进行实验,用户可以通过Hugging Face和Kaggle等平台访问Gemma 3模型,或利用Google AI Studio进行浏览器部署。
推进负责任的AI
"我们认为开放模型需要谨慎的风险评估,我们的方法在创新与安全之间保持平衡,"谷歌解释道。
Gemma 3团队采用了严格的治理政策,应用微调和强大的基准测试来使模型与道德准则保持一致。鉴于该模型在STEM领域的增强功能,它还经历了特定的评估,以减轻产生有害物质等滥用风险。
谷歌正在推动行业内的集体努力,为日益强大的模型创建适当的安全框架。
为了发挥自己的作用,谷歌正在推出ShieldGemma 2。这个4B图像安全检查器利用Gemma 3的架构,对诸如危险内容、露骨材料和暴力等类别进行安全标签输出。在提供开箱即用的解决方案的同时,开发者还可以根据特定的安全需求对其进行定制。
"Gemmaverse"不仅仅是一个技术生态系统,它还是一个社区驱动的运动。新加坡人工智能的SEA-LION v3、INSAIT的BgGPT和Nexa AI的OmniAudio等项目都证明了这个生态系统内部协作的力量。
为了支持学术研究,谷歌还推出了Gemma 3学术计划。研究人员可以申请价值1万美元的Google Cloud积分,以加速他们的AI中心项目。申请将从今天开始,为期4周。
凭借其可访问性、功能和广泛的兼容性,Gemma 3有望成为AI开发社区的基石。
(图片来源:谷歌)

想从行业领导者那里了解更多关于AI和大数据的知识吗?查看在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个全面的活动与其他领先的活动如Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo同时举办。
在这里探索由TechForge提供的其他即将到来的企业技术活动和网络研讨会。
本文最初发表于AI News。



