Gemma 3:谷歌推出最新開放式 AI 模型

avatar
AI News
03-12
本文為機器翻譯
展示原文

谷歌推出了Gemma 3,這是其開放式AI模型系列的最新版本,旨在為AI可訪問性設立新的基準。

Gemma 3建立在公司Gemini 2.0模型的基礎之上,被設計為輕量級、便攜和可適應性強,使開發者能夠在各種裝置上建立AI應用程式。

這一版本緊隨Gemma的首個生日,這一里程碑由令人印象深刻的採用指標所強調。Gemma模型已經實現了超過1億次下載,並孕育了超過6萬個社群構建的變體。這個被稱為"Gemmaverse"的生態系統標誌著一個蓬勃發展的社群,旨在民主化AI。

"Gemma系列的開放模型是我們致力於使有用的AI技術可訪問的基礎,"谷歌解釋道。

Gemma 3:特性和功能

Gemma 3模型有1B、4B、12B和27B引數等多種規模,允許開發者選擇適合其特定硬體和效能要求的模型。這些模型承諾在較低的計算設定下也能實現更快的執行,而不會影響功能或準確性。

以下是Gemma 3的一些突出特點:

  • 單加速器效能:Gemma 3為單加速器模型設立了新的基準。在LMArena排行榜上的初步人類偏好評估中,Gemma 3優於包括Llama-405B、DeepSeek-V3和o3-mini在內的競爭對手。
  • 140種語言的多語言支援:為滿足不同受眾的需求,Gemma 3擁有超過140種語言的預訓練能力。開發者可以建立應用程式,讓使用者使用他們的母語進行互動,從而擴大專案的全球影響力。
  • 複雜的文字和視覺分析:憑藉先進的文字、影象和短影片推理能力,開發者可以利用Gemma 3來創造互動式和智慧的應用程式,涵蓋從內容分析到創意工作流等各種用例。
  • 擴充套件的上下文視窗:Gemma 3提供了128k令牌的上下文視窗,可以分析和合成大型資料集,這使其非常適合需要廣泛內容理解的應用程式。
  • 函式呼叫實現工作流自動化:透過函式呼叫支援,開發者可以利用結構化輸出來輕鬆自動化流程並構建代理AI系統。
  • 量化模型實現輕量級高效:Gemma 3引入了官方量化版本,大幅減小了模型尺寸,同時保持了輸出準確性,這對於最佳化移動或資源受限環境的開發者來說是一大優勢。

該模型的效能優勢在Chatbot Arena Elo Score排行榜上得到了明確說明。儘管只需要一個NVIDIA H100 GPU,但Gemma 3的27B版本旗艦版在聊天機器人排行榜上名列前茅,獲得了1338的Elo分。許多競爭對手需要高達32個GPU才能提供相當的效能。

Google Gemma 3 performance illustrated on benchmark against both open source and proprietary AI models in the Chatbot Arena Elo Score leaderboard.

Gemma 3的一個優勢在於它可以適應開發者現有的工作流程。

  • 多樣化的工具相容性:Gemma 3支援包括Hugging Face Transformers、JAX、PyTorch和Google AI Edge在內的流行AI庫和工具。為了實現最佳化部署,Vertex AI或Google Colab等平臺已準備就緒,可以幫助開發者以最小的麻煩開始使用。
  • NVIDIA最佳化:無論使用入門級GPU如Jetson Nano還是尖端硬體如Blackwell晶片,Gemma 3都能確保最大效能,並透過NVIDIA API目錄進一步簡化。
  • 硬體支援範圍擴大:除了NVIDIA,Gemma 3還透過ROCm堆疊與AMD GPU整合,並支援使用Gemma.cpp在CPU上執行,增加了versatility。

如需立即進行實驗,使用者可以透過Hugging Face和Kaggle等平臺訪問Gemma 3模型,或利用Google AI Studio進行瀏覽器部署。

推進負責任的AI

"我們認為開放模型需要謹慎的風險評估,我們的方法在創新與安全之間保持平衡,"谷歌解釋道。

Gemma 3團隊採用了嚴格的治理政策,應用微調和強大的基準測試來使模型與道德準則保持一致。鑑於該模型在STEM領域的增強功能,它還經歷了特定的評估,以減輕產生有害物質等濫用風險。

谷歌正在推動行業內的集體努力,為日益強大的模型建立適當的安全框架。

為了發揮自己的作用,谷歌正在推出ShieldGemma 2。這個4B影象安全檢查器利用Gemma 3的架構,對諸如危險內容、露骨材料和暴力等類別進行安全標籤輸出。在提供開箱即用的解決方案的同時,開發者還可以根據特定的安全需求對其進行定製。

"Gemmaverse"不僅僅是一個技術生態系統,它還是一個社群驅動的運動。新加坡人工智慧的SEA-LION v3、INSAIT的BgGPT和Nexa AI的OmniAudio等專案都證明了這個生態系統內部協作的力量。

為了支援學術研究,谷歌還推出了Gemma 3學術計劃。研究人員可以申請價值1萬美元的Google Cloud積分,以加速他們的AI中心專案。申請將從今天開始,為期4周。

憑藉其可訪問性、功能和廣泛的相容性,Gemma 3有望成為AI開發社群的基石。

(圖片來源:谷歌)

另見:阿里巴巴Qwen QwQ-32B:縮放強化學習展示

想從行業領導者那裡瞭解更多關於AI和大資料的知識嗎?檢視在阿姆斯特丹、加利福尼亞和倫敦舉辦的AI & Big Data Expo。這個全面的活動與其他領先的活動如Intelligent Automation ConferenceBlockXDigital Transformation WeekCyber Security & Cloud Expo同時舉辦。

在這裡探索由TechForge提供的其他即將到來的企業技術活動和網路研討會

本文最初發表於AI News

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
1
收藏
1
評論