Gemma 3: Google ra mắt mô hình AI mở mới nhất

avatar
AI News
03-12
Bài viết này được dịch máy
Xem bản gốc

Google đã ra mắt Gemma 3, phiên bản mới nhất của bộ mô hình AI mở của họ nhằm mục đích đặt ra một tiêu chuẩn mới cho khả năng tiếp cận AI.

Được xây dựng trên nền tảng của các mô hình Gemini 2.0 của công ty, Gemma 3 được thiết kế để nhẹ, di động và linh hoạt - cho phép các nhà phát triển tạo ra các ứng dụng AI trên một loạt các thiết bị.

Bản phát hành này đến ngay sau kỷ niệm một năm tuổi của Gemma, một kỷ niệm được nhấn mạnh bởi các chỉ số về mức độ áp dụng ấn tượng. Các mô hình Gemma đã đạt hơn 100 triệu lượt tải xuống và tạo ra hơn 60.000 biến thể do cộng đồng xây dựng. Được gọi là "Gemmaverse", hệ sinh thái này cho thấy một cộng đồng phát triển mạnh mẽ nhằm dân chủ hóa AI.

"Bộ mô hình mở Gemma là nền tảng cho cam kết của chúng tôi trong việc làm cho công nghệ AI hữu ích trở nên dễ tiếp cận," Google giải thích.

Gemma 3: Các tính năng và khả năng

Các mô hình Gemma 3 có sẵn ở các kích thước khác nhau - 1B, 4B, 12B và 27B tham số - cho phép các nhà phát triển lựa chọn một mô hình phù hợp với phần cứng và yêu cầu về hiệu suất cụ thể của họ. Những mô hình này hứa hẹn sẽ thực hiện nhanh hơn, ngay cả trên các cấu hình tính toán khiêm tốn, mà không ảnh hưởng đến chức năng hoặc độ chính xác.

Dưới đây là một số tính năng nổi bật của Gemma 3:

  • Hiệu suất trên một gia tốc: Gemma 3 đặt ra một tiêu chuẩn mới cho các mô hình chạy trên một gia tốc. Trong các đánh giá ưu tiên của con người trên bảng xếp hạng LMArena, Gemma 3 đã vượt qua các đối thủ cạnh tranh bao gồm Llama-405B, DeepSeek-V3 và o3-mini.
  • Hỗ trợ đa ngôn ngữ trên 140 ngôn ngữ: Đáp ứng các đối tượng khác nhau, Gemma 3 đi kèm với các khả năng được đào tạo trước cho hơn 140 ngôn ngữ. Các nhà phát triển có thể tạo ra các ứng dụng kết nối với người dùng bằng ngôn ngữ mẹ đẻ của họ, mở rộng phạm vi toàn cầu của các dự án của họ.
  • Phân tích văn bản và hình ảnh tinh vi: Với các khả năng phân tích văn bản, hình ảnh và video ngắn tiên tiến, các nhà phát triển có thể triển khai Gemma 3 để tạo ra các ứng dụng tương tác và thông minh - giải quyết một loạt các trường hợp sử dụng từ phân tích nội dung đến các quy trình sáng tạo.
  • Cửa sổ ngữ cảnh mở rộng: Cung cấp cửa sổ ngữ cảnh 128k-token, Gemma 3 có thể phân tích và tổng hợp các tập dữ liệu lớn, làm cho nó trở nên lý tưởng cho các ứng dụng yêu cầu hiểu biết nội dung mở rộng.
  • Gọi hàm để tự động hóa quy trình: Với hỗ trợ gọi hàm, các nhà phát triển có thể sử dụng các đầu ra có cấu trúc để tự động hóa các quy trình và xây dựng các hệ thống AI tự động một cách dễ dàng.
  • Các mô hình định lượng để tăng hiệu quả nhẹ: Gemma 3 giới thiệu các phiên bản định lượng chính thức, giảm đáng kể kích thước mô hình trong khi vẫn duy trì độ chính xác đầu ra - một lợi ích cho các nhà phát triển tối ưu hóa cho các môi trường di động hoặc có tài nguyên hạn chế.

Các ưu thế về hiệu suất của mô hình được minh họa rõ ràng trong bảng xếp hạng Elo Score của Chatbot Arena. Mặc dù chỉ yêu cầu một GPU NVIDIA H100, phiên bản cờ đầu 27B của Gemma 3 xếp hạng trong số những chatbot hàng đầu, đạt điểm Elo 1338. Nhiều đối thủ cạnh tranh yêu cầu tới 32 GPU để đạt được hiệu suất tương đương.

Hiệu suất của Google Gemma 3 được minh họa trên các tiêu chuẩn đánh giá so với cả các mô hình AI nguồn mở và chuyên dụng trong bảng xếp hạng Elo Score của Chatbot Arena.

Một trong những điểm mạnh của Gemma 3 là khả năng thích ứng trong các quy trình làm việc hiện có của các nhà phát triển.

  • Tương thích đa dạng với các công cụ: Gemma 3 hỗ trợ các thư viện và công cụ AI phổ biến, bao gồm Hugging Face Transformers, JAX, PyTorch và Google AI Edge. Để triển khai tối ưu, các nền tảng như Vertex AI hoặc Google Colab sẵn sàng giúp các nhà phát triển bắt đầu với ít rắc rối nhất.
  • Tối ưu hóa NVIDIA: Cho dù sử dụng GPU cấp độ nhập môn như Jetson Nano hay phần cứng tiên tiến như chip Blackwell, Gemma 3 đảm bảo hiệu suất tối đa, được đơn giản hóa thêm thông qua NVIDIA API Catalog.
  • Mở rộng hỗ trợ phần cứng: Ngoài NVIDIA, Gemma 3 tích hợp với GPU AMD thông qua stack ROCm và hỗ trợ thực thi CPU với Gemma.cpp để tăng tính linh hoạt.

Để thực hiện các thử nghiệm ngay lập tức, người dùng có thể truy cập các mô hình Gemma 3 thông qua các nền tảng như Hugging Face và Kaggle, hoặc tận dụng Google AI Studio để triển khai trực tiếp trên trình duyệt.

Thúc đẩy AI có trách nhiệm

"Chúng tôi tin rằng các mô hình mở yêu cầu đánh giá rủi ro cẩn thận, và cách tiếp cận của chúng tôi cân bằng giữa đổi mới và an toàn," Google giải thích.

Nhóm Gemma 3 đã áp dụng các chính sách quản trị nghiêm ngặt, áp dụng việc tinh chỉnh và đánh giá mạnh mẽ để làm cho mô hình phù hợp với các hướng dẫn đạo đức. Với khả năng nâng cao của mô hình trong các lĩnh vực STEM, nó đã trải qua các đánh giá cụ thể để giảm thiểu các rủi ro lạm dụng, chẳng hạn như tạo ra các chất có hại.

Google đang thúc đẩy các nỗ lực tập thể trong ngành để tạo ra các khung an toàn phù hợp cho các mô hình ngày càng mạnh mẽ.

Để đóng góp phần của mình, Google đang ra mắt ShieldGemma 2. Bộ kiểm tra an toàn hình ảnh 4B sử dụng kiến trúc Gemma 3 và đưa ra các nhãn an toàn trong các danh mục như nội dung nguy hiểm, tài liệu khiêu dâm và bạo lực. Trong khi cung cấp các giải pháp sẵn có, các nhà phát triển có thể tùy chỉnh công cụ để đáp ứng các yêu cầu an toàn cụ thể.

"Gemmaverse" không chỉ là một hệ sinh thái kỹ thuật, mà còn là một phong trào do cộng đồng dẫn dắt. Các dự án như SEA-LION v3 của AI Singapore, BgGPT của INSAIT và OmniAudio của Nexa AI là minh chứng cho sức mạnh của sự hợp tác trong hệ sinh thái này.

Để thúc đẩy nghiên cứu học thuật, Google cũng đã giới thiệu Chương trình Học thuật Gemma 3. Các nhà nghiên cứu có thể nộp đơn xin tín dụng Google Cloud trị giá 10.000 USD để tăng tốc các dự án của họ tập trung vào AI. Đơn đăng ký mở từ hôm nay và sẽ còn trong bốn tuần.

Với tính tiếp cận, khả năng và tính tương thích rộng rãi của mình, Gemma 3 đưa ra một lập luận mạnh mẽ để trở thành một góc cột trong cộng đồng phát triển AI.

(Hình ảnh: Google)

Xem thêm: Alibaba Qwen QwQ-32B: Trình diễn học tăng cường quy mô

Muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy kiểm tra AI & Big Data Expo diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Intelligent Automation Conference, BlockX, Digital Transformation WeekCyber Security & Cloud Expo.

Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và các webinar khác được cung cấp bởi TechForge tại đây.

Bài viết Gemma 3: Google ra mắt các mô hình AI mở mới nhất của họ đầu tiên xuất hiện trên AI News.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
1
Thêm vào Yêu thích
1
Bình luận