Google giới thiệu Gemini 3 Flash mới: nhấn mạnh vào chi phí thấp và hiệu năng cao, với tốc độ suy luận nhanh hơn gấp 3 lần so với Gemini 2.5 Pro.

Bài viết này được dịch máy
Xem bản gốc

Ngay sau khi ra mắt Gemini 3, Google đã tiếp tục trình làng Gemini 3 Flash chỉ một tháng sau đó, trở thành thành viên mới nhất của dòng sản phẩm Gemini 3, tập trung vào "hiệu năng và triển khai ứng dụng". Định vị chính thức rất rõ ràng: mô hình này cải thiện đáng kể tốc độ và giảm chi phí mà không làm giảm chất lượng suy luận, hướng đến mục tiêu trở thành mô hình đa năng hiệu quả nhất cho nhiệm vụ hàng ngày và quy trình làm việc dựa trên tác nhân.

Khả năng suy luận chuyên nghiệp, với tốc độ và chi phí được tối ưu hóa đồng thời.

Google nhấn mạnh rằng tính năng nổi bật nhất của Gemini 3 Flash là khả năng tích hợp các chức năng suy luận của Gemini 3 Pro vào kiến ​​trúc hiệu năng cao vốn đã có từ trước đến nay trong sê-ri Flash.

Trong nhiều bài kiểm tra đánh giá hiệu năng cao cấp, Gemini 3 Flash đã đạt được khả năng suy luận ở cấp độ tiến sĩ và khả năng hiểu đa phương thức tương đương với các mô hình dự báo lớn hơn, và vượt qua đáng kể so với phiên bản tiền nhiệm, Gemini 2.5 Pro, ở một số chỉ báo .

Tư duy độ sâu cho nhiệm vụ phức tạp, sử dụng nguồn lực hiệu quả hơn cho nhiệm vụ hàng ngày.

Trên thực tế, Gemini 3 Flash được định vị là một mô hình có "thời gian suy nghĩ có thể điều chỉnh". Khi đối diện các bài toán suy luận khó, mô hình sẽ dành nhiều thời gian suy nghĩ hơn.

Khi xử lý nhiệm vụ hàng ngày thông thường, số lượng token trung bình được sử dụng giảm khoảng 30% so với phiên bản 2.5 Pro. Trong khi giảm số lượng token sử dụng, hiệu năng và độ chính xác vẫn được duy trì ở mức cao hơn.

Tốc độ suy luận tăng gấp 3 lần, giá thành giảm đáng kể.

Về tốc độ xử lý thô, Gemini 3 Flash tiếp tục phát huy thế mạnh sê-ri Flash. Theo các bài kiểm tra hiệu năng của Artificial Analysis, tốc độ suy luận của nó nhanh hơn gấp 3 lần so với Gemini 2.5 Pro, với mức giá thấp hơn đáng kể. Giá bán chính thức như sau:

  • Mức phí: 0,50 đô la cho mỗi triệu từ.

  • Mức giá: 3 đô la cho mỗi triệu từ.

  • Đầu vào âm thanh: 1 đô la cho mỗi triệu từ.

Google cho biết sự kết hợp giữa hiệu năng và giá cả này khiến Gemini 3 Flash đặc biệt phù hợp cho các ứng dụng thực tế quy mô lớn, tần số cao.

Hai ứng dụng chính của Gemini 3 Flash

Điểm chính 1: Phát triển lặp đi lặp lại dựa trên proxy và tần suất cao

Ứng dụng chính của Gemini 3 Flash tập trung vào quy trình làm việc dựa trên tác nhân và phát triển lặp đi lặp lại.

Trong bài kiểm tra SWE-bench Verified, đánh giá khả năng lập trình, Gemini 3 Flash đạt điểm số 78%, vượt qua không chỉ so với sê-ri 2.5 mà còn cả Gemini 3 Pro. Google lưu ý rằng điều này khiến nó đặc biệt phù hợp cho:

  • Lập trình proxy.

  • Bảo trì hệ thống ở cấp độ sản xuất.

  • Các ứng dụng tương tác yêu cầu phản hồi nhanh chóng.

Hiện tại, Gemini 3 Flash có thể nhanh chóng thực thi và cập nhật các ứng dụng thực tế trong nền tảng Google Antigravity.

Điểm mấu chốt 2: Cân bằng giữa tư duy đa phương thức và phân tích nhanh

Về khả năng đa phương thức, Gemini 3 Flash được định vị là một mẫu máy có thể đồng thời đạt được cả "tốc độ" và "suy luận độ sâu". Thông số kỹ thuật chính thức nêu rõ rằng nó đặc biệt phù hợp cho:

  • Phân tích nội dung phim phức tạp.

  • Trích xuất và cấu trúc dữ liệu.

  • Trả lời câu hỏi bằng hình ảnh và hiểu biết đa giác quan.

Những khả năng này có thể hỗ trợ các trợ lý ảo thông minh trong game, hệ thống thử nghiệm A/B và các kịch bản ứng dụng yêu cầu phản hồi tức thời và phân tích chuyên độ sâu.

Từ thực tiễn doanh nghiệp đến sử dụng hàng ngày, tốc độ và hiệu quả nâng cấp đồng thời.

Google cho biết phản hồi từ các doanh nghiệp về Gemini 3 Flash khá tích cực. Các công ty như JetBrains, Bridgewater Associates và Figma đã bắt đầu triển khai nó vào các quy trình việc kinh doanh thực tế của họ, nhìn chung báo cáo những cải thiện đáng kể về tốc độ suy luận và hiệu quả tính toán, với hiệu suất suy luận tổng thể đang tiến gần đến mức độ của các mô hình quy mô lớn.

Mặt khác, trong các ứng dụng dành cho người tiêu dùng, Gemini 3 Flash đã trở thành mô hình mặc định cho Gemini Apps, chính thức thay thế 2.5 Flash, và tất cả người dùng có thể sử dụng các tính năng Gemini 3 miễn phí. Google nhấn mạnh rằng với khả năng suy luận đa phương thức, người dùng có thể nhanh chóng hiểu nội dung hình ảnh và video, sắp xếp thông tin thành các kế hoạch hành động, và thậm chí nhanh chóng tạo ra các nguyên mẫu ứng dụng hoạt động chỉ bằng giọng nói, mà không cần bất kỳ bối cảnh lập trình nào.

Hiện tại, Gemini 3 Flash đang được cung cấp bản xem trước trong Google AI Studio và API Gemini của Google Antigravity, và đang được triển khai liên tục cho ứng dụng Gemini và chế độ AI tìm kiếm.

(Google chính thức ra mắt Gemini 3: mô hình ngôn ngữ quy mô lớn mạnh mẽ nhất dựa trên trí tuệ nhân tạo và lập trình cảm xúc (Vibe Coding) cho đến nay)

Bài viết này, có tiêu đề "Google ra mắt Gemini 3 Flash mới: Tập trung vào chi phí thấp và hiệu năng cao, tốc độ suy luận nhanh hơn gấp 3 lần so với Gemini 2.5 Pro," lần đầu tiên xuất hiện trên ABMedia .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận