Gemini 2.5 được Google DeepMind ca ngợi là “mô hình AI thông minh nhất” cho đến nay.
Phiên bản đầu tiên của thế hệ mới nhất này là phiên bản thử nghiệm của Gemini 2.5 Pro, được DeepMind cho biết đã đạt được kết quả tiên tiến nhất trên nhiều tiêu chuẩn đánh giá khác nhau.
Theo Koray Kavukcuoglu, CTO của Google DeepMind, các mô hình Gemini 2.5 là “mô hình tư duy”. Điều này biểu thị khả năng lý luận thông qua suy nghĩ của chúng trước khi tạo ra phản hồi, dẫn đến hiệu suất được nâng cao và độ chính xác được cải thiện.
Kavukcuoglu giải thích rằng khả năng "lý luận" vượt ra ngoài phạm vi phân loại và dự đoán đơn thuần. Nó bao gồm khả năng phân tích thông tin, suy ra kết luận hợp lý, kết hợp ngữ cảnh và sắc thái, và cuối cùng là đưa ra quyết định sáng suốt của hệ thống.
DeepMind đã khám phá các phương pháp để nâng cao trí thông minh và khả năng lý luận của AI trong một thời gian, sử dụng các kỹ thuật như học tăng cường và gợi ý chuỗi suy nghĩ. Nền tảng này đã dẫn đến việc giới thiệu mô hình tư duy đầu tiên của họ, Gemini 2.0 Flash Thinking.
Kavukcuoglu cho biết: “Hiện nay, với Gemini 2.5, chúng tôi đã đạt được một cấp độ hiệu suất mới bằng cách kết hợp mô hình cơ sở được cải thiện đáng kể với quá trình đào tạo sau đó được cải thiện”.
Google có kế hoạch tích hợp các khả năng tư duy này trực tiếp vào tất cả các mô hình tương lai của mình, cho phép chúng giải quyết các vấn đề phức tạp hơn và hỗ trợ các tác nhân có năng lực hơn, nhận thức được ngữ cảnh.
Gemini 2.5 Pro giành vị trí đầu bảng xếp hạng LMArena
Gemini 2.5 Pro Experimental được định vị là mô hình tiên tiến nhất của DeepMind để xử lý các tác vụ phức tạp. Tính đến thời điểm viết bài, nó đã giành được vị trí hàng đầu trên bảng xếp hạng LMArena – một thước đo chính để đánh giá sở thích của con người – với biên độ đáng kể, chứng minh một mô hình có khả năng cao với phong cách chất lượng cao:

Gemini 2.5 là một 'chuyên gia' về toán học, khoa học, mã hóa và lý luận
Gemini 2.5 Pro đã chứng minh hiệu suất vượt trội qua nhiều tiêu chuẩn khác nhau đòi hỏi khả năng suy luận nâng cao.
Đáng chú ý là nó dẫn đầu trong các chuẩn mực toán học và khoa học – chẳng hạn như GPQA và AIME 2025 – mà không cần dựa vào các kỹ thuật kiểm tra thời gian làm tăng chi phí, như bỏ phiếu đa số. Nó cũng đạt được điểm số tiên tiến là 18,8% trong Kỳ thi cuối cùng của loài người, một tập dữ liệu được thiết kế bởi các chuyên gia về chủ đề để đánh giá ranh giới kiến thức và lý luận của con người.
DeepMind đã tập trung đáng kể vào hiệu suất mã hóa và Gemini 2.5 là bước tiến vượt bậc so với phiên bản tiền nhiệm 2.0, với nhiều cải tiến hơn nữa trong quy trình. 2.5 Pro nổi trội trong việc tạo các ứng dụng web và ứng dụng mã tác nhân hấp dẫn về mặt hình ảnh, cũng như chuyển đổi và chỉnh sửa mã.
Trên SWE-Bench Verified, tiêu chuẩn công nghiệp cho các đánh giá mã tác nhân, Gemini 2.5 Pro đạt được điểm số 63,8% khi sử dụng thiết lập tác nhân tùy chỉnh. Khả năng suy luận của mô hình cũng cho phép nó tạo ra một trò chơi điện tử bằng cách tạo mã thực thi từ một dấu nhắc dòng đơn.
Xây dựng dựa trên thế mạnh của người tiền nhiệm
Gemini 2.5 xây dựng dựa trên các thế mạnh cốt lõi của các mô hình Gemini trước đó, bao gồm đa phương thức gốc và cửa sổ ngữ cảnh dài. 2.5 Pro ra mắt với cửa sổ ngữ cảnh một triệu Token , với kế hoạch mở rộng lên hai triệu mã thông báo sớm. Điều này cho phép mô hình hiểu các tập dữ liệu lớn và xử lý các vấn đề phức tạp từ nhiều nguồn thông tin khác nhau, bao gồm văn bản, âm thanh, hình ảnh, video và thậm chí toàn bộ kho lưu trữ mã.
Các nhà phát triển và doanh nghiệp hiện có thể bắt đầu thử nghiệm Gemini 2.5 Pro trong Google AI Studio. Người dùng Gemini Advanced cũng có thể truy cập thông qua menu thả xuống mô hình trên nền tảng máy tính để bàn và thiết bị di động. Mô hình sẽ được triển khai trên Vertex AI trong những tuần tới.
Google DeepMind khuyến khích người dùng cung cấp phản hồi, thông tin này sẽ được sử dụng để nâng cao hơn nữa khả năng của Gemini.
(Ảnh của Anshita Nair )
Xem thêm: DeepSeek V3-0324 đứng đầu các mô hình AI không có lý luận trong mã nguồn mở đầu tiên

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ những người dẫn đầu ngành? Hãy xem Triển lãm AI & Big Data diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh , BlockX , Tuần lễ chuyển đổi số và Triển lãm an ninh mạng & đám mây .
Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trực tuyến do TechForge hỗ trợ tại đây .
Bài đăng Gemini 2.5: Google xây dựng mô hình AI 'thông minh nhất' cho đến nay xuất hiện đầu tiên trên AI News .

