Google đã giới thiệu cơ chế kiểm soát lý luận AI cho mô hình Gemini 2.5 Flash, cho phép các nhà phát triển giới hạn lượng sức mạnh xử lý mà hệ thống dành cho việc giải quyết vấn đề.
Được phát hành vào ngày 17 tháng 4, tính năng "ngân sách tư duy" này phản ánh một thách thức ngày càng gia tăng của ngành: các mô hình AI tiên tiến thường phân tích quá mức các truy vấn đơn giản, tiêu tốn tài nguyên tính toán không cần thiết và làm tăng chi phí vận hành và môi trường.
Mặc dù không mang tính cách mạng, nhưng sự phát triển này là một bước tiến thiết thực hướng tới giải quyết những lo ngại về hiệu quả đã nảy sinh khi khả năng suy luận trở thành tiêu chuẩn trong phần mềm AI thương mại.
Cơ chế mới cho phép hiệu chỉnh chính xác các nguồn lực xử lý trước khi tạo ra phản hồi, có khả năng thay đổi cách các tổ chức quản lý tác động về tài chính và môi trường của việc triển khai AI.
“Mô hình suy nghĩ quá nhiều”, Tulsee Doshi, Giám đốc Quản lý Sản phẩm tại Gemini thừa nhận. “Đối với những lời nhắc đơn giản, mô hình suy nghĩ nhiều hơn mức cần thiết”.
Sự thừa nhận này cho thấy thách thức mà các mô hình lý luận tiên tiến phải đối mặt – tương đương với việc sử dụng máy móc công nghiệp để đập vỡ quả óc chó.
Sự chuyển dịch sang khả năng lý luận đã tạo ra những hậu quả không mong muốn. Trong khi các mô hình ngôn ngữ lớn truyền thống chủ yếu khớp với các mẫu từ dữ liệu đào tạo, các lần lặp lại mới hơn cố gắng giải quyết các vấn đề một cách logic, từng bước một. Mặc dù cách tiếp cận này mang lại kết quả tốt hơn cho các tác vụ phức tạp, nhưng nó lại gây ra sự kém hiệu quả đáng kể khi xử lý các truy vấn đơn giản hơn.
Cân bằng chi phí và hiệu suất
Hậu quả tài chính của việc suy luận AI không được kiểm soát là rất lớn. Theo tài liệu kỹ thuật của Google, khi suy luận đầy đủ được kích hoạt, việc tạo ra đầu ra trở nên đắt hơn khoảng sáu lần so với xử lý tiêu chuẩn. Hệ số nhân chi phí tạo ra động lực mạnh mẽ cho việc kiểm soát tinh chỉnh.
Nathan Habib, một kỹ sư tại Hugging Face, người nghiên cứu các mô hình lý luận, mô tả vấn đề này là đặc hữu trong toàn ngành. "Trong cơn sốt khoe khoang AI thông minh hơn, các công ty đang tìm kiếm các mô hình lý luận như búa ngay cả khi không có chiếc đinh nào ở đó", ông giải thích với MIT Technology Review .
Sự lãng phí không chỉ là lý thuyết. Habib đã chứng minh cách một mô hình lý luận hàng đầu, khi cố gắng giải quyết một bài toán hóa học hữu cơ, đã bị mắc kẹt trong một vòng lặp đệ quy, lặp lại "Khoan đã, nhưng..." hàng trăm lần – về cơ bản là gặp phải sự cố tính toán và tiêu tốn tài nguyên xử lý.
Kate Olszewska, người đánh giá các mô hình Gemini tại DeepMind, xác nhận hệ thống của Google đôi khi gặp phải các vấn đề tương tự, bị kẹt trong các vòng lặp làm tiêu hao năng lượng tính toán mà không cải thiện được chất lượng phản hồi.
Cơ chế kiểm soát hạt
Kiểm soát suy luận AI của Google cung cấp cho các nhà phát triển một mức độ chính xác nhất định. Hệ thống cung cấp một phổ linh hoạt từ 0 (suy luận tối thiểu) đến 24.576 mã thông báo "ngân sách suy nghĩ" - các đơn vị tính toán đại diện cho quá trình xử lý nội bộ của mô hình. Phương pháp tiếp cận chi tiết cho phép triển khai tùy chỉnh dựa trên các trường hợp sử dụng cụ thể.
Jack Rae, nhà khoa học nghiên cứu chính tại DeepMind, cho biết việc xác định mức độ lý luận tối ưu vẫn còn là một thách thức: "Thật sự rất khó để đưa ra ranh giới về nhiệm vụ suy nghĩ hoàn hảo nhất hiện nay".
Thay đổi triết lý phát triển
Việc giới thiệu kiểm soát lý luận AI có khả năng báo hiệu sự thay đổi trong cách trí tuệ nhân tạo phát triển. Kể từ năm 2019, các công ty đã theo đuổi những cải tiến bằng cách xây dựng các mô hình lớn hơn với nhiều tham số và dữ liệu đào tạo hơn. Cách tiếp cận của Google gợi ý một con đường thay thế tập trung vào hiệu quả hơn là quy mô.
Habib cho biết: “Các luật về tỷ lệ đang được thay thế”, chỉ ra rằng những tiến bộ trong tương lai có thể xuất hiện từ việc tối ưu hóa các quy trình lý luận thay vì liên tục mở rộng quy mô mô hình.
Những tác động về môi trường cũng quan trọng không kém. Khi các mô hình lý luận phát triển mạnh, mức tiêu thụ năng lượng của chúng cũng tăng theo tỷ lệ thuận. Nghiên cứu chỉ ra rằng suy luận – tạo ra phản hồi AI – hiện đóng góp nhiều hơn vào lượng khí thải carbon của công nghệ so với quá trình đào tạo ban đầu. Cơ chế kiểm soát lý luận của Google cung cấp một yếu tố giảm thiểu tiềm năng cho xu hướng đáng lo ngại này.
Động lực cạnh tranh
Google không hoạt động một cách biệt lập. Mô hình DeepSeek R1 “open weight” xuất hiện vào đầu năm nay đã chứng minh được khả năng suy luận mạnh mẽ với chi phí thấp hơn, gây ra sự biến động của thị trường được cho là đã gây ra sự biến động của thị trường chứng khoán lên tới gần một nghìn tỷ đô la.
Không giống như cách tiếp cận độc quyền của Google, DeepSeek công khai các thiết lập nội bộ để các nhà phát triển có thể triển khai tại địa phương.
Bất chấp sự cạnh tranh, giám đốc kỹ thuật của Google DeepMind, Koray Kavukcuoglu vẫn khẳng định rằng các mô hình độc quyền sẽ duy trì lợi thế trong các lĩnh vực chuyên biệt đòi hỏi độ chính xác đặc biệt: “Mã hóa, toán học và tài chính là những trường hợp mà mô hình có kỳ vọng cao về độ chính xác, rất chi tiết và có thể hiểu được những tình huống thực sự phức tạp”.
Dấu hiệu trưởng thành của ngành
Sự phát triển của kiểm soát lý luận AI phản ánh một ngành công nghiệp hiện đang phải đối mặt với những hạn chế thực tế vượt ra ngoài các chuẩn mực kỹ thuật. Trong khi các công ty tiếp tục thúc đẩy khả năng lý luận, cách tiếp cận của Google thừa nhận một thực tế quan trọng: hiệu quả cũng quan trọng như hiệu suất thô trong các ứng dụng thương mại.
Tính năng này cũng làm nổi bật sự căng thẳng giữa tiến bộ công nghệ và mối quan tâm về tính bền vững. Bảng xếp hạng theo dõi hiệu suất mô hình lý luận cho thấy các tác vụ đơn lẻ có thể tốn tới 200 đô la để hoàn thành – đặt ra câu hỏi về việc mở rộng các khả năng như vậy trong môi trường sản xuất.
Bằng cách cho phép các nhà phát triển tăng hoặc giảm lý luận dựa trên nhu cầu thực tế, Google giải quyết cả khía cạnh tài chính và môi trường của việc triển khai AI.
“Lý luận là năng lực then chốt xây dựng nên trí thông minh”, Kavukcuoglu nói. “Ngay khi mô hình bắt đầu suy nghĩ, thì cơ quan của mô hình đã bắt đầu hoạt động”. Tuyên bố này cho thấy cả lời hứa và thách thức của các mô hình lý luận – tính tự chủ của chúng tạo ra cả cơ hội và thách thức quản lý tài nguyên.
Đối với các tổ chức triển khai giải pháp AI, khả năng tinh chỉnh ngân sách lý luận có thể dân chủ hóa quyền truy cập vào các khả năng tiên tiến trong khi vẫn duy trì kỷ luật hoạt động.
Google tuyên bố Gemini 2.5 Flash cung cấp "các số liệu tương đương với các mô hình hàng đầu khác với chi phí và quy mô chỉ bằng một phần nhỏ" – một giá trị được củng cố bởi khả năng tối ưu hóa các nguồn lực lý luận cho các ứng dụng cụ thể.
Ý nghĩa thực tế
Tính năng kiểm soát lý luận AI có ứng dụng thực tế ngay lập tức. Các nhà phát triển xây dựng ứng dụng thương mại hiện có thể đưa ra sự cân bằng sáng suốt giữa độ sâu xử lý và chi phí vận hành.
Đối với các ứng dụng đơn giản như truy vấn cơ bản của khách hàng, các thiết lập lý luận tối thiểu bảo toàn tài nguyên trong khi vẫn sử dụng các khả năng của mô hình. Đối với các phân tích phức tạp đòi hỏi sự hiểu biết sâu sắc, khả năng lý luận đầy đủ vẫn khả dụng.
Lý luận 'quay số' của Google cung cấp một cơ chế để thiết lập mức độ chắc chắn về chi phí trong khi vẫn duy trì các tiêu chuẩn về hiệu suất.
Xem thêm: Gemini 2.5: Google tạo ra mô hình AI 'thông minh nhất' cho đến nay

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ những người dẫn đầu ngành? Hãy xem Triển lãm AI & Big Data diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh , BlockX , Tuần lễ chuyển đổi số và Triển lãm an ninh mạng & đám mây .
Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trực tuyến do TechForge hỗ trợ tại đây .
Bài đăng Google giới thiệu khả năng kiểm soát suy luận bằng AI trong Gemini 2.5 Flash xuất hiện đầu tiên trên AI News .




