Baidu, công ty tương đương với Google của Trung Quốc, đã chính thức phát hành ERNIE 5.1 vào cuối tuần trước, và con số nổi bật rất đáng chú ý: Chi phí huấn luyện mô hình này thấp hơn khoảng 94% so với các hệ thống AI tương đương ở cùng quy mô.
Để dễ hình dung hơn, việc huấn luyện một mô hình AI tiên tiến thường tiêu tốn vài triệu (thậm chí hàng tỷ) đô la chi phí tính toán. Baidu, công ty kiểm soát hơn 76% thị trường tìm kiếm của Trung Quốc và niêm yết trên Nasdaq với mã BIDU, tuyên bố đã đạt được hiệu suất tương đương với chi phí chỉ bằng khoảng một phần hai mươi so với con số đó.
Thủ thuật này được gọi là "huấn luyện trước đa chiều linh hoạt". Thay vì xây dựng ERNIE 5.1 từ đầu, Baidu đã trích xuất một mạng con được tối ưu hóa từ kiến trúc ERNIE 5.0 hiện có của mình—được phát hành vào tháng 1 năm 2026—và thu nhỏ nó lại. Tổng số tham số giảm xuống còn khoảng một phần ba so với ban đầu. Các tham số hoạt động (những tham số thực sự thực hiện công việc trong một cuộc hội thoại) đã giảm đi một nửa. Kết quả là một mô hình gọn nhẹ hơn, kế thừa cơ sở tri thức của mô hình mẹ lớn hơn mà không cần phải lặp lại toàn bộ quá trình huấn luyện.
Trên LMArena Search Arena—bảng xếp hạng nơi người dùng thực so sánh các mô hình AI trong các tác vụ tìm kiếm web trực tiếp, được chấm điểm theo sở thích của con người —ERNIE 5.1 đạt 1.223 điểm , đứng thứ tư toàn cầu và đứng đầu trong số tất cả các mô hình của Trung Quốc. Khả năng hoạt động độc lập của nó—khả năng xử lý các tác vụ nhiều bước như điền vào bảng tính hoặc tự động duyệt web—đã vượt qua DeepSeek-V4-Pro, mô hình chuẩn trước đó của Trung Quốc.
ERNIE có thể nghe có vẻ lạ lẫm đối với người phương Tây, nhưng thực chất nó là một mô hình khá phổ biến ở Trung Quốc. Baidu đã ra mắt Ernie Bot vào tháng 8 năm 2023, và chatbot này đã đạt 100 triệu người dùng tại Trung Quốc vào tháng 12 cùng năm – nhanh hơn hầu hết các đối thủ cạnh tranh Trung Quốc, mặc dù vẫn chậm hơn kỷ lục toàn cầu hai tháng mà ChatGPT đạt được cột mốc tương tự.
Khía cạnh hiệu quả phản ánh những gì DeepSeek đã làm với ngành công nghiệp AI vào tháng 1 năm 2025. Khi công ty khởi nghiệp Trung Quốc này phát hành R1 — một mô hình có hiệu năng tương đương với o1 của OpenAI với chi phí truy vấn thấp hơn 98% — nó đã gây ra sự sụt giảm 600 tỷ đô la giá trị thị trường của Nvidia và buộc mọi phòng thí nghiệm AI lớn phải suy nghĩ lại xem liệu việc tăng cường sức mạnh tính toán có phải là chiến lược khả thi duy nhất hay không. ERNIE 5.1 là một câu chuyện về hiệu quả khác — tập trung vào khía cạnh huấn luyện chứ không phải suy luận — nhưng thông điệp cốt lõi vẫn giống nhau: các phòng thí nghiệm Trung Quốc tiếp tục tìm cách làm được nhiều việc hơn với ít nguồn lực hơn.
Quy trình xử lý sau huấn luyện cũng đáng chú ý. Baidu đã xây dựng một hệ thống học tăng cường bốn giai đoạn mà họ gọi là MOPD (Multi-Teacher On-Policy Distillation). Thay vì cố gắng dạy mọi kỹ năng cùng một lúc—điều này thường gây ra "hiệu ứng bập bênh", ví dụ như việc cải thiện khả năng toán học lại làm giảm khả năng viết sáng tạo—Baidu đã huấn luyện song song các mô hình chuyên gia chuyên biệt cho các nhiệm vụ lập trình, suy luận và tác nhân, sau đó chắt lọc tất cả chúng thành một mô hình thống nhất duy nhất. Giai đoạn học tăng cường trực tuyến cuối cùng xử lý các cuộc hội thoại mở và sản phẩm sáng tạo, bảo tồn những gì mà quá trình chắt lọc không thể nắm bắt tốt.
Về lý thuyết, điều đó có nghĩa là tất cả các kỹ năng đều được cân bằng về trình độ, không có kỹ năng nào được ưu tiên hơn kỹ năng khác.
Trên GPQA (Graduate-Level Google-Proof Q&A, một tiêu chuẩn đánh giá xem mô hình có thể trả lời các câu hỏi khoa học cấp chuyên gia mà không thể tìm kiếm trên Google hay không), ERNIE 5.1 đạt hiệu suất gần bằng các mô hình mã nguồn đóng hàng đầu của phương Tây. Trên AIME26—Kỳ thi Toán học Mời gọi Hoa Kỳ được điều chỉnh cho năm 2026, kiểm tra khả năng giải quyết vấn đề nâng cao trong điều kiện thi đấu—mô hình đạt 99,6% khi sử dụng phương pháp suy luận có sự hỗ trợ của công cụ, chỉ đứng sau Gemini 3.1 Pro.
Baidu cho biết ERNIE 5.1 hiện đang được triển khai trên hơn 10 nền tảng sáng tạo và tác nhân tại Trung Quốc, bao gồm các nền tảng nhập vai AI và công cụ tạo phim Short . Mô hình này có thể truy cập tại ernie.baidu.com và thông qua API trên nền tảng AI Cloud của Baidu.
Baidu sẽ tổ chức hội nghị nhà phát triển thường niên Create 2026 vào ngày 13-14 tháng 5 tại Bắc Kinh, nơi họ dự định giới thiệu các ứng dụng công nghiệp mới nhất của ERNIE. Sự kiện đó sẽ là một dấu hiệu tiếp theo cho thấy công ty dự định đẩy mạnh mô hình này vào thị trường doanh nghiệp và toàn cầu như thế nào.




