Mô hình o3 của Sam Altman - đã bị loại bỏ vào cuối tuần qua với sự ra mắt của GPT-5 - đã đánh bại Grok 4 của Elon Musk trong bốn ván liên tiếp vào thứ Năm để giành chiến thắng tại Triển lãm Cờ vua AI Game Arena của Google.
Bạn có thể nghĩ đây là một màn trình diễn kỹ thuật cao cực kỳ phức tạp, nhưng như một món khai vị, hãy nói rằng nhà vô địch thế giới Magnus Carlsen so sánh cả hai Bots như "một đứa trẻ tài năng không biết cách di chuyển các quân cờ".
Giải đấu ba ngày diễn ra từ ngày 5-7 tháng 8 đã buộc các chatbot đa năng - vâng, những chatbot giúp bạn viết email và tuyên bố đang tiến gần đến trí thông minh ngang bằng con người - phải chơi cờ vua mà không có bất kỳ đào tạo chuyên sâu nào. Không có động cơ cờ vua, không được tra cứu nước đi, chỉ là những kiến thức về cờ vua mà chúng đã ngẫu nhiên hấp thụ từ internet.
Kết quả gần như không tinh tế như bạn mong đợi khi buộc một mô hình ngôn ngữ chơi một trò chơi bàn. Carlsen, người đồng bình luận trận chung kết, ước tính cả hai AI đang chơi ở trình độ những người chơi bình thường mới học luật - khoảng 800 ELO. Để so sánh, anh ấy được coi là một trong những kỳ thủ cờ vua giỏi nhất từng tồn tại, với ELO 2839 điểm. Những AI này chơi như thể đã học cờ vua từ một tệp PDF bị hỏng.
"Chúng dao động giữa những nước đi rất, rất tốt và những chuỗi không thể hiểu được," Carlsen nói trong một buổi phát sóng sau trận đấu. Tại một thời điểm, sau khi chứng kiến Grok đưa vua của mình vào nguy hiểm, anh đã đùa rằng nó có thể nghĩ họ đang chơi trò Vua Đồi thay vì cờ vua.
Các trận đấu thực tế giống như một bài học về cách không nên chơi cờ vua, thậm chí đối với những người không biết trò chơi. Trong trận đầu tiên, Grok về cơ bản đã trao một trong những quân cờ quan trọng của mình một cách miễn phí, sau đó làm cho mọi thứ trở nên tồi tệ hơn bằng cách trao đổi thêm các quân cờ trong khi đã ở thế yếu.
Trận thứ hai còn kỳ quặc hơn. Grok đã cố gắng thực hiện những gì các kỳ thủ cờ vua gọi là "Quân Tốt Độc" - một chiến thuật mạo hiểm nhưng hợp lệ, nơi bạn chiếm một quân tốt của đối phương trông có vẻ miễn phí nhưng thực tế không phải. Nhưng Grok lại chiếm nhầm quân tốt hoàn toàn, một quân tốt rõ ràng đã được bảo vệ. Quân hậu (quân mạnh nhất trên bàn cờ) của nó ngay lập tức bị mắc kẹt và bị bắt.
Đến trận thứ ba, Grok đã xây dựng một vị thế trông có vẻ vững chắc - kiểm soát vị trí tốt, không có nguy hiểm rõ ràng, và về cơ bản là một thiết lập có thể giúp bạn giành chiến thắng. Nhưng giữa trận, nó về cơ bản đã trao bóng trực tiếp cho đối thủ. Nó liên tục mất quân này sau quân khác.
Điều này thực sự kỳ lạ, bởi vì trước trận đấu với o3, Grok là một đối thủ khá mạnh, thể hiện tiềm năng vững chắc - đến mức Kỳ thủ Cờ vua Grand Master Hikaru Nakamura đã khen ngợi. "Grok dễ dàng là tốt nhất cho đến nay, chỉ đơn giản là khách quan, dễ dàng là tốt nhất."
Trận thứ tư (và cũng là trận cuối cùng) đã mang lại sự hồi hộp duy nhất. O3 của OpenAI đã mắc sai lầm lớn ngay từ đầu trận, đó là một mối nguy lớn trong bất kỳ trận đấu nào. Nakamura, người đang phát trực tuyến trận đấu, cho biết vẫn còn "một vài mánh khóe" dành cho o3 bất chấp bất lợi.
Anh ấy đã đúng - o3 đã lấy lại được quân hậu của mình và từ từ giành chiến thắng trong khi phong cách cuối trận của Grok sụp đổ như bìa các-tông ướt.
"Grok đã mắc quá nhiều sai lầm trong những trận đấu này, nhưng OpenAI thì không," Nakamura nói trong buổi phát trực tiếp của mình. Đây là sự đảo ngược hoàn toàn so với đầu tuần.
Thời điểm không thể tồi tệ hơn cho Elon Musk. Sau những vòng đầu mạnh mẽ của Grok, anh đã đăng trên X rằng khả năng cờ vua của AI của mình chỉ là "hệ quả phụ" và rằng xAI đã "gần như không nỗ lực gì về cờ vua". Điều đó hóa ra lại là một sự đánh giá thấp.
Trước giải đấu "chính thức" này, Nhà sư quốc tế Levy Rozman đã tổ chức riêng một giải đấu vào đầu năm với các mô hình ít tiên tiến hơn. Anh ấy tôn trọng tất cả các nước đi do chatbot đề xuất, và toàn bộ tình huống đã trở thành một mớ hỗn độn với các nước đi bất hợp pháp, triệu hồi quân cờ và tính toán sai. Stockfish, một AI được xây dựng đặc biệt cho cờ vua, cuối cùng đã giành chiến thắng trong giải đấu chống lại ChatGPT. AI của Altman đã đấu với AI của Musk ở bán kết, và Grok đã thua. Vậy là 2-0 cho Sam.
Tuy nhiên, giải đấu này khác. Mỗi bot được cho 4 cơ hội để thực hiện một nước đi hợp lệ - nếu chúng thất bại 4 lần, chúng sẽ tự động thua. Đây không phải là giả thuyết. Ở những vòng đầu, các AI đã cố gắng dịch chuyển các quân cờ qua bàn, hồi sinh các quân đã chết, và di chuyển quân tốt theo chiều ngang như thể chúng đang chơi một phiên bản cờ vua trong cơn ác mộng mà chúng tự phát minh ra.
Chúng đã bị loại.
Gemini của Google đã giành hạng ba bằng cách đánh bại một mô hình khác của OpenAI, cứu vãn phần nào danh dự cho ban tổ chức. Trận đấu hạng đồng đó đã diễn ra với một trận hòa phi thường, nơi cả hai AI đều có vị thế thắng hoàn toàn ở những thời điểm khác nhau nhưng không thể tìm ra cách kết thúc.
Carlsen chỉ ra rằng các AI giỏi hơn trong việc đếm các quân cờ bị chiếm hơn là thực sự tạo ra chiếu hết - chúng hiểu được lợi thế vật chất nhưng không biết cách chiến thắng. Điều này giống như việc rất giỏi thu thập nguyên liệu nhưng không thể nấu một bữa ăn.
Đây là những mô hình AI mà các nhà điều hành công nghệ tuyên bố đang tiến gần đến trí thông minh con người, đe dọa các công việc văn phòng và cách mạng hóa cách chúng ta làm việc. Nhưng chúng không thể chơi một trò chơi bàn cờ tồn tại được 1.500 năm mà không cố gian lận hoặc quên luật.
Vì vậy, có lẽ an toàn để nói rằng chúng ta vẫn ổn, AI sẽ không kiểm soát nhân loại, ít nhất là trong thời điểm này.




