Một giáo sư kinh tế đã nghỉ hưu đã nhầm lẫn GPT-5 với một câu hỏi đơn giản và hiệu suất kém của nó không hề giống với "AI cấp tiến sĩ" mà Altman quảng cáo.
Câu hỏi rất đơn giản, đó là về trò chơi Tic-Tac-toe mà chúng ta đều chơi khi còn nhỏ.
Giáo sư nói với GPT-5: " Trước khi trò chơi bắt đầu, hãy xoay bàn cờ 90 độ sang phải một lần ." Rõ ràng, theo lẽ thường, làm như vậy sẽ không thay đổi trò chơi chút nào.
Tuy nhiên, GPT-5 có nói về điều này:
Người chơi đã quen với việc chơi một bàn cờ ca-rô thẳng đứng, vì vậy việc xoay bàn cờ có thể thay đổi một cách tinh tế cách họ nhận thức về các mối đe dọa và cơ hội . Về mặt toán học, xoay bàn cờ 90 độ không làm thay đổi các tổ hợp chiến thắng có thể có; trò chơi vẫn như cũ. Tuy nhiên, về mặt tâm lý, người chơi có thể cảm thấy khác .
Sau đó, GPT-5 đã thực hiện một số hoạt động vô lý khiến giáo sư phải câm lặng.
Giáo sư cũng thẳng thắn chia sẻ rằng GPT-5 hiện tại mang lại cảm giác hoàn toàn khác biệt so với khi nó mới ra mắt. Sự thay đổi về phong cách này rất có thể là do sự điều chỉnh chiến lược của OpenAI: họ cố tình làm cho mô hình mới này chuyển hướng theo hướng của GPT-4o, trở nên "thân thiện và gần gũi hơn".
Trong một cuộc phỏng vấn gần đây, Altman thừa nhận rằng GPT-5 thực sự đã được điều chỉnh , nói rằng bản phát hành ban đầu của GPT-5 đã được xử lý không đúng cách (khiến một số mô hình như GPT-4o bị khai tử trực tiếp). Kết quả là, OpenAI đã âm thầm đưa ra bản cập nhật giọng điệu cho GPT-5, khiến phong cách của nó "thân thiện hơn nhiều".
Nhân tiện, Ultraman đã bắt đầu quảng cáo rầm rộ về GPT-6 khi nói rằng "sự xuất hiện của GPT-6 sẽ nhanh hơn khoảng thời gian giữa GPT-4 và GPT-5".
Ngoài ra, OpenAI còn tiết lộ đang thử nghiệm tính năng " Nỗ lực suy nghĩ " mới của ChatGPT.
Câu trả lời GPT-5 đầy rẫy lỗ hổng
Tên của giáo sư là Gary Smith, giáo sư kinh tế tại Pomona College, người mới nghỉ hưu gần đây.
Khi hỏi GPT-5 câu hỏi "xoay bàn cờ caro 90 độ", câu trả lời của mô hình đã đầy rẫy lỗ hổng. Sau đó, GPT-5 còn đưa ra quan điểm trái ngược với lý thuyết trò chơi dân gian.
Theo lẽ thường trong lý thuyết trò chơi dân gian, nếu bạn đặt quân cờ vào góc trước trong trò chơi ô ăn quan thì khả năng chiến thắng sẽ cao hơn .
Tuy nhiên, GPT-5 khẳng định chắc chắn rằng "chọn ô trung tâm vẫn là nước đi khai cuộc mạnh nhất" và tiếp tục giải thích: " Khi hướng của bàn cờ thay đổi, người chơi có thể đánh giá ưu và nhược điểm của việc đặt quân cờ ở các cạnh và góc ". Tuyên bố này hoàn toàn vô lý.
Sau đó, giáo sư tiếp tục chủ đề này bằng cách hỏi: "Liệu việc xoay bàn cờ có khiến con người khó chơi tốt trò chơi này hơn không?"
Chính từ câu hỏi này mà GPT-5 hoàn toàn rơi vào trạng thái không mạch lạc. Ban đầu nó nói:
Xét về mặt chiến thuật thuần túy, việc xoay bàn cờ không thay đổi gì cả. Mỗi đường thắng (hàng, cột, đường chéo) chỉ đơn giản là ánh xạ đến một đường thắng khác. Do đó, nếu bạn là AI hoặc một con người hoàn toàn có khả năng, trò chơi tic-tac-toe xoay vẫn chơi giống hệt như trò tic-tac-toe thông thường.
Tuy lời phát biểu dài dòng, nhưng nội dung thì đúng. Nhưng trước khi giáo sư kịp sắp xếp suy nghĩ, GPT-5 đã đổi chủ đề và nói: "Nhưng đối với con người thì khác ."
Tiếp theo, GPT-5 tiếp tục đưa ra những phản hồi "hăng hái", nhưng vị giáo sư ngày càng cảm thấy có gì đó không ổn. Không chỉ những câu trả lời dài dòng và cố tình tâng bốc, mà phong cách cũng giống GPT-4o hơn. Quan trọng là, trong đó rất nhiều lỗi chỉ cần nhìn thoáng qua là thấy rõ. Điều này hoàn toàn khác xa với trải nghiệm"trò chuyện với một người bạn tài giỏi với trí thông minh cấp tiến sĩ" mà OpenAI gần đây đã quảng bá.
Sau đó, GPT-5 lại tình nguyện, nói rằng nó sẽ "vẽ một bàn cờ ô-pô xoay với các vị trí đánh dấu... để bạn có thể thấy mỗi lần xoay ảnh hưởng đến khả năng nhận biết bàn cờ của người chơi như thế nào".
Kết quả cuối cùng là các sơ đồ không chỉ hoàn toàn hỗn loạn mà còn đầy lỗi chính tả và một số bàn cờ trống vô nghĩa.
Hai điều nữa
Một số cư dân mạng gần đây đã phát hiện ra rằng OpenAI đang phát triển một tính năng mới có tên "Nỗ lực suy nghĩ" cho ChatGPT, cho phép người dùng tự do lựa chọn cường độ suy nghĩ của ChatGPT .
Tính năng này hiện đang trong giai đoạn thử nghiệm và có bốn mức cường độ: nhẹ , với giá trị thuộc tính bên trong là 5; tiêu chuẩn , với giá trị tương ứng là 18; mở rộng , với giá trị tương ứng là 48; và mức cao nhất, tối đa , đạt tới 200.
Các giá trị này biểu thị hạn ngạch "tài nguyên tính toán" nội bộ của mô hình. Hạn ngạch cao hơn có nghĩa là mô hình sẽ thực hiện nhiều bước tính toán hơn, thường cung cấp câu trả lời sâu hơn, nhưng cũng phản hồi chậm hơn.
Trong đó, cấp độ tối đa có những hạn chế về quyền sử dụng và chỉ dành cho người dùng gói cao cấp Pro với giá đăng ký là 200 đô la Mỹ.
Ngoài ra, Altman gần đây đã bắt đầu quảng cáo rầm rộ về GPT-6 trong một cuộc phỏng vấn với CNBC, chỉ ra rằng GPT-6 không chỉ có thể đáp ứng nhu cầu của người dùng mà còn chủ động thích ứng với người dùng, cho phép người dùng tạo ra các chatbot đáp ứng sở thích cá nhân của họ.
Ông cho rằng rằng chức năng bộ nhớ là chìa khóa để biến ChatGPT thành một sản phẩm cá nhân hóa thực sự, và cho biết OpenAI đang hợp tác chặt chẽ với các nhà tâm lý học để tối ưu hóa sản phẩm . Đội ngũ sẽ theo dõi cảm xúc của người dùng trong quá trình sử dụng và giám sát những thay đổi trong trải nghiệm người dùng về lâu dài.
Điều đáng nói là Altman cho biết chức năng bộ nhớ nâng cao là tính năng mà ông yêu thích nhất được ChatGPT ra mắt trong năm nay, nhưng vẫn có những rủi ro về quyền riêng tư, đặc biệt là vì dữ liệu bộ nhớ tạm thời vẫn chưa crypto .
Về kế hoạch ứng phó, Altman chỉ nói mơ hồ rằng chức năng crypto"có khả năng" sẽ được bổ sung trong tương lai, nhưng hiện tại vẫn chưa có kế hoạch thời gian cụ thể.
Khi nói về hướng đi trong tương lai, Ultraman cho biết anh quan tâm nhiều hơn đến lĩnh vực giao diện não-máy tính và cũng quan tâm đến năng lượng, thiết bị phần cứng mới, công nghệ robot và các phương pháp xây dựng trung tâm dữ liệu hiệu quả hơn.
Ông cũng đề cập rằng có những hạn chế trong quá trình phát triển ChatGPT:
Những mô hình này đã đạt đến giới hạn trong kịch bản tương tác trò chuyện và hiệu suất của chúng sẽ không cải thiện đáng kể... thậm chí có thể trở nên tệ hơn.
Liên kết tham khảo:
[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/
Bài viết này được trích từ tài khoản công khai WeChat "Quantum Bit" , tác giả: Tập trung vào công nghệ tiên tiến, 36Kr được phép xuất bản.