Thảm họa GPT-5 đã khiến OpenAI rơi vào trạng thái không thể tin nổi! Mọi người đều nghĩ GPT-5 đã giải được mười câu đố Erdos, nhưng hóa ra họ đã tìm ra câu trả lời nhờ tra cứu tài liệu. Hassabis bình luận: "Thật đáng xấu hổ."
Đội ngũ OpenAI đã thổi phồng GPT-5, nhưng hóa ra đó chỉ là trò hề...
Vấn đề là thế này.
Vài ngày trước, nhà khoa học Sebastien Bubeck của OpenAI đã hào hứng chia sẻ bài viết về việc hai nhà nghiên cứu hợp tác với GPT-5 Pro để giải quyết 10 "vụ án chưa có lời giải kéo dài hàng thế kỷ" chỉ trong một tuần.
Các vấn đề của Erdos
Ngay sau đó, Phó chủ tịch khoa học của OpenAI là Kevin Weil và những người khác đã tham gia và quảng bá dự án.
Tuy nhiên, sự thật đã sớm được phơi bày:
Mười bài toán khó này từ lâu đã được giới học thuật giải quyết, chứ không phải do GPT-5 tự giải quyết. Nó chỉ đơn giản đưa ra câu trả lời bằng cách tìm kiếm tài liệu trực tuyến.
Tin tức này đã gây ra một làn sóng phẫn nộ, thậm chí CEO của Google DeepMind là Demis Hassabis cũng phải bình luận: "Điều này thật khó xử".
Ngoài ra, người đoạt giải Turing LeCun đã chế giễu X và nói rằng, "Điều đó giống như tự bắn vào chân mình (GPT) vậy."
GPT-5, một trò hề
Có thể nói trò hề này được chính đội ngũ OpenAI đạo diễn và thực hiện.
Các nhà nghiên cứu Mark Sellke và Mehtaab Sawhney đã nêu rõ trong bài báo của họ rằng họ không khẳng định GPT-5 đã giải quyết được vấn đề.
Bài đăng gốc của họ cho biết sau khi chạy hàng nghìn truy vấn thông qua GPT-5, họ đã tìm ra giải pháp cho mười vấn đề được liệt kê là vấn đề Erdos.
Kết quả vào thời điểm đó là các vấn đề 223, 339, 494, 515, 621, 822, 883, 903, 1043 và 1079 đều đã được giải quyết và có một số tiến triển trong 11 vấn đề khác.
Mặt khác, câu trả lời cho mười câu hỏi khó này đã có nhưng người quản trị trang web chưa cập nhật chúng.
Cổng thông tin: https://www.erdosproblems.com/
Thomas Bloom, một nhà nghiên cứu tại Hội Hoàng gia và là người điều hành trang web erdosproblems.com, không hề biết về điều này.
Trên trang web, trạng thái "mở" chỉ có nghĩa là cá nhân ông không biết giải pháp cho vấn đề, chứ không phải là vấn đề đó vẫn chưa được cộng đồng khoa học giải quyết.
Tóm lại, hai sự hiểu lầm này kết hợp lại khiến mọi người có "ảo tưởng" rằng GPT-5 đã giải quyết được vấn đề Erdős.
Một mặt, vấn đề vẫn chưa được giải quyết, nhưng người quản lý trang web không nhận thức được điều đó; mặt khác, GPT-5 chỉ hoàn thành vấn đề bằng cách tìm kiếm tài liệu, chứ không tự giải quyết được.
Sebastien Bubeck trả lời một cách ngượng ngùng rằng GPT-5 chỉ đơn giản là tìm ra giải pháp trong tài liệu, thế thôi.
Mặc dù vậy, cách này vẫn rất hiệu quả vì tôi biết việc tìm kiếm tài liệu khó khăn như thế nào.
Được cư dân mạng bàn tán sôi nổi, vẫn cần được bình duyệt
Những người nổi tiếng trong phần bình luận đang ngồi ở hàng ghế đầu và thưởng thức chương trình.
Thông qua cuộc tranh luận này, nhà phát triển Matt Mazur đã nói rõ rằng bất kỳ ai cũng phải thận trọng với bất kỳ tuyên bố nào cho rằng AI đã khám phá ra kết quả khoa học hoặc toán học mới.
Yuchen Jin, người sáng lập Hyperbolic, cho biết: "Cần phải có nhiều đánh giá ngang hàng hơn về những khám phá mới trong khoa học/toán học do AI thực hiện."
Tuy nhiên, một số người cho rằng rằng điều này không gây khó chịu cho GPT-5. Xét cho cùng, nó hoạt động rất tốt trong việc tìm kiếm tài liệu.
Vài ngày trước, Terence Tao cũng viết một bài báo nói rằng, "Tôi ngày càng cảm thấy rằng nếu AI thực sự muốn đóng vai trò trong toán học, thì chìa khóa có thể không phải là sử dụng các mô hình mạnh nhất để giải quyết những vấn đề khó nhất."
Tất nhiên, thỉnh thoảng vẫn có những trường hợp như thế này, đặc biệt là khi mọi người đầu tư lượng lớn tỷ lệ băm và công sức chuyên môn vào đó.
Nhưng một cách tiếp cận đáng tin cậy hơn là sử dụng các công cụ AI cấp trung để giúp chúng ta xử lý công việc tầm thường và vật lý không thể tránh khỏi trong nghiên cứu.
Luôn luôn thận trọng với những khám phá AI ban đầu là ưu tiên hàng đầu, nhưng điều này không ngăn cản nghiên cứu khoa học được hỗ trợ bởi AI trở thành con đường cần thiết cho tương lai.
Tham khảo:
https://x.com/SebastienBubeck/status/1979539604522127746
https://x.com/thomasfbloom/status/1979254235075059732
Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Taozi và được 36Kr cấp phép xuất bản.