GPT-5 đột phá vào thế giới toán học, chứng minh định lý nhanh hơn cả nghiên cứu sinh tiến sĩ? Cư dân mạng tranh luận sôi nổi về nhân vật mới của AI

Bài viết này được dịch máy
Xem bản gốc

Vào đầu tháng 9, một bài báo đăng trên arXiv đã gây chấn động cộng đồng học thuật—GPT-5 đã được đưa vào kết quả nghiên cứu toán học.

Các nhà nghiên cứu đã viết công khai trong bài báo: GPT-5 đã hoàn thành một nhiệm vụ toán học chưa từng được giải quyết trước đây trong thí nghiệm của họ và trực tiếp đưa kết quả vào bản thảo chính thức.

Đây là lần đầu tiên một mô hình ngôn ngữ lớn xuất hiện trong một bài báo nghiên cứu toán học với tư cách là "người đóng góp cho định lý".

Bài báo đề cập đến một vấn đề cốt lõi trong khuôn khổ Malliavin–Stein.

GPT-5 được viết thành một bài báo toán học lần đầu tiên

Trong nghiên cứu toán học, "Định lý mômen thứ tư" là một phần cơ bản nhưng lại phức tạp.

Ban đầu, Nualart và Peccati đề xuất phương pháp này để xác định xem một loại biến ngẫu nhiên nhất định có hội tụ về phân phối chuẩn hay không.

Nhưng định lý này từ lâu đã có một "khoảng trống":

Nó chỉ có thể cho bạn biết "liệu nó có hội tụ hay không", nhưng không thể định lượng được "nó sẽ hội tụ nhanh như thế nào".

Đội ngũ nghiên cứu đã quyết định để lại khoảng trống này cho GPT-5.

Câu hỏi của họ rất trực tiếp: Trong khuôn khổ Malliavin–Stein, liệu "sự hội tụ định tính" của định lý mômen thứ tư có thể được nâng cấp thành "sự hội tụ định lượng" và đưa ra giới hạn tốc độ rõ ràng hay không?

Câu trả lời của GPT-5 thật đáng ngạc nhiên. Nó đưa ra một kết luận mới về tốc độ hội tụ:

Một định lý mới bắt nguồn từ GPT-5: Định lý mômen thứ tư có tốc độ hội tụ rõ ràng lần đầu tiên và được đưa vào bài báo một cách nguyên vẹn

Nói cách khác, điều này chứng tỏ rằng nếu mômen thứ tư dần dần tiến tới giá trị phân phối chuẩn Gauss thì tốc độ hội tụ cũng có thể được mô tả rõ ràng.

Ý nghĩa của kết quả này không chỉ đơn thuần là giải quyết một chỗ trống.

Đối với các nhà nghiên cứu toán học, tốc độ hội tụ thường quyết định liệu một định lý có thực sự có thể được áp dụng cho các mô hình phức tạp hay không, chẳng hạn như trường ngẫu nhiên đa chiều, phân tích giá trị cực đại của dữ liệu tài chính và thậm chí là mô phỏng các quá trình ngẫu nhiên trong vật lý.

Trước đây, chúng ta chỉ có thể nói một cách chung chung rằng nó "sẽ hội tụ", nhưng hiện nay khi đã có ranh giới về mặt định lượng, nhiều ứng dụng đã trở nên khả thi.

Quan trọng hơn, quá trình này không phải để đội ngũ nghiên cứu "làm đẹp GPT-5" mà là để kết hợp trực tiếp nguồn gốc của nó vào kết quả chính thức.

Đây là lần một mô hình ngôn ngữ lớn được đưa vào nội dung chính của một bài báo nghiên cứu toán học với tư cách là "người đóng góp định lý".

Không phải là một cuộc chiến một chọi một

Đó là sự kết hợp của “giáo sư + AI”

Khi mọi người thấy GPT-5 được đưa vào một bài báo, họ dễ nghĩ đến việc "AI có khả năng tự giải quyết các bài toán khó".

Nhưng sự thật không đơn giản như vậy.

GPT-5 đã viết một phát biểu định lý ngay từ đầu, có vẻ hoàn chỉnh về mặt logic, nhưng lại sử dụng một công thức không chính xác trong quá trình suy ra liên kết chính Cov(Y², Z²).

Nếu không phát hiện kịp thời, lỗi này sẽ phá hỏng toàn bộ bản chứng minh.

Các nhà nghiên cứu hỏi:

Bạn có thể kiểm tra công thức Cov(Y², Z²) của bạn và cung cấp cho tôi thông tin chi tiết không?

GPT-5 ngoan ngoãn đưa ra lời giải thích chi tiết, nhưng vẫn sai.

Các nhà nghiên cứu chỉ ra rằng:

Tôi nghĩ bạn đã nhầm khi khẳng định rằng (p+q)!‖u⊗v‖² = p!q!‖u‖²‖v‖².

Chỉ đến lúc đó GPT-5 mới thừa nhận rằng lý luận trước đó của mình là sai và điều chỉnh lại suy nghĩ.

Dưới sự hướng dẫn của các nhà nghiên cứu, cuối cùng đã viết được phép suy luận chính xác và sau đó sắp xếp các kết quả thành một bài báo hoàn chỉnh theo yêu cầu.

Quá trình sửa lỗi lặp đi lặp lại này khiến tác giả bài báo phải thở dài: Làm việc với GPT-5 giống như đào tạo một thực tập sinh thông minh nhưng bốc đồng.

Nó có thể nhanh chóng đề xuất hướng đi và tạo ra bằng chứng, nhưng nó luôn cần một người cố vấn để theo dõi, chỉ ra lỗi và cho phép nó sửa lỗi.

Mollick: GPT-5 Pro có thể thực hiện phép toán mới, nhưng chỉ khi có sự hướng dẫn của giáo sư

Đây không phải là cuộc chiến một chọi một giữa AI, mà là sự kết hợp giữa giáo sư và AI.

Người ngoài kêu lên, người trong cuộc vẫn bình tĩnh

Khi tin tức về việc GPT-5 được đưa vào bài báo lan truyền, phản ứng đầu tiên của nhiều người ngoài lĩnh vực này là "lịch sử".

Vào ngày 20 tháng 8, nhà nghiên cứu Sébastien Bubeck của Microsoft đã đăng trên X:

Ông đã sử dụng GPT-5 Pro để giải quyết một vấn đề mở trong lĩnh vực tối ưu hóa lồi.

Chỉ trong vài phút, GPT-5 đã nâng ranh giới cổ điển từ 1/L1/L1/L lên 1,5/L1,5/L1,5/L.

Nghe có vẻ giống như những ký hiệu toán học nhàm chán, vậy tại sao nó lại gây ra sự chú ý như vậy?

Trong tối ưu hóa lồi, 1/L biểu thị giới hạn trên của tốc độ hội tụ mà thuật toán có thể đạt được và giới hạn trên này xác định trực tiếp tốc độ chạy của thuật toán.

Các nhà nghiên cứu từ lâu đã quen với việc coi nó như một định luật, nhưng GPT-5 đã đưa ra giới hạn chặt chẽ hơn chỉ sau vài phút: 1,5/L.

Điều này có nghĩa là nếu đúng, về mặt toán học, nó có thể "tăng tốc" toàn bộ một lớp thuật toán trên toàn lĩnh vực.

Bài đăng này nhanh chóng gây sốt trên mạng xã hội và được nhiều người coi là khoảnh khắc mở đầu cho kỷ nguyên của các nhà toán học AI.

Tuy nhiên, cách giải thích trong cộng đồng toán học lại tỉnh táo hơn nhiều.

Chuyên gia tối ưu hóa Ernest Ryu bình luận:

Phần trình diễn này của GPT-5 dựa rất nhiều vào một công cụ mà các chuyên gia đã biết: Định lý Nesterov… Một nhà nghiên cứu giàu kinh nghiệm cũng có thể thu được kết quả tương đương chỉ sau vài giờ.

Nói cách khác, những gì người ngoài nhìn thấy là "một bước đột phá hoàn thành trong vài phút" thực chất là "việc tái sử dụng nhanh chóng các công cụ quen thuộc" trong mắt người trong cuộc.

Liệu đây có phải là accelerator nghiên cứu khoa học hay là rào cản đối với những người có bằng tiến sĩ?

GPT-5 đã được đưa vào bài báo và trông giống như một accelerator nghiên cứu khoa học, nhưng tác giả đã viết ra những lo ngại đáng kể ở phần cuối.

Các nhà nghiên cứu đã phát hiện ra rằng GPT-5 thực sự có khả năng kết hợp nhanh chóng các công cụ hiện có để tạo ra kết quả.

Về mặt kỹ thuật thì đúng, nhưng thiếu tính độc đáo thực sự.

Nếu ngày càng có nhiều "nghiên cứu về trò chơi ghép hình" như vậy tràn vào cộng đồng học thuật trong tương lai, thì tài liệu có thể sẽ bị ngập trong một lượng lớn kết quả "đúng nhưng tầm thường", và những công trình thực sự mang tính đột phá sẽ khó có thể nổi bật.

Điều chúng ta cần cảnh giác hơn là con đường phát triển của nghiên cứu sinh tiến sĩ.

Theo nhịp độ truyền thống, họ phải dựa vào việc đọc đi đọc lại, thử nghiệm và sai sót để dần dần phát triển trực giác nghiên cứu.

Nhưng nếu AI có thể tạo ra những suy luận chính xác về mặt kỹ thuật bất cứ lúc nào, thì những bước thử nghiệm và sai sót quan trọng này có thể được bỏ qua. Bài báo nêu rất thẳng thắn:

Nếu học sinh quá phụ thuộc vào AI… chúng có thể mất đi những cơ hội cần thiết để phát triển những kỹ năng thiết yếu này.

Mối lo ngại này không phải là không có cơ sở.

Nhà nghiên cứu Noam Brown của OpenAI cũng đã công khai nhắc nhở:

Nói cách khác, GPT-5 đã có thể tạo ra những định lý mới, nhưng liệu nó có biến nghiên cứu khoa học thành "dây chuyền lắp ráp đồ ăn nhanh" hay thúc đẩy nhân loại bước vào một cuộc bùng nổ tri thức mới? Không ai có thể đảm bảo câu trả lời.

Từ trường hợp tối ưu lồi của Bubeck đến bước đột phá về mặt định lượng của định lý Malliavin–Stein, GPT-5 không còn là một món đồ chơi trong phòng thí nghiệm nữa mà thực sự đã xuất hiện trong văn bản của các bài báo học thuật.

Nó có thể tạo ra các định lý, đưa ra bằng chứng và thậm chí hoàn thành toàn bộ quá trình nghiên cứu dưới sự hướng dẫn của giáo sư.

Nhưng câu hỏi cũng được đặt ra: khi những kết quả "đúng nhưng tầm thường" có thể được sao chép trên quy mô lớn, liệu những đột phá ban đầu có bị lấn át không?

Khi AI bỏ qua quá trình thử nghiệm và khám phá quan trọng nhất đối với nghiên cứu sinh tiến sĩ, liệu đào tạo học thuật có mất đi nền tảng của nó không?

Trong những năm tới, nhân vật của AI trong nghiên cứu khoa học có thể thay đổi nhanh hơn và mạnh mẽ hơn bất kỳ ai có thể tưởng tượng.

Vậy câu hỏi thực sự là: khi AI đã có thể viết bài báo, các nhà nghiên cứu con người còn cần phải viết gì nữa?

Tham khảo:

https://x.com/polynoamial/status/1964464373516427491

https://x.com/emollick/status/1964447221853966775

https://x.com/ns123abc/status/1964724813940842934

https://x.com/SebastienBubeck/status/1958198661139009862

https://arxiv.org/abs/2509.03065

Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, biên tập: Qingqing và được 36Kr cấp phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận