Một câu hỏi then chốt trong trí tuệ nhân tạo là các mô hình thường xuyên vượt ra ngoài việc chỉ đơn thuần lặp lại và trộn lẫn những gì đã học để tạo ra những ý tưởng hoặc nhận thức hoàn toàn mới như thế nào.
Một dự án mới từ Google DeepMind cho thấy rằng với một vài điều chỉnh thông minh, các mô hình này ít nhất có thể vượt qua chuyên môn của con người trong việc thiết kế các loại thuật toán nhất định - bao gồm cả những thuật toán hữu ích cho việc phát triển chính AI.
Dự án AI mới nhất của công ty, được gọi là AlphaEvolve, kết hợp các kỹ năng lập trình của mô hình AI Gemini với một phương pháp để kiểm tra hiệu quả của các thuật toán mới và một phương pháp tiến hóa để tạo ra các thiết kế mới.
AlphaEvolve đã tạo ra các thuật toán hiệu quả hơn cho một số loại tính toán, bao gồm một phương pháp tính toán liên quan đến ma trận tốt hơn phương pháp Strassen đã được sử dụng trong 56 năm. Phương pháp mới cải thiện hiệu quả tính toán bằng cách giảm số lượng phép tính cần thiết để tạo ra một kết quả.
DeepMind cũng đã sử dụng AlphaEvolve để tạo ra các thuật toán tốt hơn cho một số vấn đề thực tế, bao gồm lập lịch nhiệm vụ bên trong trung tâm dữ liệu, phác thảo thiết kế chip máy tính và tối ưu hóa thiết kế các thuật toán được sử dụng để xây dựng các mô hình ngôn ngữ lớn như Gemini.
"Đây là ba yếu tố then chốt của hệ sinh thái AI hiện đại," Pushmeet Kohli, trưởng bộ phận AI khoa học tại DeepMind, cho biết. "Tác nhân lập trình siêu con người này có thể thực hiện một số nhiệm vụ và vượt xa những gì được biết đến về các giải pháp cho chúng."
Matej Balog, một trong những nhà nghiên cứu chính của AlphaEvolve, cho biết thường rất khó để biết liệu một mô hình ngôn ngữ lớn đã tạo ra một phần viết hoặc mã hoàn toàn mới, nhưng có thể chứng minh rằng không ai đã tìm ra giải pháp tốt hơn cho một số vấn đề nhất định. "Chúng tôi đã chứng minh rất chính xác rằng bạn có thể khám phá ra một cái gì đó hoàn toàn mới và chính xác," Balog nói. "Bạn có thể chắc chắn rằng những gì bạn tìm thấy không thể có trong dữ liệu đào tạo."
Sanjeev Arora, một nhà khoa học tại Đại học Princeton chuyên về thiết kế thuật toán, cho biết những tiến bộ do AlphaEvolve thực hiện là tương đối nhỏ và chỉ áp dụng cho các thuật toán liên quan đến việc tìm kiếm trong không gian các câu trả lời tiềm năng. Nhưng ông nhấn thêm: "tìm kiếm là một ý tưởng khá chung được áp dụng trong nhiều bối cảnh."
Lập trình được hỗ trợ bởi AI đang bắt đầu thay đổi cách các nhà phát triển và công ty viết phần mềm. Các mô hình AI mới nhất giúp những người mới bắt đầu dễ dàng xây dựng các ứng dụng và trang web đơn giản, và một số nhà phát triển có kinh nghiệm đang sử dụng AI để tự động hóa nhiều công việc của mình hơn.
AlphaEvolve thể hiện tiềm năng của AI trong việc tạo ra những ý tưởng hoàn toàn mới thông qua việc thử nghiệm và đánh giá liên tục. DeepMind và các công ty AI khác hy vọng rằng các tác nhân AI sẽ dần học được sự sáng tạo tổng quát hơn trong nhiều lĩnh vực, có thể cuối cùng sẽ tạo ra các giải pháp sáng tạo cho một vấn đề kinh doanh hoặc những nhận thức mới khi được đưa ra một vấn đề cụ thể.
Josh Alman, phó giáo sư tại Đại học Columbia chuyên về thiết kế thuật toán, cho biết AlphaEvolve dường như đang tạo ra những ý tưởng mới thay vì trộn lẫn những thứ nó đã học được trong quá trình đào tạo. "Nó phải làm một cái gì đó mới và không chỉ đơn thuần lặp lại," ông nói.
Các nhà nghiên cứu DeepMind nhận thấy rằng đôi khi họ có thể đưa ra một ý tưởng về thuật toán như một lời nhắc và tạo ra những kết quả mới thú vị. Alman nói rằng điều này mở ra triển vọng các nhà khoa học con người có thể cộng tác với một hệ thống như AlphaZero. "Điều đó có vẻ rất thú vị đối với tôi," ông nói.
AlphaEvolve không phải là chương trình DeepMind duy nhất thể hiện sự sáng tạo thực sự. Chương trình chơi bàn cờ nổi tiếng của công ty, AlphaZero, đã có thể phát minh ra các nước đi và chiến lược gốc thông qua hình thức thử nghiệm riêng của mình. Balog cho biết phương pháp tiến hóa được nhóm ông sử dụng có thể được kết hợp với phương pháp học tăng cường được sử dụng trong AlphaZero - một quá trình cho phép một chương trình học thông qua phản hồi tích cực và tiêu cực - để tạo ra một cái gì đó khám phá những ý tưởng mới trong các lĩnh vực khác.
Hai dự án DeepMind trước đây cũng đã sử dụng AI để mở rộng các ranh giới của khoa học máy tính. AlphaTensor, từ năm 2022, đã sử dụng phương pháp học tăng cường để tạo ra các thuật toán mới. Fun Search, từ năm 2024, đã sử dụng một phương pháp tiến hóa để tạo ra mã hiệu quả hơn cho một vấn đề nhất định.
Neil Thompson, một nhà khoa học tại MIT nghiên cứu cách các thuật toán ảnh hưởng đến tiến trình công nghệ, cho biết một câu hỏi then chốt không chỉ là liệu các thuật toán AI có thể thể hiện những ý tưởng gốc, mà còn là làm thế nào để điều này có thể áp dụng rộng rãi cho nghiên cứu khoa học và đổi mới.
"Nếu những khả năng này có thể được sử dụng để giải quyết các vấn đề lớn hơn, ít được xác định phạm vi hơn, nó có tiềm năng tăng tốc đổi mới - và do đó là thịnh vượng," Thompson nói.
Bạn nghĩ gì về AlphaEvolve? Bạn muốn AI giải quyết những vấn đề mới mẻ nào? Hãy cho tôi biết bằng cách gửi email tới hello@wired.com hoặc thêm vào phần bình luận bên dưới.





