Thoạt nhìn, một loạt bài nghiên cứu gần đây do một phòng thí nghiệm trí tuệ nhân tạo nổi tiếng tại Đại học British Columbia ở Vancouver thực hiện có vẻ không đáng chú ý lắm. Với những cải tiến gia tăng về các thuật toán và ý tưởng hiện có, chúng đọc giống như nội dung của một hội nghị hoặc tạp chí AI tầm trung.
Nhưng nghiên cứu này thực sự đáng chú ý. Bởi vì nó hoàn toàn là công trình của một " nhà khoa học AI " được phát triển tại phòng thí nghiệm UBC cùng với các nhà nghiên cứu từ Đại học Oxford và một công ty khởi nghiệp có tên Sakana AI .
Dự án này chứng minh một bước tiến ban đầu hướng đến điều có thể chứng minh là một mánh khóe mang tính cách mạng: để AI học bằng cách phát minh và khám phá những ý tưởng mới lạ. Chúng chỉ không phải là siêu mới lạ vào lúc này. Một số bài báo mô tả các tinh chỉnh để cải thiện kỹ thuật tạo hình ảnh được gọi là mô hình khuếch tán; một bài báo khác phác thảo một phương pháp để tăng tốc quá trình học trong mạng nơ-ron sâu.
“Đây không phải là những ý tưởng đột phá. Chúng không phải là những ý tưởng sáng tạo,” Jeff Clune , giáo sư đứng đầu phòng thí nghiệm UBC, thừa nhận. “Nhưng chúng có vẻ là những ý tưởng khá thú vị mà ai đó có thể thử.”
Mặc dù các chương trình AI ngày nay có thể tuyệt vời đến đâu, chúng vẫn bị giới hạn bởi nhu cầu sử dụng dữ liệu đào tạo do con người tạo ra. Nếu các chương trình AI có thể học theo cách mở, bằng cách thử nghiệm và khám phá những ý tưởng "thú vị", chúng có thể mở khóa các khả năng vượt xa mọi thứ mà con người đã chỉ cho chúng.
Phòng thí nghiệm của Clune trước đây đã phát triển các chương trình AI được thiết kế để học theo cách này. Ví dụ, một chương trình có tên là Omni đã cố gắng tạo ra hành vi của các nhân vật ảo trong một số môi trường giống như trò chơi điện tử, lưu trữ những nhân vật có vẻ thú vị và sau đó lặp lại chúng với các thiết kế mới. Các chương trình này trước đây yêu cầu các hướng dẫn được mã hóa thủ công để xác định mức độ thú vị. Tuy nhiên, các mô hình ngôn ngữ lớn cung cấp một cách để cho phép các chương trình này xác định điều gì hấp dẫn nhất. Một dự án gần đây khác từ phòng thí nghiệm của Clune đã sử dụng cách tiếp cận này để cho phép các chương trình AI mơ ước về mã cho phép các nhân vật ảo thực hiện đủ mọi thứ trong thế giới giống như Roblox.
Nhà khoa học AI là một ví dụ về phòng thí nghiệm của Clune về các khả năng. Chương trình đưa ra các thí nghiệm học máy, quyết định điều gì có vẻ hứa hẹn nhất với sự trợ giúp của LLM, sau đó viết và chạy mã cần thiết—rửa sạch và lặp lại. Mặc dù kết quả không mấy ấn tượng, Clune cho biết các chương trình học mở, cũng như với các mô hình ngôn ngữ, có thể trở nên có khả năng hơn nhiều khi sức mạnh máy tính cung cấp cho chúng được tăng lên.
“Cảm giác như đang khám phá một lục địa mới hoặc một hành tinh mới,” Clune nói về những khả năng mà LLM mở ra. “Chúng ta không biết mình sẽ khám phá ra điều gì, nhưng ở bất cứ nơi nào chúng ta đến, đều có điều gì đó mới mẻ.”
Tom Hope , một trợ lý giáo sư tại Đại học Hebrew ở Jerusalem và là nhà khoa học nghiên cứu tại Viện Allen về AI (AI2), cho biết nhà khoa học AI, giống như LLM, có vẻ rất Phái sinh và không thể được coi là đáng tin cậy. "Không có thành phần nào đáng tin cậy ngay bây giờ", ông nói.
Hope chỉ ra rằng những nỗ lực tự động hóa các yếu tố khám phá khoa học đã có từ nhiều thập kỷ trước, bắt đầu từ công trình của những người tiên phong về AI là Allen Newell và Herbert Simon vào những năm 1970, và sau đó là công trình của Pat
Langley tại Viện Nghiên cứu Học tập và Chuyên môn. Ông cũng lưu ý rằng một số nhóm nghiên cứu khác, bao gồm một nhóm tại AI2, gần đây đã khai thác LLM để giúp tạo ra các giả thuyết, viết bài báo và đánh giá nghiên cứu. "Họ đã nắm bắt được tinh thần thời đại", Hope nói về nhóm UBC. "Tất nhiên, hướng đi này có giá trị vô cùng to lớn, về mặt tiềm năng".
Liệu các hệ thống dựa trên LLM có bao giờ đưa ra được những ý tưởng thực sự mới lạ hoặc đột phá hay không vẫn còn chưa rõ ràng. Clune nói rằng "Đó là câu hỏi trị giá hàng nghìn tỷ đô la".
Ngay cả khi không có đột phá khoa học, việc học mở có thể đóng vai trò quan trọng trong việc phát triển các hệ thống AI có năng lực và hữu ích hơn ở hiện tại. Một báo cáo được Air Street Vốn, một công ty đầu tư, đăng tải trong tháng này, nêu bật tiềm năng của công trình của Clune trong việc phát triển các tác nhân AI mạnh mẽ và đáng tin cậy hơn, hoặc các chương trình tự động thực hiện các tác vụ hữu ích trên máy tính. Các công ty AI lớn dường như đều coi các tác nhân là thứ lớn tiếp theo .
Tuần này, phòng thí nghiệm của Clune đã tiết lộ dự án học tập mở mới nhất của mình: một chương trình AI phát minh và xây dựng các tác nhân AI . Các tác nhân do AI thiết kế vượt trội hơn các tác nhân do con người thiết kế trong một số nhiệm vụ, chẳng hạn như toán học và hiểu đọc. Bước tiếp theo sẽ là đưa ra các cách để ngăn chặn một hệ thống như vậy tạo ra các tác nhân có hành vi sai trái. Clune nói về công trình này rằng "Nó có khả năng nguy hiểm". "Chúng ta cần phải làm đúng, nhưng tôi nghĩ là có thể".



