Google công bố mô hình AI tự cải thiện đầu tiên Promptbreeder có thể tiến hóa nhanh hơn con người hàng tỷ lần

10-04

Bài viết này được dịch máy

Xem bản gốc

Các nhà phát triển DeepMind của Google đã giới thiệu “ Promptbreeder (PB): tự cải thiện thông qua quá trình tiến hóa nhanh chóng”. Sự phát triển tiên phong này hứa hẹn một phương pháp tiếp cận mới để nâng cao khả năng của các mô hình ngôn ngữ lớn (LLM) bằng cách khai thác sức mạnh của quá trình tiến hóa nhanh chóng.

Google công bố mô hình AI tự cải thiện đầu tiên Promptbreeder có thể tiến hóa nhanh hơn con người hàng tỷ lần

Có liên quan : Tiêm ChatGPT, hoặc Cách nhận được phản hồi tốt nhất có thể từ Bot

Cốt lõi của sự đổi mới này nằm ở nhận thức rằng trí thông minh của một mô hình ngôn ngữ lớn gắn chặt với chất lượng của các tín hiệu văn bản mà nó nhận được. Về bản chất, các tín hiệu càng thông minh thì phản hồi của mô hình càng thông minh và chính xác. Do đó, nhiệm vụ quan trọng hiện tại là tạo ra các chiến lược gợi ý tối ưu để hướng dẫn các mô hình này một cách hiệu quả.

Các chiến lược thúc đẩy thông thường, chẳng hạn như chuỗi suy nghĩ hoặc phương pháp lập kế hoạch và quyết định, chắc chắn đã cải thiện khả năng lập luận của LLM. Tuy nhiên, các chiến lược này, thường được thiết kế thủ công, có thể Short đạt được hiệu suất tối ưu.

Do đó, Promptbreeder liên tục được cải tiến. Đây là một chu trình tự cải tiến, tự tham chiếu với ngôn ngữ tự nhiên làm Substrate. Không cần tinh chỉnh mạng nơ-ron. Quá trình này tạo ra các gợi ý tùy chỉnh được tối ưu hóa cho các ứng dụng cụ thể.

Promptbreeder là một giải pháp sử dụng cơ chế tiến hóa để tinh chỉnh các chiến lược gợi ý theo từng lần lặp lại. Điểm khác biệt của PB là khả năng đáng chú ý của nó trong việc cải thiện không chỉ các gợi ý mà còn cả khả năng tăng cường gợi ý của chính nó với mỗi thế hệ mới.

Sau đây là cách hoạt động của chương trình tiến hóa Promptbreeder:

Dưới sự hướng dẫn của một LLM, Promptbreeder tạo ra một quần thể các đơn vị tiến hóa, mỗi đơn vị bao gồm hai “gợi ý giải pháp” và một “gợi ý đột biến”.
Sau đó, thuật toán di truyền nhị phân được sử dụng để đánh giá mức độ phù hợp của các đột biến này dựa trên bộ dữ liệu huấn luyện, xác định những đột biến có hiệu suất tốt hơn.
Quá trình tuần hoàn này liên tục quay trở lại bước 1, cuối cùng dẫn đến sự tiến hóa của nhiều thế hệ “gợi ý-giải pháp”.

Qua nhiều thế hệ, Promptbreeder sử dụng năm lớp toán tử đột biến khác nhau để đột biến cả “gợi ý giải pháp” và “gợi ý đột biến”. Điểm sáng giá của chương trình này nằm ở chỗ những “gợi ý-giải pháp” đột biến này dần trở nên thông minh hơn. “Gợi ý đột biến” đóng vai trò then chốt ở đây, cung cấp hướng dẫn về cách đột biến để tăng cường “gợi ý giải pháp”.

Về bản chất, Promptbreeder là một hệ thống tự cải thiện, tự tham chiếu hoạt động trong phạm vi ngôn ngữ tự nhiên. Quan trọng là nó không yêu cầu tinh chỉnh phức tạp của mạng nơ-ron. Thay vào đó, nó tạo ra các gợi ý tùy chỉnh được tối ưu hóa tỉ mỉ cho các ứng dụng cụ thể.

Các thí nghiệm ban đầu đã mang lại kết quả khả quan. Promptbreeder đã vượt trội hơn tất cả các phương pháp gợi ý đương đại khác trong các nhiệm vụ toán học, logic, thông thường và phân loại ngôn ngữ, bao gồm cả việc xác định lời nói thù địch.

Nhìn về phía trước, Promptbreeder đang trải qua quá trình thử nghiệm nghiêm ngặt về khả năng tồn tại của nó trong việc xây dựng toàn bộ quá trình suy nghĩ. Điều này bao gồm việc khám phá chiến lược N-hint, trong đó các gợi ý được áp dụng có điều kiện, mở đường cho việc phát triển các chương trình tiền chương trình cho các chính sách LLM tham gia vào các cuộc đối thoại Socratic đối đầu.

Promptbreeder vẫn có những hạn chế khi so sánh với bản chất mở rộng của các quá trình suy nghĩ của con người. Cấu trúc gợi ý vẫn cố định và Promptbreeder chủ yếu điều chỉnh nội dung gợi ý, không phải thuật toán gợi ý. Suy nghĩ của con người bao gồm nhiều khía cạnh vượt ra ngoài ngôn ngữ, bao gồm ngữ điệu, hình ảnh và hệ thống đa phương thức mà Promptbreeder vẫn chưa có.

Đọc thêm các chủ đề liên quan:

Bài đăng Google công bố mô hình AI tự cải thiện đầu tiên Promptbreeder có khả năng tiến hóa nhanh hơn con người hàng tỷ lần xuất hiện đầu tiên trên Metaverse Post .

Khu vực:

Play To Earn

Metaverse

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan