Bài viết gốc được xuất bản tại đây bởi Coindesk.
Vào cuối tháng 7, Mark Zuckerberg đã viết một lá thư giải thích lý do tại sao "nguồn mở là cần thiết cho tương lai AI tích cực", trong đó anh ấy nói về nhu cầu phát triển AI nguồn mở. Nhà sáng lập tuổi teen từng là mọt sách, giờ đã trở thành "Zuck" chơi lướt ván, đeo dây chuyền vàng và đấu võ jiu-jitsu, đã được coi là đấng cứu thế của phát triển mô hình nguồn mở.
Cảm ơn bạn đã đọc Reaching Escape Velocity! Đăng ký miễn phí để nhận bài đăng mới và ủng hộ công việc của tôi.
Nhưng cho đến nay, anh ấy và nhóm Meta vẫn chưa nói rõ về cách triển khai các mô hình này. Khi độ phức tạp của mô hình thúc đẩy các yêu cầu tính toán cao hơn, nếu việc triển khai mô hình được kiểm soát bởi một số ít tác nhân, thì chúng ta đã không khuất phục trước một hình thức tập trung hóa tương tự? AI phi tập trung hứa hẹn sẽ giải quyết được thách thức này, nhưng công nghệ này đòi hỏi những tiến bộ trong các kỹ thuật mã hóa hàng đầu trong ngành và các giải pháp lai độc đáo.
Không giống như các nhà cung cấp đám mây tập trung, AI phi tập trung (Dai) phân phối các quy trình tính toán để suy luận và đào tạo AI trên nhiều hệ thống, mạng và địa điểm. Nếu được triển khai đúng cách, các mạng này, một loại mạng cơ sở hạ tầng vật lý phi tập trung (DePIN), mang lại lợi ích về khả năng chống kiểm duyệt, khả năng truy cập tính toán và chi phí.
Dai phải đối mặt với những thách thức trong hai lĩnh vực chính: môi trường AI và bản thân cơ sở hạ tầng phi tập trung. So với các hệ thống tập trung, Dai yêu cầu các biện pháp bảo vệ bổ sung để ngăn chặn truy cập trái phép vào các chi tiết mô hình hoặc hành vi đánh cắp và sao chép thông tin độc quyền. Vì lý do này, có một cơ hội chưa được khám phá cho các nhóm tập trung vào các mô hình nguồn mở, nhưng nhận ra nhược điểm tiềm ẩn về hiệu suất của các mô hình nguồn mở so với các mô hình nguồn đóng.
Các hệ thống phi tập trung đặc biệt phải đối mặt với những trở ngại về tính toàn vẹn của mạng và chi phí tài nguyên. Ví dụ, việc phân phối dữ liệu của khách hàng trên các nút riêng biệt sẽ làm lộ ra nhiều vectơ tấn công hơn. Kẻ tấn công có thể khởi động một nút và phân tích các phép tính của nút đó, cố gắng chặn các lần truyền dữ liệu giữa các nút hoặc thậm chí đưa ra các sai lệch làm giảm hiệu suất của hệ thống. Ngay cả trong một mô hình suy luận phi tập trung an toàn, vẫn phải có các cơ chế để kiểm tra các quy trình tính toán. Các nút được khuyến khích tiết kiệm chi phí cho các tài nguyên bằng cách trình bày các phép tính chưa hoàn chỉnh và việc xác minh trở nên phức tạp do thiếu một tác nhân đáng tin cậy, tập trung.
Bằng chứng zero-knowledge
Bằng chứng zero-knowledge (ZKP), mặc dù hiện tại quá tốn kém về mặt tính toán, là một giải pháp tiềm năng cho một số thách thức của Dai . ZKP là một cơ chế mật mã cho phép một bên (bên chứng minh) thuyết phục bên kia (bên xác minh) về tính đúng đắn của một tuyên bố mà không tiết lộ bất kỳ chi tiết nào về chính tuyên bố đó, ngoại trừ tính hợp lệ của nó. Việc xác minh bằng chứng này diễn ra nhanh chóng đối với các nút khác và cung cấp một cách để mỗi nút chứng minh rằng nó đã hành động theo giao thức. Sự khác biệt về mặt kỹ thuật giữa các hệ thống chứng minh và cách triển khai của chúng (sẽ tìm hiểu sâu hơn về điều này sau) rất quan trọng đối với các nhà đầu tư trong lĩnh vực này.
Tính toán tập trung khiến việc đào tạo mô hình trở nên độc quyền đối với một số ít người chơi có vị thế và nguồn lực tốt. ZKP có thể là một phần của việc mở khóa tính toán nhàn rỗi trên phần cứng của người tiêu dùng; ví dụ, MacBook có thể sử dụng băng thông tính toán bổ sung của mình để giúp đào tạo mô hình ngôn ngữ lớn trong khi kiếm được mã thông báo cho người dùng.
Triển khai đào tạo hoặc suy luận phi tập trung với phần cứng của người tiêu dùng là trọng tâm của các nhóm như Gensyn và Inference Labs ; không giống như mạng tính toán phi tập trung như Akash hoặc Render , việc phân mảnh các phép tính làm tăng thêm độ phức tạp, cụ thể là vấn đề dấu phẩy động. Việc sử dụng các tài nguyên tính toán phân tán nhàn rỗi mở ra cánh cửa cho các nhà phát triển nhỏ hơn để thử nghiệm và đào tạo mạng của riêng họ — miễn là họ có quyền truy cập vào các công cụ giải quyết các thách thức liên quan.
Hiện tại, hệ thống ZKP có vẻ đắt hơn bốn đến sáu cấp độ so với chạy tính toán gốc và đối với các tác vụ đòi hỏi tính toán cao (như đào tạo mô hình) hoặc độ trễ thấp (như suy luận mô hình), việc sử dụng ZKP chậm đến mức không thể chấp nhận được. Để so sánh, việc giảm sáu cấp độ có nghĩa là một hệ thống tiên tiến (như Jolt của a16z ) chạy trên chip M3 Max có thể chứng minh một chương trình chậm hơn 150 lần so với chạy trên máy tính đồ họa TI-84.
Khả năng xử lý lượng dữ liệu lớn của AI khiến nó tương thích với các bằng chứng zero-knowledge (ZKP), nhưng cần có nhiều tiến bộ hơn trong mật mã trước khi ZKP có thể được sử dụng rộng rãi. Công việc đang được thực hiện bởi các nhóm như Irreducible (người đã thiết kế hệ thống bằng chứng Binius và chương trình cam kết), Gensyn , TensorOpera , Hellas và Inference Labs , cùng những nhóm khác, sẽ là một bước quan trọng để đạt được tầm nhìn này. Tuy nhiên, mốc thời gian vẫn còn quá lạc quan vì sự đổi mới thực sự cần có thời gian và tiến bộ toán học.
Trong khi đó, đáng chú ý là các khả năng khác và các giải pháp lai. HellasAI và những người khác đang phát triển các phương pháp mới để biểu diễn các mô hình và phép tính có thể cho phép một trò chơi thử thách lạc quan, chỉ cho phép một tập hợp con của phép tính cần được xử lý trong zero-knowledge. Các bằng chứng lạc quan chỉ có hiệu quả khi có Staking, khả năng chứng minh hành vi sai trái và mối đe dọa đáng tin cậy rằng phép tính đang được các nút khác trong hệ thống kiểm tra. Một phương pháp khác, do Inference Labs phát triển, xác thực một tập hợp con các truy vấn trong đó một nút cam kết tạo ZKP có liên kết, nhưng chỉ trình bày bằng chứng nếu lần đầu tiên bị khách hàng thách thức.
Tóm lại
Đào tạo và suy luận AI phi tập trung sẽ đóng vai trò là biện pháp bảo vệ chống lại sự hợp nhất quyền lực của một số tác nhân chính trong khi mở khóa khả năng tính toán trước đây không thể truy cập được. ZKP sẽ là một phần không thể thiếu để hiện thực hóa tầm nhìn này. Máy tính của bạn sẽ có thể kiếm được tiền thật mà không bị phát hiện bằng cách sử dụng thêm sức mạnh xử lý ở chế độ nền. Bằng chứng ngắn gọn cho thấy một phép tính đã được thực hiện chính xác sẽ khiến niềm tin mà các nhà cung cấp đám mây lớn nhất tận dụng trở nên không cần thiết, cho phép các mạng tính toán với các nhà cung cấp nhỏ hơn thu hút được khách hàng doanh nghiệp.
Trong khi bằng chứng zero-knowledge sẽ cho phép tương lai này và là một phần thiết yếu của nhiều thứ hơn là chỉ các mạng tính toán (như tầm nhìn của Ethereum về Tính chất cuối cùng của một khe cắm duy nhất), thì chi phí tính toán của chúng vẫn là một trở ngại. Các giải pháp lai kết hợp cơ chế lý thuyết trò chơi của các trò chơi lạc quan với việc sử dụng có chọn lọc các bằng chứng zero-knowledge là một giải pháp tốt hơn và có khả năng sẽ trở nên phổ biến như một điểm cầu nối cho đến khi ZKP trở nên nhanh hơn nhiều.
Đối với các nhà đầu tư tiền điện tử bản địa và không phải bản địa, việc hiểu được giá trị và thách thức của các hệ thống AI phi tập trung sẽ rất quan trọng để triển khai Vốn hiệu quả. Các nhóm nên có câu trả lời cho các câu hỏi liên quan đến bằng chứng tính toán nút và dự phòng mạng. Hơn nữa, như chúng tôi đã quan sát thấy trong nhiều dự án DePIN, phi tập trung diễn ra theo thời gian và kế hoạch rõ ràng của các nhóm hướng tới tầm nhìn đó là điều cần thiết. Giải quyết các thách thức liên quan đến tính toán DePIN là điều cần thiết để trao lại quyền kiểm soát cho các cá nhân và nhà phát triển nhỏ — một phần quan trọng để giữ cho hệ thống của chúng tôi luôn mở, miễn phí và chống kiểm duyệt.
Cảm ơn bạn đã đọc Reaching Escape Velocity! Đăng ký miễn phí để nhận bài đăng mới và ủng hộ công việc của tôi.