Tác giả: IOSG
TL;DR
TL;DR
Khi sự kết hợp giữa Web3 và AI trở thành một chủ đề nổi bật trong thế giới tiền điện tử, việc xây dựng cơ sở hạ tầng AI cho thế giới tiền điện tử đang phát triển mạnh mẽ. Tuy nhiên, việc thực sự sử dụng AI hoặc các ứng dụng được xây dựng dựa trên AI vẫn chưa nhiều, và vấn đề đồng nhất hóa cơ sở hạ tầng AI đang dần hiện ra. Gần đây, chúng tôi tham gia vào vòng gọi vốn đầu tiên của RedPill, điều này đã mang lại một số hiểu biết sâu sắc hơn.
Các công cụ chính để xây dựng các ứng dụng Dapp dựa trên AI bao gồm truy cập phi tập trung vào OpenAI, mạng GPU, mạng suy luận và mạng proxy.
Lý do tại sao mạng GPU lại nóng hơn cả "thời kỳ khai thác Bitcoin" là vì: thị trường AI lớn hơn và tăng trưởng nhanh và ổn định hơn; AI hỗ trợ hàng triệu ứng dụng mỗi ngày; AI cần đa dạng các mẫu GPU và vị trí máy chủ; công nghệ đã trưởng thành hơn; và khách hàng mục tiêu cũng rộng hơn.
Mạng suy luận và mạng proxy có cơ sở hạ tầng tương tự nhau, nhưng có những điểm khác biệt. Mạng suy luận chủ yếu cung cấp cho các nhà phát triển có kinh nghiệm để triển khai các mô hình của riêng họ, trong khi việc chạy các mô hình không phải LLM không nhất thiết cần GPU. Mạng proxy thì tập trung nhiều hơn vào LLM, nhà phát triển không cần mang theo mô hình của riêng họ, mà chú trọng hơn vào kỹ thuật nhắc nhở và cách kết nối các proxy khác nhau. Mạng proxy luôn cần GPU hiệu suất cao.
Các dự án cơ sở hạ tầng AI hứa hẹn rất lớn và vẫn liên tục ra mắt các tính năng mới.
Hầu hết các dự án tiền điện tử bản địa vẫn ở giai đoạn mạng thử nghiệm, ổn định kém, cấu hình phức tạp, chức năng hạn chế và cần thời gian để chứng minh tính an toàn và riêng tư của chúng.
Giả sử các ứng dụng Dapp dựa trên AI trở thành xu hướng chính, vẫn còn nhiều lĩnh vực chưa được khai thác, chẳng hạn như giám sát, cơ sở hạ tầng liên quan đến RAG, các mô hình bản địa Web3, proxy phi tập trung có tích hợp API gốc tiền điện tử và dữ liệu, và mạng đánh giá.
Xu hướng tích hợp dọc là rất rõ ràng. Các dự án cơ sở hạ tầng đang cố gắng cung cấp dịch vụ một cửa để đơn giản hóa công việc của các nhà phát triển ứng dụng Dapp dựa trên AI.
Tương lai sẽ là hỗn hợp. Một phần suy luận sẽ được thực hiện ở phía trước, trong khi một phần khác sẽ được tính toán trên chuỗi, để cân nhắc đến các yếu tố về chi phí và khả năng xác minh.
Nguồn: IOSG
Giới thiệu
Sự kết hợp giữa Web3 và AI là một trong những chủ đề nổi bật nhất trong lĩnh vực tiền điện tử hiện nay. Các nhà phát triển tài năng đang xây dựng cơ sở hạ tầng AI cho thế giới tiền điện tử, với mục tiêu mang trí tuệ nhân tạo vào các hợp đồng thông minh. Xây dựng các ứng dụng Dapp dựa trên AI là một nhiệm vụ rất phức tạp, bao gồm xử lý dữ liệu, mô hình, sức mạnh tính toán, vận hành, triển khai và tích hợp với blockchain.
Để đáp ứng các nhu cầu này, các nhà sáng lập Web3 đã phát triển một số giải pháp ban đầu, chẳng hạn như mạng GPU, dán nhãn dữ liệu cộng đồng, mô hình được đào tạo bởi cộng đồng, suy luận AI có thể xác minh và các cửa hàng proxy. Tuy nhiên, trong bối cảnh cơ sở hạ tầng phát triển mạnh mẽ này, việc thực sự sử dụng AI hoặc các ứng dụng được xây dựng dựa trên AI vẫn chưa nhiều.
Khi tìm kiếm hướng dẫn phát triển các ứng dụng Dapp dựa trên AI, các nhà phát triển nhận thấy không có nhiều tài liệu liên quan đến cơ sở hạ tầng AI gốc tiền điện tử, hầu hết chỉ đề cập đến việc gọi API OpenAI ở phía trước.
Nguồn: IOSG Ventures
Các ứng dụng hiện tại chưa khai thác được hết các tính năng phi tập trung và có thể xác minh của blockchain, nhưng tình hình này sẽ sớm thay đổi. Hiện nay, hầu hết các cơ sở hạ tầng trí tuệ nhân tạo tập trung vào lĩnh vực tiền điện tử đã khởi động các mạng thử nghiệm và dự kiến sẽ chính thức hoạt động trong vòng 6 tháng tới. Nghiên cứu này sẽ cung cấp chi tiết về các công cụ chính có sẵn trong cơ sở hạ tầng trí tuệ nhân tạo gốc tiền điện tử. Hãy chuẩn bị đón chào thời khắc GPT-3.5 của thế giới tiền điện tử!
1. RedPill: Cung cấp ủy quyền phi tập trung cho OpenAI
RedPill, một dự án mà chúng tôi đã đầu tư, là một điểm khởi đầu tốt. OpenAI sở hữu một số mô hình mạnh mẽ hàng đầu thế giới như GPT-4-vision, GPT-4-turbo và GPT-4o, là lựa chọn tối ưu để xây dựng các ứng dụng Dapp trí tuệ nhân tạo tiên tiến. Các nhà phát triển có thể tích hợp chúng vào các ứng dụng Dapp của họ thông qua các oracle hoặc giao diện phía trước.
RedPill tích hợp các API OpenAI của các nhà phát triển khác nhau vào một giao diện duy nhất, cung cấp dịch vụ trí tuệ nhân tạo nhanh chóng, tiết kiệm và có thể xác minh cho người dùng toàn cầu, qua đó dân chủ hóa việc tiếp cận các nguồn lực mô hình trí tuệ nhân tạo hàng đầu. Thuật toán định tuyến của RedPill sẽ định hướng các yêu cầu của nhà phát triển đến một nhà cung cấp duy nhất. Các yêu cầu API sẽ được thực hiện thông qua mạng phân phối của họ, giúp tránh bất kỳ hạn chế nào từ phía OpenAI, giải quyết một số vấn đề phổ biến mà các nhà phát triển tiền điện tử gặp phải, chẳng hạn như:
• Giới hạn TPM (token mỗi phút): Các tài khoản mới có quyền sử dụng token hạn chế, không đáp ứng được nhu cầu của các ứng dụng Dapp nóng và phụ thuộc vào AI.
• Hạn chế truy cập: Một số mô hình đặt ra các hạn chế về truy cập đối với các tài khoản mới hoặc một số quốc gia nhất định.
Bằng cách sử dụng cùng một mã yêu cầu nhưng thay đổi tên máy chủ, các nhà phát triển có thể truy cập các mô hình OpenAI với chi phí thấp, khả năng mở rộng cao và không giới hạn.
2. Mạng GPU
Ngoài việc sử dụng API của OpenAI, nhiều nhà phát triển cũng lựa chọn tự lưu ký các mô hình tại nhà. Họ có thể dựa vào các mạng GPU phi tập trung như io.net, Aethir, Akash và các mạng phổ biến khác để tự xây dựng các cụm GPU và triển khai, chạy các mô hình mạnh mẽ nội bộ hoặc nguồn mở.
Những mạng GPU phi tập trung này có thể tận dụng sức mạnh tính toán từ các cá nhân hoặc các trung tâm dữ liệu nhỏ, cung cấp cấu hình linh hoạt, nhiều lựa chọn vị trí máy chủ hơn và chi phí thấp hơn, giúp các nhà phát triển dễ dàng thực hiện các thử nghiệm liên quan đến AI trong ngân sách hạn chế của họ. Tuy nhiên, do tính chất phi tập trung, các mạng GPU này vẫn còn một số hạn chế về chức năng, khả năng sẵn sàng và quyền riêng tư dữ liệu.
Trong vài tháng qua, nhu cầu về GPU đã bùng nổ, vượt xa cơn sốt khai thác Bitcoin trước đây. Nguyên nhân bao gồm:
- Khách hàng mục tiêu đa dạng hơn, mạng GPU hiện phục vụ các nhà phát triển AI, số lượng họ lớn hơn nhiều và trung thành hơn, không bị ảnh hưởng bởi biến động giá tiền điện tử.
- Các mạng GPU phi tập trung cung cấp nhiều mẫu và quy cách hơn so với các thiết bị khai thác chuyên dụng, có thể đáp ứng tốt hơn các yêu cầu. Đặc biệt, các mô hình lớn cần VRAM cao hơn, trong khi các nhiệm vụ nhỏ hơn có thể sử dụng GPU phù hợp hơn. Đồng thời, các mạng GPU phi tập trung có thể phục vụ người dùng cuối gần hơn, giảm độ trễ.
- Công nghệ đã trưởng thành hơn, các mạng GPU dựa vào các blockchain tốc độ cao như Solana để thanh toán, công nghệ ảo hóa Docker và cụm tính toán Ray.
- Về khả năng sinh lời, thị trường AI đang mở rộng, có nhiều cơ hội phát triển ứng dụng và mô hình mới, mô hình H100 dự kiến có t