Tác giả: Raghav Agarwal, Roy Lu, LongHash Ventures
Biên soạn bởi: Elvin, ChainCatcher
trí tuệ nhân tạo
Nhân loại đang ở trong thời điểm AI Oppenheimer.
Elon Musk lưu ý: “Khi công nghệ của chúng ta tiến bộ, điều quan trọng là phải đảm bảo rằng AI phục vụ lợi ích của con người chứ không chỉ lợi ích của những kẻ có quyền lực.
Ở điểm giao thoa với crypto, AI có thể tự dân chủ hóa. Bắt đầu với mô hình mã nguồn mở, sau đó là AI cho con người, do con người, vì con người. Mặc dù mục tiêu của Web3 x AI là cao cả nhưng việc áp dụng nó trên thực tế phụ thuộc vào khả năng sử dụng và khả năng tương thích với các phần mềm AI hiện có. Đây là lúc phương pháp độc đáo và công nghệ của IO.NET phát huy tác dụng.
Khung Ray phi tập trung của IO.NET là một con ngựa thành Troy để khởi động thị trường điện toán AI không cần cấp phép vào web3 và hơn thế nữa.
IO.NET đang địa vị trong việc mang lại sự phong phú cho GPU. Không giống như các công cụ tổng hợp điện toán có mục đích chung khác, IO.NET kết nối điện toán phi tập trung với nhóm AI hàng đầu trong ngành bằng cách viết lại khung Ray. Phương pháp này mở đường cho việc áp dụng rộng rãi hơn trong web3 và hơn thế nữa.
Cuộc đua sức mạnh tính toán trong bối cảnh dân tộc AI
Trên khắp hệ thống AI, sự cạnh tranh về tài nguyên ngày càng gay gắt. Vài năm qua đã chứng kiến lượng lớn gia tăng nhanh chóng của các mô hình trí tuệ nhân tạo. Trong vòng vài giờ sau khi phát hành Llama 3, Mistral và OpenAI đã phát hành phiên bản mới của mô hình trí tuệ nhân tạo tiên tiến của họ.
Ba cấp độ trong nhóm AI đang cạnh tranh giành tài nguyên là: 1) dữ liệu đào tạo, 2) thuật toán nâng cao và 3) đơn vị tính toán. Tỷ lệ băm cho phép các mô hình AI cải thiện hiệu suất bằng cách mở rộng dữ liệu đào tạo và kích thước mô hình. Theo nghiên cứu thực nghiệm của OpenAI về các mô hình ngôn ngữ dựa trên máy biến áp, hiệu suất được cải thiện ổn định khi chúng tôi tăng lượng tính toán được sử dụng cho việc đào tạo.
Việc sử dụng máy tính đã bùng nổ trong 20 năm qua. Phân tích của Epoch.ai về 140 mô hình cho thấy tính toán đào tạo của hệ thống mốc đã tăng 4,2 lần mỗi năm kể từ năm 2010. Mô hình OpenAI mới nhất, GPT-4, yêu cầu tính toán gấp 66 lần GPT-3 và khoảng 1,2 triệu lần so với GPT.
Dân tộc AI là hiển nhiên
Các khoản đầu tư lớn từ Hoa Kỳ, Trung Quốc và các nước khác, tổng trị giá khoảng 40 tỷ USD. Phần lớn nguồn tài trợ sẽ tập trung vào việc sản xuất các nhà máy sản xuất GPU và chip trí tuệ nhân tạo. Giám đốc điều hành OpenAI Sam Altman có kế hoạch huy động vốn lên tới 7 nghìn tỷ USD để tăng cường sản xuất chip trí tuệ nhân tạo toàn cầu, nhấn mạnh rằng “điện toán sẽ trở thành tiền tệ của tương lai”.
Tổng hợp các tài nguyên điện toán dài hạn có thể phá vỡ thị trường một cách đáng kể. Những thách thức mà các nhà cung cấp dịch vụ đám mây tập trung như AWS, Azure và GCP phải đối mặt bao gồm thời gian chờ đợi lâu, tính linh hoạt của GPU hạn chế và các hợp đồng dài hạn rườm rà, đặc biệt là đối với các thực thể nhỏ hơn và các công ty khởi nghiệp.
Phần cứng không được sử dụng đúng mức trong các trung tâm dữ liệu , thợ đào crypto và GPU cấp độ người tiêu dùng có thể đáp ứng nhu cầu. Một nghiên cứu DeepMind năm 2022 cho thấy việc đào tạo các mô hình nhỏ hơn với nhiều dữ liệu hơn thường hiệu quả hơn so với việc sử dụng GPU mới nhất và mạnh nhất, báo hiệu sự thay đổi theo hướng sử dụng GPU có thể truy cập để đào tạo AI hiệu quả hơn.
IO.NET Sự lật đổ cấu trúc thị trường điện toán trí tuệ nhân tạo
IO.NET đã Sự lật đổ cấu trúc thị trường điện toán trí tuệ nhân tạo toàn cầu. Nền tảng đầu cuối của IO.NET dành cho đào tạo, suy luận và tinh chỉnh AI được phân phối trên toàn cầu tổng hợp các GPU đuôi dài để mở khóa hoạt động đào tạo hiệu suất cao, giá cả phải chăng.
Thị trường GPU:
IO.NET tổng hợp GPU từ các trung tâm dữ liệu, thợ đào và người tiêu dùng trên toàn thế giới. Các công ty khởi nghiệp AI có thể triển khai các cụm GPU phi tập trung trong vài phút bằng cách chỉ định vị trí cụm, loại phần cứng, ngăn xếp máy học (Tensorflow, PyTorch, Kubernetes) và thanh toán ngay lập tức trên Solana.
Cụm:
GPU không có cơ sở hạ tầng song song được điều chỉnh giống như một lò phản ứng không có dây nguồn tồn tại nhưng không thể sử dụng được. Như blog OpenAI nhấn mạnh, những hạn chế về tính song song của phần cứng và thuật toán ảnh hưởng đáng kể đến hiệu quả tính toán của từng mô hình, hạn chế kích thước mô hình và tính hữu dụng trong quá trình đào tạo.
IO.NET tận dụng khung Ray để biến hàng nghìn cụm GPU thành một tổng thể thống nhất. Sự đổi mới này cho phép IO.NET hình thành các cụm GPU bất kể sự phân tán về mặt địa lý, từ đó giải quyết được một vấn đề lớn trên thị trường máy tính.
Ray framework nổi bật
Là một khung điện toán hợp nhất mã nguồn mở, Ray đơn giản hóa mở rộng quy mô trí tuệ nhân tạo và khối lượng công việc Python. Ray được các công ty hàng đầu trong ngành như Uber, Spotify, LinkedIn và Netflix sử dụng để thúc đẩy tích hợp trí tuệ nhân tạo vào các sản phẩm và dịch vụ của họ. Microsoft mang đến cho khách hàng cơ hội triển khai Ray trên Azure, trong khi Google Kubernetes Engine (GKE) đơn giản hóa việc triển khai phần mềm máy học mã nguồn mở bằng cách hỗ trợ Kubeflow và Ray.
Ahmad trình bày công trình của mình về khung Ray phi tập trung tại Ray Summit 2023
Phi tập trung Ray - Mở rộng Ray cho suy luận toàn cầu (Link video: https://youtu.be/ie-EAlGfTHA?)
Chúng tôi gặp Tory lần đầu tiên khi anh ấy còn là COO của một công ty khởi nghiệp công nghệ tài chính đang tăng trưởng cao và chúng tôi biết anh ấy là nhà điều hành cấp cao với hàng chục năm kinh nghiệm mở rộng quy mô các công ty khởi nghiệp đến mức hiệu quả. Sau khi nói chuyện với Ahmad và Tory, chúng tôi biết ngay rằng đây chính là đội ngũ trong mơ sẽ phi tập trung lên web3 và hơn thế nữa.
Sản phẩm trí tuệ của Ahmad, IO.NET, ra đời từ một khoảnh khắc tuyệt vời trong quá trình sử dụng thực tế. Việc phát triển Dark Tick, một thuật toán giao dịch tần số cao có độ trễ cực thấp, đòi hỏi tài nguyên GPU lượng lớn. Để giải quyết vấn đề chi phí, Ahmad đã phát triển một phiên bản phi tập trung của khung Ray tập hợp các GPU từ thợ đào crypto , vô tình tạo ra một cơ sở hạ tầng linh hoạt giúp giải quyết các thách thức điện toán AI rộng hơn.
Động lực phát triển:
Bằng cách tận dụng khích lệ token , IO.NET có hơn 100.000 GPU và 20.000 GPU sẵn sàng cho cụm ra mắt tính đến giữa năm 2024, bao gồm lượng lớn NVIDIA H100 và A100. Krea.ai đã tận dụng dịch vụ đám mây phi tập trung của io.net, IO Cloud, để thúc đẩy suy luận mô hình AI của họ. IO.NET gần đây đã công bố hợp tác với NavyAI, Synesis One, RapidNode, Ultiverse, Aethir, Flock.io, LeonardoAI, Synthetic AI và nhiều dự án khác.
Bằng cách dựa vào mạng GPU được phân phối toàn cầu, IO.NET có thể:
- Giảm thời gian suy luận của khách hàng bằng cách cho phép suy luận gần hơn với người dùng cuối của họ so với các nhà cung cấp dịch vụ đám mây tập trung
- Tăng khả năng phục hồi bằng cách kết nối nhiều trung tâm dữ liệu với đường trục mạng tích hợp cao và tổ chức tài nguyên thành các vùng
- Giảm chi phí và thời gian truy cập tài nguyên máy tính
- Cho phép các công ty tự động mở rộng xuống quy mô của các nguồn lực có đòn bẩy
- Cho phép các nhà cung cấp GPU nhận được lợi nhuận tốt hơn từ khoản đầu tư phần cứng của họ
IO.NET luôn đi đầu trong đổi mới thông qua khung Ray phi tập trung . Tận dụng Ray Core và Ray Serve, cụm GPU phân tán của họ điều phối hiệu quả nhiệm vụ trên GPU phi tập trung .
Tóm lại là
Việc thúc đẩy các mô hình AI mã nguồn mở là sự thể hiện tinh thần hợp tác của Internet nguyên bản, nơi mọi người có thể truy cập HTTP và SMTP mà không cần được phép.
Sự xuất hiện của các mạng GPU có nguồn lực từ cộng đồng là một sự phát triển tự nhiên của đặc tính không được phép. Bằng cách cung cấp nguồn lực cộng đồng cho các GPU đuôi dài, IO.NET đang mở ra cánh cửa cho các tài nguyên điện toán có giá trị, tạo ra một thị trường công bằng và minh bạch, đồng thời ngăn chặn sự tập trung quyền lực vào tay một số ít.
Chúng tôi tin rằng IO.NET hiện thực hóa viễn cảnh mong đợi về điện toán trí tuệ nhân tạo như một loại tiền tệ thông qua công nghệ cụm Ray phi tập trung . Trong một thế giới ngày càng có nhiều thứ “có” và “không có”, IO.NET cuối cùng sẽ “làm cho Internet mở trở lại”.