Trí tuệ nhân tạo (AI) và dữ liệu đang phát triển mạnh mẽ, và cơ sở hạ tầng nền tảng đang trở thành rào cản lớn nhất. Ai có thể phá vỡ bế tắc?

Bài viết này được dịch máy
Xem bản gốc

Tại sao dữ liệu trở thành nguồn tài nguyên có giá trị nhất, và ai có thể thực sự mở khóa nó sẽ định nghĩa thập kỷ tới

Lịch sử phát triển công nghệ luôn tồn tại những nút thắt như vậy: Tốc độ đổi mới vượt xa khả năng chịu tải của cơ sở hạ tầng. Chúng ta đã trải qua thời đại Web1 với kết nối quay số quá tải, chứng kiến các dịch vụ phát trực tuyến nhanh chóng thay thế truyền hình cáp truyền thống, và chứng kiến điện toán đám mây hoàn toàn đảo lộn cách thức triển khai và phát triển phần mềm.

Hôm nay, hiện tượng cơ sở hạ tầng chậm trễ này lại xảy ra. Và lần này, nhân vật chính làdữ liệu.

Dữ liệu: Tài sản trị giá nghìn tỷ nhưng vẫn đang ngủ yên

Từ AI đến IP, cho đến các ứng dụng Web3, dữ liệu đang dần trở thành nguồn tài nguyên cốt lõi thúc đẩy nền kinh tế toàn cầu. Nó là một loại tài sản, một phương tiện sản xuất, và một hình thức tổ chức kinh tế mới. Morgan Stanley dự đoán, đến năm 2032, thị trường dữ liệu đào tạo AI chất lượng cao sẽ vượt quá 17 tỷ đô la; và quy mô thị trường dữ liệu tổng thể đã vượt quá 3 nghìn tỷ đô la.

Nhưng điều讽刺的là, nguồn tài nguyên có giá trị khổng lồ này, ngày nay vẫn chủ yếu ở trạng thái ngủ yên:

  • Bị mắc kẹt trong các nền tảng đóng, không thể được phát hiện và sử dụng;

  • Được phân tán trong các hệ thống có cấu trúc khác nhau, không thể kết hợp hoặc tái sử dụng;

  • Không có cơ chế thị trường hiệu quả để cấp phép, định giá và lưu thông.

Điều này giống như nguồn dầu mỏ vào đầu thế kỷ 20, rõ ràng là vàng ròng khắp nơi, nhưng không có nhà máy lọc dầu, trạm xăng và mạng lưới hậu cần để biến nó thành giá trị kinh tế có thể lưu thông.

Nút thắt của AI, không phải ở thuật toán, mà ở dữ liệu

Ngày nay, các mô hình AI ngày càng có nhu cầu về dữ liệu có cấu trúc chất lượng cao. Nhưng các nguồn dữ liệu có giá trị nhất lại nằm trong tay một số ít các ông lớn công nghệ. Khoảng 95% dữ liệu đào tạo trên toàn cầu được kiểm soát bởi năm công ty, và dữ liệu mở thường là kết quả của việc thu thập từ trang web, có nhiều nhiễu, trùng lặp, và rủi ro pháp lý ngày càng cao.

Điều này không chỉ làm hạn chế hiệu quả của các mô hình AI, mà còn khiến toàn ngành rơi vào tình trạng "đồng kém đẩy đồng tốt":

  • Các mô hình mã nguồn mở buộc phải dựa vào dữ liệu đào tạo chất lượng thấp; vấn đề của dữ liệu chất lượng thấp là tính chính xác của dữ liệu khó xác minh, và trong hầu hết các trường hợp đều có sự chệch hướng. Việc mở rộng AI bằng bộ dữ liệu chất lượng thấp gần như là không thể.

  • Các nhà sản xuất dữ liệu không được khích lệ, sự khan hiếm dữ liệu càng trở nên trầm trọng hơn;

  • Tranh chấp pháp lý thường xuyên xảy ra, các công ty AI phải đối mặt với rủi ro bản quyền không rõ ràng. Lý do các vụ kiện này xảy ra là vì một số AI lớn sử dụng dữ liệu đào tạo mà không được phép. Hầu hết mọi người thậm chí không biết dữ liệu của mình đang được sử dụng để đào tạo AI. Trong đó chứa đựng giá trị khổng lồ, nhưng lại bị các công ty công nghệ lớn trích xuất và độc quyền.

Giải pháp lưu trữ trên chuỗi: Quá nhiều "miếng vá", quá ít "hệ thống"

Để giải quyết những vấn đề này, đã có nhiều giải pháp cố gắng bù đắp các khiếm khuyết của cơ sở hạ tầng dữ liệu. Nhưng hầu hết vẫn là các giải pháp tạm thời, thiếu tính hệ thống, tích hợp và bền vững. Ví dụ:

  • Ethereum Blob Space (EIP-4844): Chỉ cung cấp lưu trữ tạm thời 18 ngày, có thể hết hoàn toàn vào năm 2025;

  • Celestia: Đã thực hiện "lớp khả dụng dữ liệu", nhưng không hỗ trợ kết hợp và lưu trữ dữ liệu có cấu trúc lâu dài;

  • Filecoin: Truy xuất dữ liệu chậm, không vĩnh viễn, các hợp đồng thông minh không thể trực tiếp gọi dữ liệu được lưu trữ;

  • Arweave: Giá lưu trữ biến động cao, hiệu suất và tính xác minh yếu, lớp tính toán AO phụ thuộc vào cầu nối tập trung;

  • Các dự án IP như Story Protocol: Tập trung vào việc đưa tài sản IP lên chuỗi và quản lý, nhưng thiếu tích hợp sâu với mạng dữ liệu, không hỗ trợ xây dựng các ứng dụng khác;

  • Walrus: Triển khai trên các blockchain khác, chi phí cao, chức năng bị hạn chế, lưu trữ không vĩnh viễn, khả năng thích ứng yếu.

Chúng đã giải quyết một số khâu, nhưng không thể cung cấp một cơ sở hạ tầng dữ liệucó cấu trúc, có thể ghép nối gốc, có thể thực thi.

(Bản dịch tiếp tục như vậy cho toàn bộ văn bản)

  • Celestia huy động 1 tỷ đô la Mỹ: Khả năng sẵn có dữ liệu trở thành nút thắt lớn nhất của rollups;

  • Story Protocol huy động 1,4 tỷ đô la Mỹ: Đưa IP lên chuỗi là điều cấp bách;

  • Chi phí lưu trữ Ethereum vẫn cao đến $900.000/GB: Không bền vững;

  • Nhu cầu tập huấn AI tăng vọt, mất cân bằng cung cầu tiếp tục mở rộng;

  • Các vụ vi phạm bản quyền nội dung AI tăng hơn 200% so với năm trước: Thiếu cơ chế bảo vệ quyền lợi của người sáng tạo.

Điều này có nghĩa là một khoảng trống công nghệ khổng lồ đang mở ra - một không gian cơ sở hạ tầng dữ liệu trị giá nghìn tỷ, đang chờ đợi người giải quyết thực sự.

AWS của Web3, xây dựng bánh xe dữ liệu trên chuỗi

Nhìn lại sự thành công của AWS, điều then chốt không phải là công nghệ vượt trội ở một điểm đơn lẻ, mà làthống nhất tỷ lệ băm, cơ sở dữ liệu và ứng dụng, tạo ra một bánh xe tích cực.

Irys đang sao chép logic này lên chuỗi:

  • Dữ liệu do người dùng tải lên → Giao thức cơ sở dữ liệu lập chỉ mục → Giao thức ủy quyền biến tiền → Ứng dụng gọi → Phản hồi đến sản xuất dữ liệu nhiều hơn → Tăng giá trị mạng → Thu hút nhiều nhà phát triển xây dựng

  • Mỗi giao thức mới tăng cường tác dụng của giao thức trước đó, mỗi lần gọi dữ liệu đều nâng cao giá trị của toàn bộ mạng.

Đây không chỉ là công cụ "lưu trữ dữ liệu" trên chuỗi, mà là một hệ điều hành dữ liệu có thể mở rộng, có thể kết hợp.

Dữ liệu là tài sản quan trọng nhất trong tương lai, cơ sở hạ tầng sẽ quyết định ai sở hữu nó

Chúng ta đang đứng trước đêm tái cấu trúc cơ sở hạ tầng dữ liệu. Một mặt, dữ liệu đang nhanh chóng trở thành tài sản then chốt thúc đẩy AI, nền kinh tế nội dung, hệ sinh thái hợp đồng thông minh; mặt khác, hệ thống cũ không thể hỗ trợ sự thay đổi này.

Irys xây dựng không chỉ là hệ thống lưu trữ dữ liệu nhanh hơn hoặc rẻ hơn, mà là một mạng lưới cơ sở hạ tầng thực sựhướng tới tương lai:

  • Hỗ trợ gốc lưu trữ và gọi dữ liệu;

  • Ủy quyền và phân phối lợi nhuận tự động;

  • Hỗ trợ nhiều nhu cầu dữ liệu như AI, IP, ứng dụng Web3;

  • Có thể được các nhà phát triển, nhà sáng tạo, doanh nghiệp dễ dàng truy cập và tái sử dụng.

Nếu như AWS trong thời đại điện toán đám mây đã nắm bắt được cơ hội lịch sử "tính toán như một dịch vụ", thìIrys đang đứng ở điểm bắt đầu của sự chuyển đổi lớn lao "dữ liệu như một dịch vụ".Cánh cổng của nền kinh tế dữ liệu đã mở ra, câu hỏi thực sự là - ai sẽ xây dựng mạng lưới hỗ trợ tất cả những điều này. Câu trả lời đang dần hiện rõ.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận