Tác giả: Haotian
Khẩu hiệu "Để người dùng có chủ quyền với dữ liệu của mình" vốn mang tham vọng lớn của cả kỷ nguyên web3, tuy nhiên do thách thức về chi phí lưu trữ dữ liệu trên chuỗi và tính công khai của dữ liệu riêng tư nên chưa được áp dụng thực tế. Gần đây, do nhu cầu lớn về nguồn dữ liệu cho việc huấn luyện các mô hình AGI lớn, @withvana sắp ra mắt trên Binance đã đề xuất một giải pháp sở hữu dữ liệu dựa trên DLP (Bể thanh khoản dữ liệu) và TEE (Môi trường thực thi tin cậy), với những điểm nổi bật như thế nào?
1) Chủ quyền dữ liệu và chia sẻ lợi nhuận từ dữ liệu cá nhân là vấn đề cũ. Trong kỷ nguyên web2, dữ liệu cá nhân bùng nổ nhưng lại dẫn đến độc quyền của nền tảng và vi phạm quyền riêng tư; trong giai đoạn đầu của web3, nhiều dự án đã thử quản lý bằng hợp đồng thông minh + lưu trữ phi tập trung + xác nhận quyền sở hữu trên chuỗi để thực hiện tham vọng này, nhưng lại phát hiện chi phí lưu trữ trên chuỗi cao và tính minh bạch của dữ liệu trên chuỗi làm gia tăng thách thức về bảo vệ quyền riêng tư.
Chính vì vậy, việc sử dụng blockchain để thực hiện "quyền sở hữu dữ liệu" vẫn bị gác lại do những rào cản kỹ thuật.
2) Sau khi kỷ nguyên AI đến, các ứng dụng đa dạng như huấn luyện mô hình AGI lớn, huấn luyện đa phương tiện, suy luận dữ liệu, tinh chỉnh micro v.v., đặc biệt là học máy và huấn luyện mô hình chuyên sâu trong các lĩnh vực cụ thể, đều cần lượng lớn dữ liệu chất lượng cao chưa được công khai, khiến dữ liệu riêng tư do cá nhân và tổ chức nắm giữ trở thành nguồn tài nguyên then chốt cho sự phát triển của AI, do đó việc dữ liệu phục vụ cho việc học tập của AI trở thành một "nhu cầu" quy mô lớn.
Đây chính là tiền đề để Vana giải quyết chủ quyền dữ liệu cho người dùng trong kỷ nguyên AI, bởi vì phần lớn người dùng trong môi trường web2 có ý thức về quyền sở hữu dữ liệu và quyền riêng tư còn thấp, trong khi kỷ nguyên AI lại coi "dữ liệu" như tài sản dầu mỏ.
3) Giải pháp sắp ra mắt mainnet của Vana chủ yếu nhắm vào hai vấn đề lớn: "Dữ liệu kép" và "Bảo vệ quyền riêng tư". Cụ thể, khi một dữ liệu được công khai trên chuỗi và có thể sao chép tùy ý, nó sẽ mất tính hiếm hoi và khả năng tạo giá trị.
Vana xây dựng thị trường dữ liệu thông qua Bể thanh khoản Dữ liệu (DLP), sử dụng cơ chế chứng minh đóng góp đặc biệt (Proof of Contribution) để duy trì hoạt động của hệ thống.
Chủ sở hữu dữ liệu có thể thế chấp quyền sử dụng dữ liệu vào các bể dữ liệu chuyên ngành như bể hồ sơ y tế, bể giao dịch tài chính, v.v. Sau khi thế chấp, họ sẽ nhận được DataDAO & token dữ liệu làm chứng chỉ quyền lợi. Khi các ứng dụng AI cần sử dụng dữ liệu từ các bể này, phí sẽ được phân phối tự động cho các chủ sở hữu token tương ứng, và họ cũng có thể tham gia quản trị DataDAO, như quyết định các quy tắc vận hành DLP, chiến lược định giá, v.v.
Bể thanh khoản dữ liệu này tương tự như các bể thanh khoản DeFi thông thường, được quản lý bởi hợp đồng thông minh để xác minh tính hợp lệ của dữ liệu, kiểm soát quyền truy cập vào Bể, phân phối token, v.v. Đây chính là cách giải quyết hiệu quả vấn đề "dữ liệu kép", bằng cách tokenize quyền sở hữu dữ liệu và ghi lại toàn bộ quy trình bằng hợp đồng thông minh để đảm bảo tính truy xuất và tự động phân phối lợi nhuận.
Vana sử dụng môi trường TEE an toàn để giải quyết vấn đề bảo vệ quyền riêng tư, với đặc tính "có thể sử dụng nhưng không thể nhìn thấy" của TEE, có thể thực hiện bảo vệ quyền riêng tư "từ đầu đến cuối" trong quá trình lưu trữ dữ liệu trên máy chủ cá nhân, truy cập dữ liệu từ DLP và sử dụng dữ liệu để huấn luyện.
Ví dụ, khi người dùng ủy quyền một phần dữ liệu cho DLP, dữ liệu đó sẽ được lưu trữ trong môi trường riêng tư của TEE, và khách hàng được cấp quyền sử dụng để huấn luyện mà không thể sao chép hay lưu trữ dữ liệu đó. Toàn bộ quá trình này do TEE ghi lại và cách ly, đảm bảo dữ liệu vẫn được bảo mật khi được sử dụng.
Ngoài hai tính năng trên, Vana cũng cho phép chủ sở hữu dữ liệu hoàn toàn kiểm soát dữ liệu của mình, có thể thu hồi hoặc thay đổi quyền sử dụng bất kỳ lúc nào.
Hơn nữa, Vana áp dụng kiến trúc phân tầng rõ ràng: Tầng dưới cùng hỗ trợ người dùng lưu trữ dữ liệu linh hoạt thông qua tự quản lý nhẹ hoặc ủy thác; Tầng giữa sử dụng DLP làm lớp giao thức, quản lý chi tiết các chức năng cốt lõi như lưu chuyển dữ liệu, kiểm soát quyền, phân phối lợi nhuận, v.v. thông qua hợp đồng thông minh; Tầng trên cùng kết nối với các kịch bản ứng dụng AI khác nhau, cung cấp các giao diện tiêu chuẩn cho nhu cầu huấn luyện mô hình lớn, phân tích dữ liệu, v.v.
Thiết kế phân tầng này vừa đảm bảo chủ quyền dữ liệu, vừa thực hiện tính mở rộng ứng dụng.
Trên đây là những thông tin chính.
Cuối cùng, tôi xin bổ sung một quan điểm rằng, giải pháp của Vana về quyền sở hữu dữ liệu cho kỷ nguyên AI là một "câu chuyện cũ" về xác nhận quyền sở hữu dữ liệu, là một phần quan trọng trong xu hướng lớn của Narrative AI.
Hệ thống bảo vệ của Vana nằm ở chỗ, một khi chuỗi thu thập, sử dụng, phân phối lợi ních dữ liệu được kết nối, nó có thể mở rộng sang nhiều kịch bản và lĩnh vực rộng hơn. Đừng quên, tham vọng lớn về quyền sở hữu dữ liệu có thể贯穿整个区块链和 web3.