Rachel, Jinse Finance
Ngày 27 tháng 11, CZ đã đăng bài trên X cho rằng các nhiệm vụ đánh dấu dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động toàn cầu có chi phí thấp và thông qua thanh toán token crypto ngay lập tức, vượt qua giới hạn địa lý.
Đánh dấu dữ liệu là quá trình gán nhãn thủ công hoặc tự động lên dữ liệu gốc (như văn bản, hình ảnh, âm thanh, v.v.) để nó có thông tin cấu trúc cụ thể. Dữ liệu được đánh dấu được sử dụng để huấn luyện các mô hình học máy hoặc trí tuệ nhân tạo, ví dụ như gán nhãn cảm xúc (tích cực, tiêu cực, trung lập) cho văn bản là một dạng đánh dấu dữ liệu. Sử dụng blockchain cho việc đánh dấu dữ liệu AI đặc biệt phù hợp với các kịch bản đánh dấu dữ liệu yêu cầu tính minh bạch, độ tin cậy và hợp tác phân tán cao. Điều này không chỉ có thể nâng cao hiệu quả và chất lượng của việc đánh dấu dữ liệu, mà còn tạo ra những khả năng mới cho hợp tác toàn cầu và giao dịch dữ liệu.
Hiện tại, những dự án chất lượng nào đang hoạt động trong lĩnh vực này? Triển vọng phát triển của lĩnh vực này như thế nào?
Vai trò của blockchain trong đánh dấu dữ liệu AI
Blockchain là một công nghệ sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, không thể thay đổi và có thể truy xuất nguồn gốc. Những đặc điểm này trong đánh dấu dữ liệu có thể giải quyết các vấn đề sau của các phương pháp truyền thống:
Tính xác thực và chống giả mạo của dữ liệu: Mỗi lần ghi nhãn đều được ghi vào blockchain, không thể thay đổi tùy ý, đảm bảo độ tin cậy của việc đánh dấu.
Tính minh bạch trong phân công nhiệm vụ: Blockchain có thể ghi lại quá trình phân phát, thực hiện và kiểm tra nhiệm vụ, ngăn ngừa việc phân công nhiệm vụ không công bằng hoặc thay đổi kết quả.
Cơ chế khích lệ: Sử dụng công nghệ hợp đồng thông minh của blockchain, người đánh dấu dữ liệu có thể tự động nhận được token crypto hoặc các phần thưởng khác khi hoàn thành nhiệm vụ.
Truy xuất nguồn gốc dữ liệu: Thông tin về nguồn gốc, người đánh dấu và người kiểm tra của mỗi nhãn dữ liệu đều có thể được truy vết.
Các ứng dụng
Đánh dấu phân tán: Sử dụng blockchain để phân phát các nhiệm vụ đánh dấu dữ liệu cho những người đánh dấu trên toàn cầu, nâng cao hiệu quả xử lý dữ liệu.
Kiểm tra chất lượng: So sánh và kiểm tra kết quả đánh dấu của nhiều người thông qua công nghệ blockchain để đảm bảo độ chính xác của việc đánh dấu.
Giao dịch dữ liệu đã đánh dấu: Dữ liệu đã được đánh dấu có thể được giao dịch trên blockchain, các bên mua bán không cần lo lắng về tính toàn vẹn hoặc tính xác thực của dữ liệu.
Bảo vệ quyền riêng tư: Sử dụng blockchain để mã hóa và lưu trữ dữ liệu đánh dấu, đảm bảo an toàn dữ liệu riêng tư.
Các dự án liên quan
OORT DataHub: Cung cấp dịch vụ đánh dấu dữ liệu phi tập trung dựa trên blockchain, sử dụng thuật toán Proof of Honesty để kiểm soát chất lượng. Nền tảng của họ sử dụng hợp đồng thông minh để phân phát nhiệm vụ, kiểm tra chất lượng dữ liệu và thanh toán thưởng, thu hút những người đánh dấu trên toàn cầu tham gia và đảm bảo tính minh bạch và bảo mật dữ liệu đánh dấu.
Mô hình kinh tế của token dự án như sau:
Thưởng cho cộng đồng: Người dùng có thể nhận được token $OORT khi tham gia đánh dấu dữ liệu và phân tích. Ngoài ra, họ cũng có thể nhận được các NFT độc đáo liên quan đến đóng góp, cung cấp các quyền lợi bổ sung như tăng Tỷ lệ phần trăm hàng năm (APY), giảm giá thiết bị và quyền biểu quyết trong Các tổ chức tự trị phi tập trung (DAO).
Đặt cọc nhiệm vụ: Người tham gia cần đặt cọc ít nhất 210 token $OORT để thể hiện cam kết với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ được hoàn trả token và nhận thưởng.
Chia sẻ doanh thu bán dữ liệu: Một số chủ sở hữu NFT cũng có thể nhận cổ tức từ doanh thu bán dữ liệu trong tương lai, tăng thêm lợi nhuận dài hạn.
PublicAI: Dự án sinh thái AI trên chuỗi Solana, nhằm kết nối các bên cần dữ liệu và những người đánh dấu toàn cầu, thông qua cơ chế khích lệ token crypto để thưởng cho những người tham gia, đồng thời sử dụng công nghệ blockchain ghi lại chi tiết quá trình đánh dấu để đảm bảo an toàn và bảo mật dữ liệu.
Mô hình kinh tế của token dự án như sau:
Thưởng cho cộng đồng: 10% token Public sẽ được sử dụng để thưởng cho những người tương tác sớm, cụ thể có ba cách để nhận được airdrop: trở thành AI Builder: thu thập nội dung chất lượng cao trên internet; trở thành AI Validator: xác minh nội dung đã thu thập; trở thành AI Developer: sử dụng tập dữ liệu đã được xác minh để huấn luyện các đại lý AI.
Phân bổ token: Dự án đã hoàn thành vòng gọi vốn gieo hạt trị giá 2 triệu USD vào tháng 1 năm 2024, với các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và một số giáo sư, nhà khoa học AI nổi tiếng, tuy nhiên chi tiết phân bổ token PublicAI vẫn chưa được xác định rõ ràng.
Những thách thức
Hiện tại, có một số yếu tố chính hạn chế sự phát triển của lĩnh vực này: thứ nhất, việc đánh dấu dữ liệu AI yêu cầu tài nguyên tính toán và lưu trữ khá lớn; thứ hai, hiệu suất của các dự án bị giới hạn bởi khả năng mở rộng của blockchain; thứ ba, các tiêu chuẩn kỹ thuật và quản lý vẫn chưa hoàn thiện.
Trong đó, yếu tố thứ hai có thể là thách thức lớn nhất hiện nay. Bởi vì việc đánh dấu dữ liệu AI và huấn luyện mô hình thường yêu cầu lượng lớn tài nguyên tính toán, trong khi khả năng tính toán của các nút trong mạng blockchain bị giới hạn. Làm thế nào để tích hợp và sử dụng hiệu quả các tài nguyên tính toán phân tán để đáp ứng nhu cầu tính toán của các dự án đánh dấu dữ liệu AI trong khi vẫn duy trì tính phi tập trung của blockchain là một vấn đề cần được giải quyết gấp. Được biết, Greenfield thuộc Binance đang cung cấp hỗ trợ lưu trữ cho lĩnh vực này, hy vọng sẽ có thêm nhiều tài nguyên lưu trữ và tính toán được triển khai trong lĩnh vực này.