Báo cáo nghiên cứu dài 10.000 từ về mạng dữ liệu AI phi tập trung Sahara AI: Người gác cổng của mỏ vàng dữ liệu trong kỷ nguyên Web3? Phân tích toàn cảnh về bối cảnh phát triển, nguyên tắc kỹ thuật, tình trạng sinh thái, ưu và nhược điểm, rủi ro và triển vọng tương lai

Bài viết này được dịch máy
Xem bản gốc

Khi các ông lớn AI sinh sản ở Thung lũng Silicon tôn thờ Luật Mở rộng và điên cuồng đốt chi phí tỷ lệ băm, mọi người nhanh chóng nhận ra rằng tài sản chiến lược duy nhất trong trò chơi này đã hình thành: dữ liệu đào tạo chất lượng cao trở thành "dầu kỹ thuật số" mà mọi nhà sản xuất mô hình đều khao khát. Và các nhà cung cấp "dầu mới" này, thiên tài gốc Hoa Alexandr Wang và công ty ghi nhãn dữ liệu do anh sáng lập Scale AI cũng đã trở nên rực rỡ. Anh không chỉ trở thành nhà cung cấp dịch vụ dữ liệu được các công ty như Microsoft, Meta, OpenAI đầu tư mạnh tay vào đào tạo mô hình, mà còn trở thành khách mời danh dự của Bộ Quốc phòng Hoa Kỳ. Kỳ vọng về sự thiếu hụt dữ liệu chất lượng cao đã khiến các công ty như Scale AI, những công ty kiếm tiền bằng cách xử lý dữ liệu, trở thành những công ty được công nhận. Sau khi hoàn thành vòng gọi vốn F trị giá 1 tỷ đô la vào năm 2024, giá trị của công ty đã tăng gấp đôi so với vòng trước, lên đến 13,8 tỷ đô la. Vị CEO trẻ sinh năm 1997 này đã dẫn dắt Scale AI vượt qua ngưỡng 1 tỷ đô la doanh thu hàng năm vào năm 2024, tăng gấp 4 lần so với trước năm 2023, nhờ làn sóng học máy và AI sinh sản. Không chỉ Scale AI, các nhà cung cấp như Encord, Label Box, Snorkel AI cũng nhanh chóng phát triển thành những người chơi quan trọng trong thị trường mới nổi này.

Nhưng bữa tiệc này sẽ không kéo dài mãi. Theo nhận định của các nhà nghiên cứu, dữ liệu văn bản công khai trên mạng sẽ sớm bị sử dụng hết, các ông lớn AI cấp bách cần các chuyên gia từ các lĩnh vực khác nhau đóng góp dữ liệu được ghi nhãn và kiến thức chuyên sâu để xây dựng AI tốt hơn. Những dữ liệu do các chuyên gia lưu trữ trong miền riêng không thể bị các ông lớn thu thập một cách tùy ý từ internet, điều này có nghĩa là họ có cơ hội kiếm được nhiều lợi ích hơn từ việc kiểm soát những dữ liệu này, thay vì để dữ liệu trôi nổi. Đây có thể là cơ hội tốt để Web3 can thiệp.

Tác giả:Hendrix, Nhà nghiên cứu Web3Caff Research

Ảnh bìa: Logo và ảnh nền bởi Sahara, Kiểu chữ bởi Web3Caff Research

Số lượng từ: Toàn bộ văn bản có trên 10.400 từ

Mục lục

  • Sahara AI: Nhà máy dữ liệu Web3
  • Dữ liệu & AI 101: Góc nhìn Web2 & Web3
  • Bước thứ nhất: Nền tảng dịch vụ dữ liệu Sahara tái định hình mối quan hệ sản xuất
    • Giới thiệu chức năng nền tảng
    • Huyền thoại Sahara
    • Ví dụ gán nhãn: Myshell
    • So sánh với các nền tảng gán nhãn dữ liệu tương tự
  • Bước thứ hai: AI Studio hoàn thành hàng hóa hóa dữ liệu
    • Giải thích chức năng nền tảng
    • So sánh với đối thủ cạnh tranh
  • Bước thứ ba: Tài sản trên chuỗi + Vận hành hệ sinh thái
    • Kiến trúc đa tầng
    • Bổ sung hệ sinh thái
  • Cơ hội và thách thức của Sahara
    • Cơ hội: Thị trường ngách mang lại hiệu quả tài chính tốt hơn
    • Thách thức: AI thách thức gán nhãn dữ liệu
  • Tổng kết
  • Sơ đồ cấu trúc điểm chính

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận