탈중앙화 AI 데이터 네트워크 Sahara AI에 대한 10,000단어 분량의 연구 보고서: Web3 시대의 데이터 금광의 수문장? 개발 배경, 기술 원리, 생태적 상태, 장단점, 리스크 및 미래 전망에 대한 파노라마 분석

이 기사는 기계로 번역되었습니다
원문 표시

실리콘밸리의 생성형 AI 거대 기업들이 스케일링 법칙을 신봉하고 해시레이트 예산을 미친 듯이 소비할 때, 사람들은 이 게임에서 유일한 전략적 자산이 형성되었음을 빠르게 인식했습니다: 고품질 훈련 데이터가 모든 모델 제조업체가 갈망하는 "디지털 석유"가 되었습니다. 이 "신석유"의 공급업체이자 화교 천재 알렉산더 왕과 그가 직접 설립한 데이터 주석 회사 Scale AI는 한때 매우 주목받았습니다. 그는 마이크로소프트, 메타, OpenAI 등 대규모로 모델 훈련에 투자하는 기업들의 지정된 데이터 서비스 제공업체일 뿐만 아니라 미국 국방부의 환영받는 손님이 되었습니다. 고품질 데이터 부족에 대한 시장의 기대로 Scale AI와 같이 데이터 가공으로 수익을 내는 회사들이 인정받는 기업이 되었고, 2024년 10억 달러 F 시리즈 투자를 완료한 후 회사 가치는 이전 라운드에 비해 두 배로 늘어 138억 달러에 이르렀습니다. 1997년생 이 젊은 CEO는 머신러닝(ML) 및 생성형 AI의 물결을 타고 Scale AI를 2024년에 연간 10억 달러 수익 기준을 돌파하도록 이끌었으며, 2023년 이전에 비해 4배 성장했습니다. Scale AI뿐만 아니라 Encord, Label Box, Snorkel AI 등의 기업들도 자신들의 독특한 기술을 바탕으로 이 떠오르는 시장의 중요한 플레이어로 빠르게 성장했습니다.

하지만 이 축제는 영원히 지속되지 않을 것입니다. 연구원들의 판단에 따르면, 인터넷상의 공개 말뭉치 데이터는 곧 소진될 것이며, AI 거대 기업들은 각 분야의 전문가들이 자신들의 주석 데이터와 수직 분야 지식을 기여하여 더 나은 AI를 만들어야 합니다. 이러한 전문가들이 개인 영역에 저장한 데이터는 거대 기업들이 인터넷에서 마음대로 수집할 수 없으며, 이는 그들이 이러한 데이터 통제권을 통해 더 큰 이익을 얻을 기회가 있음을 의미합니다. 이는 아마도 Web3가 개입할 수 있는 좋은 기회일 것입니다.

작성자:헨드릭스, Web3Caff 연구원

표지: 로고 및 배경 사진 Sahara, 타이포그래피 Web3Caff 연구팀

글자 수: 총 10,400자 이상

목차

  • Sahara AI: Web3 데이터 공장
  • 데이터 & AI 101: Web2 & Web3 관점
  • 첫 번째 단계: Sahara 데이터 서비스 플랫폼이 생산 관계를 재구성
    • 플랫폼 기능 소개
    • Sahara 레전드
    • 라벨링 사례: Myshell
    • 유사 데이터 라벨링 플랫폼 비교
  • 두 번째 단계: AI 스튜디오로 데이터 상품화 완성
    • 플랫폼 기능 해석
    • 경쟁 제품과 비교
  • 세 번째 단계: 자산 온체인 + 생태계 운영
    • 다층 아키텍처
    • 생태계 보완
  • Sahara의 기회와 도전
    • 기회: 틈새 시장을 통한 더 나은 재무 성과
    • 도전: AI의 데이터 라벨링 도전
  • 요약
  • 주요 구조도

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트