Cách Grass vẽ bản đồ dữ liệu toàn mạng cho kỷ nguyên AI

Bài viết này được dịch máy
Xem bản gốc

Để có được tấm vé vào vòng chung kết AI, các gã khổng lồ đang bỏ ra số tiền khổng lồ để mua dữ liệu chất lượng cao.

Trong kỷ nguyên AI, dữ liệu và tỷ lệ băm đều là những thứ cần thiết. Reddit tiết lộ trong bản cáo bạch IPO rằng họ đã đạt được tổng thu nhập 203 triệu USD thông qua các thỏa thuận cấp phép dữ liệu với các công ty AI. Thông tin trước đây đưa tin rằng OpenAI đang cung cấp cho các nhà xuất bản 1 triệu đến 5 triệu USD mỗi năm để cho phép nhiều tổ chức tin tức ký thỏa thuận cấp phép để đào tạo các mô hình AI của mình.

Về việc bảo vệ dữ liệu chất lượng cao, ví dụ rõ ràng nhất là các hạn chế nghiêm ngặt của X (Twitter cũ) đối với API bắt đầu từ năm 2023. Musk, người đã đầu tư vào OpenAI, rất có thể đã hạn chế nghiêm ngặt quyền truy cập của API vào dữ liệu X vì ông biết rằng X là một kho dữ liệu . Lấy ví dụ đơn giản nhất, mặc dù nhiều người đã quen với việc sử dụng sản phẩm ngôi sao AI Perplexity để thay thế Google cho tìm kiếm nhưng chỉ trên Grok mới ra mắt người dùng mới có thể truy xuất các bài đăng mới nhất trên X. Ở một mức độ nhất định, có thể nói dữ liệu của X đã trở thành hệ thống bảo vệ lớn nhất của Grok.

Vì sự tồn tại của NVIDIA, trong giới crypto, người ta dường như chỉ quan tâm đến các dự án GPU nhưng ít người nhận ra rằng dữ liệu cũng là nguồn tài nguyên quan trọng cho sự phát triển của AI. Sức mạnh tính toán dù có mạnh đến đâu cũng không thể tạo nên kỳ tích, ngay cả người phụ nữ thông minh cũng không thể làm nên bữa ăn nếu không có cơm. Nếu không có đủ dữ liệu và dữ liệu chất lượng cao, hệ thống không thể hiểu, dự đoán và tạo nội dung một cách chính xác và do đó không thể hoạt động hiệu quả trong thế giới thực phức tạp.

Nếu các ứng dụng AI do Chatgpt đại diện và tỷ lệ băm AI do NVIDIA đại diện được gọi là khuôn mặt thì những gã khổng lồ như Google và Microsoft đã tích hợp một phần rất lớn nội dung của toàn bộ mạng và cung cấp khuôn mặt AI.

Dữ liệu không chỉ là nền tảng của AI mà còn là hệ thống bảo vệ của AI. Đối với vấn đề này, Grass, công ty tham gia sâu vào lớp dữ liệu, đã có một giải pháp hoàn chỉnh.

Làm cách nào Grass có thể trở thành một Google phi tập trung?

Nếu tôi tóm tắt triết lý làm việc cốt lõi của Grass trong một câu thì đó là đến từ quần chúng và đi đến đại chúng. Bằng cách chạy nút Grass, người dùng toàn cầu đóng góp băng thông nhàn rỗi và chuyển tiếp lưu lượng truy cập để thu thập dữ liệu chất lượng cao theo thời gian thực trên toàn bộ Internet và nhận phần thưởng Token token .

Không giống như những gã khổng lồ truyền thống, Grass là giao thức crypto hàng đầu để xây dựng các dự án trong lĩnh vực dữ liệu . Dữ liệu Internet khổng lồ mà nó thu thập được xác minh, sắp xếp và làm sạch và trở thành bộ dữ liệu chất lượng cao để bán. Bất kỳ doanh nghiệp hoặc cá nhân nào quan tâm đến việc đào tạo AI của riêng mình đều có thể hưởng lợi từ hệ thống này.

Như Ed Roman, đối tác quản lý của Hack VC, đã nhận xét về Grass, kiểu thu thập dữ liệu này có thể tốt hơn bất kỳ nỗ lực thu thập dữ liệu nội bộ nào của một công ty nhờ sức mạnh của một mạng lưới lớn nút khích lệ . Điều này không chỉ bao gồm việc nhận được nhiều dữ liệu hơn mà còn nhận được dữ liệu thường xuyên hơn để dữ liệu liệu phù hợp và cập nhật hơn. Việc ngăn chặn một đội quân quét dữ liệu phi tập trung là gần như không thể vì chúng có bản chất phân mảnh và không nằm trong một địa chỉ IP duy nhất.

Tất nhiên, khi người dùng đóng góp băng thông nhàn rỗi, họ đương nhiên sẽ lo ngại về vấn đề bảo mật. Grass cũng đưa ra lời giải thích cho điều này: Khi đóng góp băng thông dư thừa vào việc thu thập dữ liệu, Grass sẽ không sử dụng máy tính của người dùng hoặc xem bất kỳ thao tác nào do người dùng thực hiện trên máy tính. Tất cả những gì nó làm là định tuyến lưu lượng truy cập Internet thông qua địa chỉ IP của người dùng và hoàn toàn không liên quan gì đến hoạt động của người dùng, điều đó có nghĩa là nó không có quyền truy cập vào dữ liệu cá nhân của người dùng.

Rào cản gia nhập cực kỳ thấp của Grass đã tích lũy được một lượng người dùng khổng lồ. Chưa đầy một năm sau khi ra mắt, Grass đã có hơn 2 triệu nút hoạt động và ngày nay có hơn 2,2 triệu nút đang hoạt động. Nếu điểm của hơn 2 triệu người dùng nút này được chuyển đổi thành token tương ứng sau Grass TGE, điều này có thể khiến Grass trở thành một trong những cộng đồng và dự án airdrop được phân phối rộng rãi nhất trong lịch sử.

Là một trong số ít sản phẩm có sản phẩm tốt phù hợp với thị trường (PMF, Product Market Fit), đội ngũ Grass không chỉ thể hiện nền tảng kỹ thuật vững chắc thông qua hoạt động ổn định mà còn sử dụng công nghệ và cộng đồng để cùng nhau đưa ra câu trả lời thỏa đáng cho thị trường. Vào tháng 7, Grass Foundation đã phát hành dữ liệu UpvoteWeb về Ôm mặt, dữ liệu gồm 600 triệu bài đăng và nhận xét hàng đầu trên Reddit vào năm 2024. Đây là bộ dữ liệu Reddit mã nguồn mở lớn nhất và mới nhất cho đến nay.

Dữ liệu Reddit có giá trị đối với các mô hình AI vì nó được con người đánh dấu thông qua cơ chế tán thành, sắp xếp chất lượng phản hồi và phân loại các subreddits nơi các chuyên gia bày tỏ ý kiến ​​của họ. Google đã đạt được thỏa thuận trị giá khoảng 60 triệu USD với Reddit để lấy dữ liệu trên Reddit nhằm đào tạo mô hình AI của mình.

Mục tiêu dài hạn của Grass vượt ra ngoài dữ liệu lịch sử Họ dự định xây dựng một công cụ truy xuất theo ngữ cảnh (LCR) theo thời gian thực sẽ sử dụng tất cả nút Grass để liên tục thu thập thông tin trên Internet song song suốt ngày đêm, về cơ bản biến Grass thành một công cụ tìm kiếm do người dùng sở hữu, giống như Google. Về lý thuyết, bất kỳ ứng dụng hoặc mô hình ngôn ngữ lớn (LLM) nào muốn truy xuất dữ liệu thời gian thực đều có thể sử dụng LCR.

Để đảm bảo tính hợp lệ của dữ liệu đào tạo mô hình, Grass cũng giới thiệu bộ xử lý ZK và sổ cái dữ liệu có chức năng tương tự dấu thời gian. Bộ xử lý ZK đảm bảo rằng mô hình AI được đào tạo chính xác và siêu dữ liệu được giữ lại. sổ cái dữ liệu đảm bảo thu thập dữ liệu tính xác thực và nguồn gốc.

Không chỉ dừng lại ở những thành tựu hiện có, trong tương lai, Grass sẽ tiếp tục nâng cấp lặp đi lặp lại cả Chuỗi và nút , nâng cao chất lượng và truyền tải dữ liệu cũng như cải thiện hiệu ứng mạng.

Eric Schmidt, người từng giữ chức Giám đốc điều hành Google trong 10 năm, cho biết trong bài phát biểu năm 2024 tại Trường Khoa học Máy tính thuộc Đại học Stanford rằng ông từng cảm thấy CUDA của NVIDIA không phải là một ngôn ngữ lập trình xuất sắc, nhưng giờ đây CUDA là hệ thống bảo vệ hình lớn nhất của NVIDIA. phải được chạy trên CUDA. Nó cũng đã biến Nvidia trở thành tiêu chuẩn ngành và cơ sở hạ tầng xứng đáng trong ngành AI.

Grass, có lượng lớn, đang nỗ lực để trở thành lớp dữ liệu AI, điều đó có nghĩa là Grass có thể hỗ trợ nhiều kịch bản ứng dụng AI hơn, từ xử lý ngôn ngữ tự nhiên đến nhận dạng hình ảnh cho đến nhiệm vụ học máy phức tạp dữ liệu Grass. để đáp ứng nhiều nhu cầu khác nhau và cuối cùng trở thành cơ sở hạ tầng công nghiệp như NVIDIA.

Là một người dùng bình thường, tôi rất bối rối khi lần đầu tiên tiếp xúc với lớp dữ liệu của AI và không hiểu rõ về sự cần thiết của trong đó. Với sự tò mò này, tôi đã nghiên cứu kỹ triết lý thiết kế của Grass.

Do Mạng Grass phải xử lý và lưu trữ lượng dữ liệu khổng lồ, đặc biệt là dữ liệu thời gian thực, nên các yêu cầu xử lý dữ liệu ở quy mô này vượt xa các hạn chế của khả năng xử lý trên Chuỗi truyền thống. Nếu tất cả dữ liệu được xử lý trực tiếp trên Chuỗi chính, ngay cả một mạng có TPS cao cũng sẽ gặp phải vấn đề tắc nghẽn nghiêm trọng, dẫn đến hiệu quả thấp.

Hoạt động trên blockchain thường đi kèm với chi phí cao, bằng cách xử lý và nén lượng lớn dữ liệu ngoài Chuỗi, sau đó gửi kết quả đã xử lý lên Chuỗi chính. Điều này làm giảm đáng kể gánh nặng dữ liệu trên Chuỗi và cải thiện hiệu quả xử lý tổng thể.

Ngoài ra, thông qua bộ xử lý ZK, dữ liệu nhạy cảm còn được bảo vệ quyền riêng tư bổ sung. Thông qua chức năng ghi dữ liệu gốc, Grass cũng có thể khích lệ nút chất lượng cao.

Sau khi giải quyết các vấn đề về mở rộng , chi phí và quyền riêng tư bằng lớp dữ liệu AI. Grass cũng ra mắt phiên bản ứng dụng nút, nút dụng ít hơn 5% tài nguyên của trình duyệt Chrome nhưng xử lý băng thông gấp 10 lần so với mở rộng của Chrome.

Không chỉ vậy, Grass cũng sẽ ra mắt phiên bản di động và máy khai thác vật lý, điều đó có nghĩa là người dùng Android và iOS có thể nhận được phần thưởng suốt ngày đêm. Vì sự tiện lợi của điện thoại di động có thể sẽ thu hút nhiều người dùng Web2, giúp mạng lưới Grass mở rộng đáng kể. Và vì địa chỉ IP của máy tính và điện thoại di động là khác nhau nên người dùng cũ cũng có thể nhận thêm lợi nhuận từ điện thoại di động.

Bối cảnh chất lượng cao được phủ PMF cao, tiềm năng đáng kinh ngạc

Công nghệ đội ngũ không chỉ tiếp tục trực tuyến và cộng đồng tiếp tục được săn đón, mà Grass, vốn đã có PMF rất cao, còn có bối cảnh quản lý vững chắc không kém.

Wynd Network, công ty mẹ của Grass, trước đây đã nhận được tài trợ vòng hạt giống từ Polychain Capital và Tribe Capital . Không chỉ vậy, đối tác quản lý Multicoin, Kyle Samani, người đã gây chú ý khi đặt cược vào Solana , đã tham gia vào vòng cấp vốn Pre-seed của Wynd Network.

Điều đáng chú ý là Hack VC cũng đề cập đến việc đầu tư vào Grass trong bài viết. Không rõ liệu điều này có nghĩa là Grass có một vòng tài trợ mới vẫn chưa được tiết lộ hay không.

Có những thành viên cộng đồng được mong đợi. Sau Grass TGE, khi mọi người nhận ra rằng họ có thể kiếm được lượng lớn tiền một cách thụ động thông qua Grass mà không gặp bất kỳ rủi ro nào, những người đã bỏ lỡ Grass sẽ đổ xô đến đó. Điều này có nghĩa là nhu cầu sau khi ra mắt, tiềm ẩn và tiềm ẩn cùng với việc ra mắt ứng dụng di động, số lượng người dùng sẽ tăng lên đáng kể. Tùy thuộc vào tăng trưởng, hệ số lực kéo và hiệu ứng mạng, Grass có thể có 50 triệu người dùng trong vòng một năm.

Khi ngành công nghiệp crypto tiếp tục loại bỏ các thuật ngữ mới, doanh thu đã trở thành trọng tâm. Theo phí tích lũy của các dự án DePIN khác nhau trong ba tháng qua do House of Chimera cung cấp, io.net và Helium mỗi dự án tích lũy được 500.000 USD, trong khi Akash nhận được 200.000 USD phí.

Vấn đề tồn tại lâu dài về thu nhập thực tế dường như không gây ra nhiều thách thức cho Grass. Lấy bộ dữ liệu Reddit UpvoteWeb đề cập ở trên làm ví dụ. Để có bộ dữ liệu tương tự như thế này, Google cần phải trả 60 triệu để có được nó.

So với Bright Data, công ty địa vị về dịch vụ quét dữ liệu và proxy trong nhóm Web2. Dù được tính từ Data cho AI với giá 0,001 USD mỗi bản ghi hay lần USD của Perplexity cho 5 triệu yêu cầu, bộ dữ liệu 600 triệu Reddit mà Grass thu được đều đáng giá rất nhiều tiền.

Chưa kể chính sách mới của Reddit về việc đặt phí API ở mức 0,24 USD trên lần cuộc gọi bắt đầu từ tháng 7 năm 2023. Bạn nên biết rằng dữ liệu trên chỉ là khi Grass chưa tung ra token, chưa ra mắt phiên bản di động và máy khai thác chuyên dụng. Khi Grass hình thành hiệu ứng mạng mạnh hơn, tất cả dữ liệu sẽ được cập nhật lại.

Đối với các hệ thống có hiệu ứng mạng, thời gian là điều cốt yếu. Grass đã thiết lập được cơ sở người dùng và tích lũy công nghệ đủ rộng trong lĩnh vực crypto và thậm chí cả AI. Chúng tôi mong muốn bánh đà của nó phát triển hơn nữa và trở thành lớp dữ liệu AI thực sự.

Giống như thử thách TOUCH GRASS do Grass tổ chức cho cộng đồng, nó truyền tải một viễn cảnh mong đợi đẹp, biến Grass thành bản đồ dữ liệu trong kỷ nguyên AI, chuyển lợi ích của các doanh nghiệp tập trung đến nhiều người dùng hơn và giúp các thành viên cộng đồng Grass có nhiều thời gian tiếp xúc hơn Cỏ.

Chào mừng bạn tham gia cộng đồng chính thức BlockBeats BlockBeats:

Nhóm đăng ký Telegram: https://t.me/theblockbeats

Nhóm liên lạc Telegram: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
1