專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

avatar
PANews
12-10

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

作者:Zen,PANews

隨著AI技術的迅速發展,數據成為驅動其成長的核心動力,其重要性不亞於石油對於現代工業的作用。高質量數據的獲取、標註和處理是AI模型訓練的基石,而這一過程的大量依賴人工處理、效率低下、成本居高不下和質量參差不齊等問題,使得現有產業鏈中依然面臨巨大挑戰。

如幣安創始人趙長鵬(CZ)所言,AI數據標註等任務非常適合通過區塊鏈完成,可藉助全球低成本勞動力,並通過加密貨幣即時支付,打破地域限制。CZ還提到,當前仍需更多工具建設,並呼籲開發者共同構建去中心化的AI數據處理生態。

實際上,自人工智能熱潮興起以來,開始專注做去中心化的AI數據業務的項目也不在少數,但鮮有項目能實現商業模式落地,而在BNB生態上表現突出的DIN則是其中一例。DIN目前擁有超過3千萬註冊用戶和百萬日活用戶,數次居於BNB Chain上AI Dapp排行榜榜首。更為重要的是,DIN不僅帶動了去中心化的AI數據經濟,同時也開始真正賦能Web2 傳統行業發展。

DIN:AI時代數據流水線員工的上崗證

DIN是首個模塊化 AI 原生數據預處理層,旨在建立基於人、數據和 AI 協同作用的數據智能網絡,讓每個人都能為 AI 處理數據並獲得報酬。截至目前,DIN總融資已達800萬美元,其先於去年7月完成Binance Labs領投的400萬美元種子輪融資,又在今年8月完成400萬美元Pre-listing(預上市)融資,Manta、Moonbeam、Ankr、Maxx Capital等參投。

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

在採訪中,DIN創始人Harold表示,如果用最通俗易懂的方式來對DIN進行介紹,其可以稱為“AI時代數據流水線員工的上崗證”, 讓全球每個普通人都可以隨時隨地無門檻參與,享受crypto帶來的無邊界靈活支付,並瓜分AI發展帶來的源源不斷的時代現金流紅利。“AI 需要海量的數據促進自身的發展,那麼每一個人都應該能夠因為它產生的數據而受益,DIN希望能夠在中間充當一個橋樑,讓每一個人生產的數據能夠被記錄,每個人能獲利。”

DIN的名稱源自Data Intelligence Network的首字母縮寫。在過去三年中,DIN專注於圍繞“數據”提供產品和服務,涵蓋鏈上數據、社交媒體內容等鏈下數據,其前身為Web3數據智能公司Web3Go。在創立該項目前,Harold一直從事於人工智能行業,其領導的團隊研發的鋼鐵表面缺陷檢測等AI應用也得到了落地。得益於團隊擁有大數據、人工智能和通信領域的多年積累和經驗,並在數據賽道深耕多年,DIN已經形成了一套成熟的服務交付體系,且每年均能實現盈利。

區塊鏈實現數據眾包革命

眾所周知,算法、算力和數據是人工智能的三大核心要素,其中數據是人工智能發展的基礎,倘若缺乏足夠的數據支持,任何先進的算法和算力都將無從談起。因此,AI模型的“數據工廠”在人工智能浪潮中愈發舉足輕重,該領域的龍頭Scale AI於今年5月更是以138 億美元估值完成了最新一輪高達10億美元的融資,由硅谷頂級基金Accel領投,YC、英偉達、亞馬遜、Meta、AMD等一眾科技巨頭參投。

Scale AI的客戶群體包括醫療、國防、電商、政府服務等多個領域,其通過向客戶提供高質量數據,同時將大部分質量保證責任和成本轉嫁給個人任務執行者,從而實現盈利。Scale AI眾包平臺 Remotasks在肯尼亞、菲律賓、委內瑞拉等地區設立了數十家機構,擁有成千上萬名數據標註員。

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

然而,這種利潤主要集中在中心化公司手中的方式無法更好地激勵參與者,也就不能充分解放勞動力。據The Washington Post報道,Scale AI 支付工人的工資極低,經常拖欠或扣留工資,並且幾乎沒有為工人提供追索渠道。人權組織和勞工研究人員表示,Scale AI 是眾多未遵守海外工人基本勞工標準的美國人工智能公司之一。可見,在中心化和壟斷化企業主導的人工智能熱潮背後,有一支“數字血汗工廠”中的海外勞工大軍,他們支持著AI產業的蓬勃發展,但在勞動密集型工作中卻時常遭到剝削,未得到應有的回報。

“生產、蒐集數據的模式完全是中心化的,我們認為這不利於 AI 技術的長期發展,因為每個人都是數據的生產者,但卻並沒有從中獲得收益。”對於數據壟斷和高度中心化的問題,

Harold表示,基於區塊鏈的去中心化和公開透明的特性,通過將AI 數據與之相結合,可利用區塊鏈去管理數據,記錄每一個人對數據的生產過程,最終使用區塊鏈去進行結算,使提供數據的用戶持續獲得收益。

拳頭產品xData與Chipper Node連通B、C端

“DIN提供了一套涵蓋數據採集、標註、驗證及向量化的全棧解決方案,” Harold介紹稱。其核心產品 xData 專注於推特內容數據的收集與標註,能夠圍繞特定項目或話題定向採集內容,將分散的素材彙總為完整的數據庫。通過 xData,一方面用戶可以低成本、低門檻地參與 AI 數據的採集與標註並獲得收益;另一方面,客戶也能借此獲得更多的曝光機會,同時滿足數據收集與處理需求。截至目前,xData 已成功收集並標註超過1億條推文。

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

AI模型經過多次迭代,其訓練過程不僅需要大量數據,還必須確保數據的高質量。“高質量數據是提升模型準確性和可靠性的關鍵,而低質量數據則可能導致偏差甚至錯誤的結果。”Harold表示,AI模型在訓練和微調時,需要大量經過清理、驗證併合格的數據。

在DIN 生態系統中,Chipper Node承擔數據“質檢”和優化的重要角色。Harold指出,Chipper Node利用用戶邊緣設備的閒置算力,對 xData 收集的原始數據進行驗證、分類、清理和向量化處理。此外,Chipper Node不僅實現了網絡內獎勵的轉換,還推動了經濟體系的高效運轉,讓用戶能夠隨時隨地通過挖礦獲得收益,最終實現AI數據貢獻者的支付閉環。

通過Chipper Node和xData的協同作用,作為橋樑的DIN打通了 B 端企業與 C 端用戶之間的連接通路。企業端能夠通過DIN生態以更高效、更低成本的方式獲取經過驗證的優質數據,而用戶端則能夠以低門檻的方式通過日常的參與貢獻數據內容並獲得獎勵。這種模式不僅實現了數據供需兩端的高效匹配,也顯著提升了用戶的參與感和收益體驗,為DIN生態的快速發展注入了強大動力。Harold稱,目前DIN總用戶數已突破3000萬,日活躍用戶達70萬,DIN每日處理鏈上交易達100萬,展示了高度活躍且可擴展的區塊鏈生態系統。

值得一提的是,DIN的數據被存儲在去中心化存儲基礎設施BNB Greenfield上,後者通過將數據分片並存儲在多個節點,顯著降低存儲成本,同時提高存儲效率。此外,得益於優化的分佈式存儲架構,Greenfield 能提供接近傳統 Web2 雲存儲的訪問速度,同時保證去中心化的安全性和可靠性。這使得DIN確保了在為用戶提供激勵的同時,兼顧數據在網絡中傳遞的安全性和隱私保護。

賦能Web2 傳統行業,DIN已真正實現產品落地

與大多數AI+Web3項目停留在暢想大規模採用的階段不同,DIN提供的AI數據已經開始賦能Web2 傳統行業發展。Harold透露,早在幾個月前,DIN已和思必馳(AISpeech)旗下的數據標註公司核數聚進行合作,通過BNB Chain 為思必馳小語種進行語音數據的標註和蒐集。

思必馳作為國內語音技術領域的獨角獸,與科大訊飛齊名,專注於語音識別、語音合成和自然語言處理等核心技術,其技術廣泛應用於汽車導航、車載語音助手等產品中,為駕駛員提供高效、便捷的智能交互體驗。在全球化的市場背景下,車載系統必須能夠支持多語言交互,尤其是在跨國銷售和多文化融合的環境中。這需要大量高質量的小語種及方言的語音數據,用於訓練語音識別和合成模型。傳統的數據標註方式往往成本高昂、週期漫長,難以滿足快速迭代的需求。

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

然而,通過利用 DIN 的區塊鏈網絡,將小語種語音數據的標註和蒐集任務分發到全球的分佈式勞動力網絡中,將顯著提高效率和數據覆蓋範圍。一方面,DIN 的平臺通過多層驗證和審核機制,確保標註數據的高質量和一致性,且多語種的覆蓋範圍使得思必馳能夠快速構建和優化其小語種語音模型;而另一方面,所有數據的處理流程都記錄在鏈上,確保透明、可信,方便未來的審計和溯源,這在日益嚴格的隱私保護和數據合規要求下對語音技術企業至關重要。

DIN 的技術和商業模式不僅證明了去中心化數據網絡的可行性,還為傳統行業注入了新的增長動能,成為 Web2 與 Web3 融合的重要驅動力。展望未來,DIN 有望將其數據智能網絡的能力擴展至醫療、教育、零售等行業,通過應用 AI 數據處理,幫助傳統企業實現智能化轉型。

在熊市堅守,反哺推動BNB Chain 生態發展

在剛剛過去的熊市環境下,市場流動性差、用戶活躍度低、缺乏用戶驗證產品等問題突出,不斷內卷致使獲取用戶的成本也顯著提高。這些挑戰無疑對項目的運營和發展帶來了巨大壓力。Harold坦言,在很多項目通過短期機會“掙快錢”時也讓他們有些眼紅,但是最終DIN還是選擇關注長期價值創造,而非追逐短期利益、急於變現或迎合市場短期波動。

“我們算是一個比較務實和踏實的團隊。”Harold補充說,DIN一直以來都更想堅持做正確的事情,這一過程中偶爾會進展緩慢,有時會痛苦難熬,但這正是在前沿科技領域創業的常態,只有咬牙堅持,才能走得更遠。

從推動鏈上數據分析到實現用戶友好的AI代理平臺,再到開創去中心化的AI數據預處理工具,除了AI數據基礎設施的定位外,DIN團隊近幾年還始終堅持在BNB生態深耕,並在獲得其資金、資源等支持後又助推了該生態的發展。例如,DIN推出的Chipper節點預挖礦和xDIN交易不僅帶來了顯著的交易量和鏈上活躍度,同時也帶來了超過4萬個運行中的節點和超過5萬個高質量的節點持有者。這進一步激活了BNB Chain的鏈上數據生態系統,並提升了用戶的參與度。

此外,近期,DIN通過節點預挖礦、幣安Web3錢包空投活動和幣安廣場徵文大賽,僅一週就為BNB Chain 帶來了近750萬筆交易,40萬次曝光。不僅如此,DIN還幫助幣安在短短10天內吸引了超過26萬新用戶註冊。

即將到來的TGE與基於BNB鏈的L2區塊鏈

恰逢牛市,DIN即將迎來項目發展的關鍵節點。Harold稱,DIN 將在 BNB 鏈上構建一條專屬 L2 數據鏈,以進一步推動去中心化 AI 數據網絡構想的落地。不久後推出的DIN代幣則將作為這條 L2 鏈的核心燃料,用於支付數據存儲、節點運營和 AI 代理創建與交易等鏈上操作的gas費,成為這一去中心化網絡的硬通貨。

專訪DIN創始人Harold:Web3數據網絡如何打破“AI數據血汗工廠”魔咒?

此外,DIN代幣採用通縮模型,每次代幣消耗都會燃燒 DIN,從而持續減少市場供應,帶來稀缺性價值。同時,DIN 團隊計劃定期將其Web2業務產生的利潤用於回購代幣,以進一步強化其價值支撐。Harold透露,DIN在兩年前就已實現盈利,其成熟的 Web2 數據業務為 Web3 發展提供了穩定且可持續的支持。

在本輪牛市,隨著 BNB 的流動性顯著提升,價格飆升至歷史新高,市場對其生態發展的信心空前高漲。不少從業者分析認為,BNB Chain 很可能會在短期內宣佈重大動作。而DIN L2 數據鏈的推出恰逢其時,結合近幾個月的表現,其或將充分受益於 BNB Chain 的生態紅利,與其共同推動 Web3 數據經濟的發展。

總的來看,憑藉其在BNB生態的強勢表現和成熟的商業模式,DIN正在將去中心化AI數據經濟的願景逐步落地。在即將推出的L2數據鏈和代幣經濟體系的加持下,DIN不僅為加密貨幣行業注入了新的活力,也將為AI和傳統數據行業提供更多的可能性。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論