撰文:Haotian
「讓用戶擁有自己的數據主權」,這個口號原本承載著整個 web3 時代的大願景,不過由於數據上鍊成本和公開隱私性等挑戰問題一直沒得到真正應用。最近,由於 AGI 大模型訓練市場對數據源的龐大需求刺激,即將上線幣安的 @withvana,提出了一套 DLP 流動性池 +TEE 的數據所有權解決方案,具體有哪些亮點呢?
1)數據主權和個人數據分紅是個很古老的議題。在 web2 時代個人數據實現了大爆炸但卻造成平臺的壟斷和數據隱私被嚴重侵犯的問題;在 web3 時代的初期,不少項目嘗試用智能合約管理 + 去中心化存儲 + 鏈上確權等來實現這一願景,卻發現鏈存儲成本高昂且鏈上數據的透明特性加大了保護隱私的挑戰。
正因為此,用區塊鏈實現「數據所有權」的探索之路一直因技術瓶頸處於被擱置狀態。
2)AI 時代來臨後,AGI 大模型訓練、多模態訓練、以及數據推理、微調等多樣化應用場景,尤其是垂直領域的機器學習和專業模型訓練,需要大量非公開的高質量數據作為支撐,這使得個人和機構持有的私有數據成為 AI 發展的關鍵資源,因此讓數據為 AI 學習所用成了一個規模龐大的「需求端」。
這是 Vana 治理為 AI 時代用戶解決數據主權的前提,因為大部分 web2 環境下的個人對數據所有權、隱私等敏感度都偏低,而把「數據」視為石油資產的 AI 時代境況就完全不同了。
3)即將上線主網的 Vana 的解決方案主要針對兩大問題:「數據雙花 」和「隱私權保護」。具體而言:當一個數據在鏈上被公開、任意複製存儲都可能導致數據失去稀缺性繼而喪失價值捕獲能力。
Vana 通過 DLP(Data Liquidity Pool)數據流動性池來建立數據市場,採用 Proof of Contribution 的特別貢獻證明機制來支撐系統運轉。
數據所有者可將數據使用權質押到特定領域的數據池中,比如 醫療病例池、金融交易池等等。質押後會獲得 DataDAO&數據代幣,以此作為權益憑證。當 AI 訓練需求方應用特定數據池支付的費用會按照比例自動分配給憑證的持有者,數據所有者還能參與 DataDAO 的治理,參與 DLP 運營規則、定價策略等共同決策。
這個數據流動性池和常見的 DeFi 交易池類似,會通過智能合約管理整個數據有效性驗證、Pool 訪問權限、代幣分配等等調度性工作。這些也是「數據雙花」問題被有效解決的關鍵,讓數據 Token 代幣化實現所有權確權,讓流程由智能合約全程記錄和協調管理,以確保數據使用的可追溯性和收益分配的自動化。
Vana 通過 TEE 安全飛地環境來解決數據隱私問題,TEE 技術特性正是可以實現數據隱私保護前提下的「使用權」,可以實現數據經個人服務器存儲、到數據經 DLP 池訪問,再到數據訓練使用整個過程中,TEE 環境提供「端到端」的安全保護。
比如用戶授權了一部分數據給 DLP 池,該部分數據會處於 TEE 隱私環境下,訪問使用該數據的客戶會被授予使用權進行訓練,然而卻無法對該數據進行備份竊取。
整個過程 TEE 能提供全程記錄和隔離環境處理,確保數據在被使用的同時保持隱私性。TEE 這種「可用不可見」的特性完美解決了隱私保護難題。除了此兩大特性,Vana 對數據 Owner 給予了完全的數據控制權,用戶可以隨時撤回或修改數據使用授權;
此外,Vana 採用了清晰的分層技術架構:底層支持用戶通過輕量化自保管或代理託管方式靈活存儲數據;中間以 DLP 作為協議層,通過智能合約進行精細化的調度管理,包括數據流轉、權限控制、收益分配等核心功能;頂層則對接各類 AI 應用場景,為大模型訓練、數據分析等需求提供標準化接口。
這種分層設計既確保了數據主權,又實現了使用場景的可擴展性。
以上。
最後,補充一個觀點,Vana 為 AI 時代提供數據所有權的解決方案,是一個被 AI 場景催生的數據確權「老敘事」,屬於整個 AI Narrative 大潮中的重要一環。
Vana 要構建的護城河在於,一旦其整個數據收集、使用、權益鏈條被打通,可能會向更廣的場景和領域進行外延拓展。別忘了,數據所有權的大願景可能會貫穿整個區塊鏈和 web3。