TL;DR
去中心化儲存是指單個實體或部分群體將其閒置儲存空間作為儲存網路的單元,從而繞過 AWS 和谷歌雲等中心化機構對資料的絕對控制。
低儲存成本、資料冗餘備份和 token 經濟也是去中心化儲存的特點,大量的 Web3 應用程式都建立在這個基礎架構上。
截至 2023 年 6 月,去中心化儲存整體的儲存容量已超過 22000 PB(PB),而網路利用率僅約為 20%。這表明未來有很大的增長空間。
在現有的儲存容量中,大約超 80% 的儲存容量由 Filecoin 提供,它無疑是該領域的領頭羊。Filecoin 還推出了 Filecoin Plus 和 FVM 等項目,以激勵開發者並促進生態系統發展。
隨著人工智慧和全鏈遊戲等領域的興起,去中心化計算和儲存賽道有望迎來令人興奮的增長機會。
1. 為什麼我們需要去中心化儲存
像 Dropbox 和 Google Cloud 這樣的雲端儲存服務已經改變了我們線上儲存和共享大型檔案(如視訊和照片)的方式。它們允許任何人以比購買新硬碟低得多的成本儲存幾 TB 的資料,並在需要時從任何裝置訪問檔案。然而,有一個問題:使用者必須依賴中心化實體的管理系統,這些實體可能隨時取消他們對賬戶的訪問許可權,與政府機構共享他們的檔案,甚至無故刪除檔案。這種儲存模式導致資料資產的歸屬不清晰,並且實際上使得亞馬遜和谷歌等大型網際網路公司在資料方面壟斷。此外,中心化服務的停機時間經常會帶來災難性的後果。
儲存領域其實原生適用於去中心化應用。首先,它解決了使用者資料隱私和所有權等問題。儲存在去中心化檔案服務上的檔案不受任何中心化機構的影響,比如可能希望控制和審查內容的政府機構。它還可以防止私營公司採取諸如審查服務或與執法部門共享檔案的事件。
其次,海量的資料儲存於索引本身就需要分散式系統來實現。現有的中心化雲服務同樣使用著分散式的方案,如 Spanner、TiDB 等。可以說分散式並不意味著去中心化,但去中心化一定是分散式的。區別於中心化儲存的架構,現有的去中心化方案會將資料分成小塊並在加密後儲存在全球的各個節點上,這個過程會建立資料的多個副本並提高對資料丟失的恢復能力。

第三,解決了無效挖礦的資源消耗。比特幣的 PoW 機制造成的大量電能消耗一直以來被人所詬病,而去中心化儲存賦予了使用者成為節點的機會,可以通過閒置的儲存資源來進行挖礦並獲利。而大量的儲存節點,也意味著成本的降低,可以預見的是,去中心化的儲存雲服務甚至能夠饞食一部分 Web2 雲服務市場份額。在網路頻寬、硬體服務不斷升級的今天,這是一個及其龐大的市場,根據 Business Research 預測,全球的資料庫市場將在 2028 年超過 1200 億美金。

2. 去中心化儲存架構
為了建立真正去中心化的應用程式,去中心化資料庫也應該包含在 Web3 應用程式架構中。其可以分為四個主要元件:智慧合約層、檔案儲存、資料庫和通用基礎設施層。
智慧合約層相當於是 Layer1,而通用基礎設施層則包括但不限於預言機、RPC、訪問控制、身份、鏈下計算和索引網路。

雖然使用者感知不明顯,但檔案儲存和資料庫層在 Web3 應用程式的開發中都發揮著至關重要的作用。它們為儲存結構化和非結構化資料提供了必要的基礎架構,這是各種應用程式的要求。由於本報告的性質,下文將進一步詳細介紹這兩個組成部分。
2.1 去中心化檔案儲存網路 (DFSNs)
像 Filecoin、Arweave 和 Crust 等 DFSNs 主要用於非結構化資料的持久儲存,這些資料不遵循預定義的格式,也不需要頻繁更新或檢索。因此,DFSNs 通常用於儲存各種靜態型別的資料,例如文字文件、影象、音訊檔案和視訊。
分散式儲存體系結構中這種型別的資料的一個優點是能夠利用邊緣儲存裝置或邊緣資料中心將資料儲存移動得更靠近終端。這種儲存方法提供了更低的網路通訊成本、更低的互動延遲和更低的頻寬開銷。它還提供了更大的適應性和可擴充套件性。例如,以 Storj 為例,1TB 的每月儲存成本為 4.00 美元,而市場領頭羊的企業雲端儲存解決方案 Amazon S3 對相同數量的資料每月收費約 23.00 美元。
與傳統的中心化雲端儲存解決方案相比,使用者可以從更具成本效益的儲存選項中受益。DFSNs 的去中心化特性還提供了更高的資料安全性、隱私性和控制性,因為資料分佈在多個節點或礦工之間,而不是儲存在單箇中心化伺服器中。

2.2 去中心化資料庫
在 DFSNs 中儲存非結構化檔案的侷限性是顯而易見的,特別是在高效的資料檢索和更新方面。對於需要頻繁更新的資料,這些體系結構不是最理想的選擇。在這種情況下,MySQL 和 Redis 等傳統資料庫是更適合開發人員的選項,它們在 Web2.0 的網際網路時代經過了廣泛的優化和測試。
尤其是在區塊鏈遊戲和社交網路等應用中,儲存結構化資料是一個不可避免的要求。傳統資料庫提供了一種有效的方式來管理大量動態資料並控制對其的訪問。它們提供了索引、查詢和資料操作等功能,這些功能對依賴結構化資料的應用程式至關重要。因此,無論是基於 DFSNs 還是自研底層儲存。高效能、高可用性的去中心化資料庫是儲存領域的一個非常重要的分支。
3. DFSNs 技術層面分析
3.1 概括
在目前的 Web3 項目中,去中心化的檔案儲存項目(DFSNs)大致可以分為兩類。第一類包括Filecoin 和 Crust 等基於 IPFS 實現的項目。第二類包括 AR、Sia 和 Storj 等項目,它們有自己的底層協議或儲存系統。儘管它們有不同的實施方法,但都面臨著相同的挑戰:確保真正去中心化儲存的同時實現高效的資料儲存和檢索。
由於區塊鏈本身不適合在鏈上儲存大量資料,相關成本和對區塊空間的影響使這種方法不切實際。因此,理想的去中心化儲存網路必須能夠儲存、檢索和維護資料,同時確保網路中的所有參與者的工作都受到激勵,並遵守去中心化系統的信任機制。
我們將從以下幾個方面評估幾個主流項目的技術特點和優缺點:

資料儲存格式:儲存協議層需要確定資料應該如何儲存,例如資料是否應該加密,以及資料應該作為一個整體儲存還是分成小的雜湊塊。
資料複製備份:需要決定將資料儲存在哪裡,例如應該有多少節點儲存資料,是否應該將所有資料複製到所有節點,或者每個節點是否應該接收不同的片段,以進一步保護資料隱私。資料儲存格式和傳播將決定網路上資料可用性的概率,即裝置隨時間發生故障時的永續性。
長期的資料可用性:網路需要確保資料在應在何時何地可用。這意味著要設計激勵機制,防止儲存節點隨時間刪除舊資料。
儲存資料的證明:網路不僅需要知道資料的儲存位置,而且儲存節點應該能夠證明他們確實儲存了他們想要儲存的資料,以確定激勵的份額。
儲存價格發現:預計節點將為檔案的持續儲存付費。
3.2 資料儲存與複製

正如剛剛提到的,Filecoin 和 Crust 使用 IPFS 作為網路協議和通訊層,用於在對等點之間傳輸檔案並將其儲存在節點上。不同之處在於 Filecoin 使用擦除編碼(EC)來實現資料儲存的可擴充套件性。擦除編碼(EC)是一種資料保護方法,將資料劃分為片段,擴充套件和編碼冗餘資料塊,並將其儲存在不同的位置,如磁碟、儲存節點或其他地理位置。EC 建立了一個數學函式來描述一組數字,允許檢查它們的準確性,並在其中一個數字丟失的情況下恢復它們。

基本方程為 n=k+m,其中總資料塊等於原始資料塊加上校驗塊。
從 k 個原始資料塊中計算出 m 個校驗塊。將這 k+m 個資料塊分別存放在 k+m 個硬碟上,就能容忍任意 m 個硬碟故障。當出現硬碟故障時,只要任意選取 k 個倖存資料塊就能計算得到所有的原始資料塊。同理,如果將 k+m 個資料塊分散在不同的儲存節點上,就能容忍 m 個節點故障。
當新的資料要儲存在 Filecoin 網路上時,使用者必須通過 Filecoin 儲存市場連線到一個儲存供應商,並協商儲存條款,然後再下一個儲存訂單。同時,使用者必須決定使用哪種型別的糾刪碼以及其中的複製因子。通過糾刪碼,資料被分解成恆定大小的片段,每個片段都被擴充套件,並對冗餘資料進行編碼,因此,只有片段的一個子集才需要重建原始檔案。複製因子指的是資料應該多長時間被複制到儲存礦工的更多儲存扇區。一旦儲存礦工和使用者就條款達成一致,資料就會被傳送到儲存礦工,並被儲存在儲存礦工的儲存扇區。
Crust 的資料儲存方式則不一樣,他們將資料複製到固定數量的節點:提交儲存訂單時,資料被加密併傳送到至少 20 個 Crust IPFS 節點(節點數量可以調整)。在每個節點上,資料被分成許多較小的片段,這些片段被雜湊成 Merkle 樹。每個節點保留構成完整檔案的所有片段。
Arweave 也同樣使用完整檔案的複製,但 Arweave 採用了一些不同的方法。交易提交到 Arweave 網路後,第一個單個節點會將資料作為塊儲存在 blockweave 上(Arweave 的區塊連結串列現形式)。從那裡開始,一種稱為 Wildfire 的非常激進的演算法確保資料在網路上快速複製,因為為了讓任何節點挖掘下一個塊,它們必須證明他們可以訪問前一個塊。
Sia 和 Storj 同樣使用 EC 來儲存檔案。實際上 Crust 的實現:20 個完整的資料集儲存在 20 個節點上是非常冗餘的,但也會使資料非常耐用。可如果從頻寬的角度來看,這是非常低效的。糾刪碼提供了一種更有效的實現冗餘的方法,通過提高資料的永續性而不會產生大的頻寬影響。Sia 和 Storj 直接將 EC 分片傳播到特定數量的節點,以滿足一定的永續性要求。
3.3 資料儲存證明與激勵
之所以要先說明資料儲存格式是因為技術路徑的選擇直接決定了各個協議在證明、激勵層的區別。即如何驗證要儲存在特定節點上的資料是否確實儲存在該特定節點上。只有在驗證發生之後,網路才能使用其他機制來確保資料隨著時間的推移保持儲存(即,儲存節點不會在初始儲存操作後刪除資料)。
此類機制包括證明資料在特定時間段記憶體儲的演算法、成功完成儲存請求持續時間的財務激勵以及對未完成請求的抑制等。本節將介紹每個協議的儲存及激勵協議。

3.3.1 Filecoin
在 Filecoin 上,儲存礦工在收到任何儲存請求之前,必須將抵押品存入網路,作為向網路提供儲存的承諾,完成後,礦工可以在儲存市場上提供儲存併為其服務定價。同時,Filecoin 創新性地提出了 PoRep 和 PoSt 來進行礦工的儲存驗證。

複製副本證明(PoRep):礦工需要證明它們儲存了資料的獨特副本。獨特的編碼確保了同一份資料的兩個儲存交易無法重用同一個磁碟空間。
時空證明(PoSt):在儲存交易的生命週期內,儲存礦工需每 24 小時證明一次自己在持續劃撥專用儲存空間來儲存該資料。
在提交證明後儲存空間提供者會獲得 FIL 回報,若無法遵守承諾,其抵押的 token 就會被沒收(Slash)。
但隨著時間的推移,儲存礦工需要通過定期執行該演算法來始終如一地證明他們對儲存資料的所有權。但是,像這樣的一致檢查需要大量頻寬。而 Filecoin 的新穎之處在於,為了證明資料隨時間儲存並減少頻寬使用,礦工使用前一個證明的輸出作為當前證明的輸入,按順序生成複製證明。這是通過多次迭代執行的,這些迭代表示資料要儲存的持續時間。
3.3.2 Crust Network
和 Filecoin 一樣,Crust 與 IPFS 的關係同樣是激勵層和儲存層的關係。在 Crust Network 中,節點還必須先存入抵押品,然後才能在網路上接受儲存訂單。節點提供給網路的儲存空間量決定了抵押品的最大數量,該抵押品被質押並允許節點參與在網路上建立區塊。這種演算法被稱為保證權益證明(Guaranteed Proof of Stake, GPoS),它保證只有在網路中擁有權益的節點才能提供儲存空間。

和 Filecoin 不一樣的是,Crust 的儲存價格發現機制依賴於 DSM,節點和使用者會自動連線到去中心化儲存市場 (DSM),該市場會自動選擇在哪些節點上儲存使用者的資料。儲存價格是根據使用者需求(例如儲存持續時間 storage duration 、儲存空間 storage space、複製因子 replication factor)和網路因素(例如擁塞 congestion)確定的。當使用者提交儲存訂單時,資料將被髮送到網路上的多個節點,這些節點使用機器的可信執行環境 (TEE:Trusted Execution Environment) 拆分資料並雜湊碎片。由於 TEE 是一個封閉的硬體元件,即使硬體所有者也無法訪問,因此節點所有者無法自行重建檔案。
檔案儲存在節點上後,包含檔案雜湊的工作報告與節點的剩餘儲存一起釋出到 Crust 區塊鏈。從這裡確保資料隨時間儲存,網路定期請求隨機資料檢查:在 TEE 中,隨機 Merkle 樹雜湊與相關檔案片段一起被檢索,該檔案片段被解密並重新雜湊。然後將新雜湊與預期雜湊進行比較。這種儲存證明的實現稱為有意義的工作證明(MPoW:Meaningful Proof of Work)。
GPoS 是一種以儲存資源定義額度的 PoS 共識演算法。 通過第一層 MPoW 機制提供的工作量報告,Crust 鏈上可以獲得所有節點的儲存工作量,而第二層的 GPoS 演算法,就是根據節點工作量為每個節點計算一個 Staking 額度。再根據這個額度,進行 PoS 共識。即出塊獎勵跟每個節點的抵押量成正比,而每個節點的抵押量上限,則受到節點提供儲存量的限制。
3.3.3 Arweave
相比於前兩種定價模式,Arweave 使用非常不同的定價模型,核心在於,在 Arweave 上,所有儲存的資料都是永久的,其儲存價格取決於在網路上儲存資料 200 年的成本。
Arweave 資料網路的底層基於了 Bockweave 的區塊生成模式。典型的區塊鏈,如比特幣,是一條單鏈結構,即每個塊都將連結到鏈中的前一個區塊。而 blockweave 的網狀結構中,每個塊在前一個塊的基礎上,還將連結到區塊鏈先前歷史中的隨機回憶塊(recall block)。回憶塊由區塊歷史中前一個塊的雜湊值和前一個塊的高度的決定,這是一種具有確定性但不可預測的方式。當礦工想挖掘或驗證新塊時,礦工需有權利訪問召回塊的資訊。
Arweave 的 PoA 採用 RandomX 雜湊演算法,礦工的出塊概率 = 隨機召回區塊的概率 * 第一個找到雜湊的概率。礦工需要通過 PoW 機制找到合適的雜湊值來生成新區塊,但隨機數(Nounce)依賴於前一個區塊和任意隨機的回憶塊資訊。回憶塊的隨機性使得礦工被鼓勵儲存更多的區塊,由此獲得相對較高的計算成功率及出塊獎勵。PoA 也激勵礦工儲存“稀缺塊”,即他人沒有儲存的區塊,來獲得更大的出塊概率和獎勵。

當一次性收費即後續資料讀取為免費服務,可持續意味著使用者可隨時訪問資料,那如何長效激勵礦工願意零收入的提供資料讀取服務呢?

在 BitTorrent 的博弈論策略 “optimistic tit-for-tat algorithm“設計中,節點是樂觀的,將與其他節點合作,不合作的行為將受到懲罰。基於此,Arweave 設計了 Wildfire,一個隱性激勵措施的節點評分系統。Arweave 網路中的各個節點將根據接受資料量和反應速度對相鄰的各節點進行打分,節點將優先選擇排名較高的對等方傳送請求。節點排名越高,其信用度越高,出塊的概率也就越大,獲取稀缺區塊可能性也越大。
Wildfire 實際上是博弈,是高度可擴充套件的遊戲。節點間不存在“排名”共識,亦無義務報告排名的產生和確定,而節點間的”善惡“由自適應機制調節,以確定新行為出現的獎勵和懲罰。
3.3.4 Sia
與 Filecoin 和 Crust 一樣,儲存節點必須存入抵押品才能提供儲存服務。在 Sia 上,節點必須決定釋出多少抵押品:抵押品直接影響使用者的儲存價格,但同時釋出低抵押品意味著如果它們從網路中消失,節點也沒有任何損失。這些力量將節點推向平衡抵押品。
使用者通過自動儲存市場連線到儲存節點,其功能類似於 Filecoin:節點設定儲存價格,使用者根據目標價格和預期儲存時長設定預期價格。然後使用者和節點會自動相互連線。

在這幾個項目當中, Sia 的共識協議使用了最簡單的方式:儲存合同上鍊。在使用者和節點就儲存合同達成一致後,資金被鎖定在合同中,並使用擦除編碼將資料分割成片段,每個片段使用不同的加密金鑰進行單獨雜湊,然後每個片段被複制到幾個不同的節點上。記錄在 Sia 區塊鏈上的儲存合同記錄了協議條款以及資料的 Merkle 樹雜湊值。為了確保資料在預期的儲存時間內被儲存,儲存證明會定期提交給網路。這些儲存證明是基於隨機選擇的原始儲存檔案的一部分和記錄在區塊鏈上的檔案的 Merkle 樹的雜湊值列表而建立。節點在一段時間內提交的每一個儲存證明都會得到獎勵,最後在合約完成時得到獎勵。
在 Sia 上,儲存合同最長可以持續 90 天。要儲存超過 90 天的檔案,使用者必須使用 Sia 客戶端軟體手動連線到網路,以將合同再延長 90 天。Skynet 是 Sia 之上的另一層,類似於 Filecoins Web3.Storage 或 NFT.Storage 平臺,通過讓 Skynet 自己的客戶端軟體例項為使用者執行合同續期,為使用者自動完成這一過程。雖然這是一個變通辦法,但它不是一個 Sia 協議級別的解決方案。
3.3.5 Storj
在 Storj 去中心化儲存網路中,沒有區塊鏈或類似區塊鏈的結構。沒有區塊鏈也意味著該網路對其狀態沒有全網共識。相反,跟蹤資料儲存位置由衛星節點處理,資料儲存由儲存節點處理。衛星節點可以決定使用哪些儲存節點來儲存資料,儲存節點可以決定從哪些衛星節點接受儲存請求。
除了處理跨儲存節點的資料位置跟蹤外,衛星還負責儲存節點的儲存和頻寬使用的計費和支付。在這種安排下,儲存節點設定自己的價格,只要使用者願意支付這些價格,衛星就會將它們相互連線起來。

當使用者想要在 Storj 上儲存資料時,使用者必須選擇一個衛星節點來連線並共享其特定的儲存要求。衛星節點然後會挑選出滿足儲存需求的儲存節點,並將儲存節點與使用者連線起來。然後使用者直接將檔案傳輸到儲存節點,同時向衛星付款。然後,衛星每月為儲存的檔案和使用的頻寬支付儲存節點費用。
這樣的技術方案其實是非常中心化的,衛星節點的開發完全由項目方來定義,也意味著項目方掌握了定價權。雖然中心化的架構也為 Storj 帶來效能高效的服務,但正如開頭說到,分散式儲存並不一定等於去中心化。Storj 在以太坊上釋出的 ERC-20 代幣 Storj 也並沒有用到任何智慧合約的功能,其本質上只是提供了一種多樣的支付方式。
這和 Storj 的商業模式有很大關係,他們主打企業級的儲存服務,直接對標亞馬遜的 S3 服務,並與 Microsoft Azure 建立了合作伙伴關係,希望為企業提供各項效能指標都堪比、甚至超越亞馬遜儲存的服務。在效能資料未知的情況下,他們儲存的成本確實比亞馬遜要划算很多,一定程度上可以說明去中心化儲存的商業模式是能夠走得通的。
4. 不同技術路徑的影響
4.1 經濟模型
技術路徑的選擇也在一定程度上影響了代幣模型的設計。四個主要的去中心化儲存網路中的每一個都有自己的經濟模型。

Filecoin、Crust 和 Sia 都使用 Stake for Access(SFA)的代幣模型。在這種模式下,儲存提供商必須鎖定網路的本機資產才能接受儲存交易。鎖定的數量與儲存提供商可以儲存的資料量成比例。這就產生了一種情況,儲存提供商在儲存更多資料時必須增加其抵押品,從而增加對網路本地資產的需求。理論上,資產的價格應該隨著網路上儲存的資料量的增加而增加。
Arweave 則利用了一種獨特的捐贈代幣模型,其中每筆交易的一次性儲存費的很大一部分被新增到捐贈池中。隨著時間的推移,捐贈池中的代幣以儲存購買力的形式積累利息。隨著時間的推移,捐贈將分配給礦工,以確保資料在網路上的永續性。這種捐贈模式有效地長期鎖定了代幣:隨著 Arweave 上儲存需求的增加,更多的代幣被從流通中移除。
與其他三種網路相比,Storj的代幣模型是最簡單的。它的 token $STORJ 用作網路上儲存服務的支付手段,對於終端使用者和儲存提供商來說都是如此,所有其他網路也是如此。因此,$STORJ 的價格是對 $STORJ 服務需求的直接函式。
4.2 目標使用者
很難說某一個儲存網路在客觀上比另一個好。在設計去中心化儲存網路時,沒有單一的最佳解決方案。根據網路的目的及其試圖解決的問題,必須在技術設計、代幣經濟、社群建設等方面進行權衡。

Filecoin 主要面向企業和應用開發,提供冷儲存解決方案。它具有競爭力的價格和可訪問性,使其成為 Web2 實體為大量歸檔資料尋求經濟高效儲存的一種有吸引力的替代方案。
Crust 確保了過量冗餘和快速檢索,使其適用於高流量的 dApp 和流行 NFT 資料的高效檢索。然而,它缺乏持久冗餘嚴重影響了它提供永久儲存的能力。
Arweave 以其永久儲存的概念從其他去中心化儲存網路中脫穎而出,這在儲存 Web3 資料(如區塊鏈狀態資料和NFT)方面尤其流行。其他網路主要針對熱儲存或冷儲存進行優化。
Sia 瞄準了熱儲存市場,主要專注於尋求具有快速檢索時間的完全去中心化和私有儲存解決方案的開發人員。雖然它目前缺乏本地 AWS S3相容性,但像 Filebase 這樣的訪問層提供了這樣的服務。
Storj 似乎更全面,但犧牲了一些去中心化。Storj 顯著降低了 AWS 使用者的進入門檻,迎合了企業熱儲存優化的關鍵目標受眾。它提供與 AmazonS3 相容的雲端儲存。
5. 去中心化儲存的生態建設
在生態系統建設方面,我們主要可以討論兩個型別:第一類是上層 Dapps 完全建立在儲存網路上,旨在增強網路的功能和生態系統;其次,已有的去中心化應用和協議如 Opensea, AAVE 等選擇與特定的儲存網路整合,以變得更加去中心化。在本節中,我們將重點介紹 Filecoin、Arweave 和 Crust,因為 Sia 和 Storj 在生態系統方面沒有突出的表現。
5.1 Filecoin 生態

在 Filecoin 展示的生態系統中,已經有 115 個項目屬於上述第一類,這些項目都是完全基於Filecoin 的底層結構。可以觀察到,大多數項目都集中在通用儲存、NFT 和消費者儲存。Filecoin 生態系統中的另一個重要里程碑是 Filecoin 虛擬機器(FVM),它與以太坊虛擬機器(EVM)類似,提供了在智慧合約中部署和執行程式碼所需的環境。

有了 FVM,Filecoin 網路在現有儲存網路之上獲得了執行智慧合約的能力。在 FVM 中開發者不會對使用者的儲存資料進行程式設計,而是定義這些資料通過智慧合約(以去信任方式)儲存在該網路後,會如何自動或有條件進行相關運作。可以想像的場景如下:
基於 Filecoin 上儲存的資料進行分散式計算(在資料的儲存位置進行計算,而無需將其先移動)
眾籌式的資料集儲存計劃 - 如任何人都可以資助儲存一些對社會很重要的資料,如犯罪資料或環境變暖相關資料
智慧儲存市場 - 如根據每天不同時段、複製層級、在某區域內的可及性動態調整儲存費率)
數百年的儲存和永續的託管 - 如儲存資料,讓經歷幾代人都還能使用
資料DAO或token化資料集 - 如將資料的價值作為token建模並組建DAO以協調和交易在其之上進行的計算。
本地儲存的NFTs - 如與跟蹤NFT的註冊記錄一起協同定位NFT內容
時間鎖式資料取回 - 如只有在公司的記錄公開後才解鎖相關的資料集
抵押貸款(如向儲存提供者發放確定目的貸款,像是接納來自特定使用者的FIL+交易提議,或在確定時間視窗增加容量)

同時,從核心上來看,FVM 虛擬機器是基於 Webassembly(WASM) 的。這個選擇讓開發者能以任何可編譯為 WASM 的程式語言,來編寫原生的上層應用。此特性可以讓 Web3 開發者更容易上手,因為可以讓他們使用早已掌握的知識,繞過與特定語言相關的學習曲線。
開發人員還可以移植現有的以太坊智慧合約,只需對原始碼進行少量(甚至無需)更改。複用以太坊網路中經過審計和實戰檢驗的智慧合約的能力,使開發者可以節省開發成本和時間,而使用者也可以在風險最小的情況下享受其實用性。

另外值得一提的是Filecoin Plus,這是一個旨在補貼使用者以折扣價儲存大型、有價值的資料集的程式。想要將資料上傳到網路的客戶可以向社群中一組選定的名為公證人的成員申請,公證人審查並向客戶分配名為 DataCaps(資料配額)的資源。然後,客戶可以使用 DataCap 來補貼他們與儲存提供商的交易。
Filecoin Plus 計劃帶來了許多好處,使 Filecoin 網路更加活躍,有價值資料的儲存繼續產生區塊需求;客戶以極具競爭力的價格獲得更好的服務;隨著區塊獎勵的增加而上升,與 2021 年相比,2022 年 Filecoin Plus 推出後,儲存的資料將增加 18 倍。
5.2 Crust Network 生態
與 Filecoin 和 Arweave 相比,Crust 在生態系統建設方面有不同的路徑。它更偏向於直接與現有 Web3 應用程式合作並提供服務,而不是激勵第三方開發者在 Crust 上構建自己的生態系統應用。主要原因是 Crust 是建立在 Polkadot 上,雖然以太坊和 Cosmos 生態是在 Crust 項目方初期考慮過的選擇,但與它們技術路徑並不足夠相容。Crust 更喜歡 Polkadot 的 Substrate 框架,以提供的高度可定製的開發空間、鏈上升級和鏈上治理。

Crust 在開發者支援方面表現出色。它引入了 Crust 開發工具包,其中包括 js SDK、Github Actions、Shell Scripts 和 IPFS Scan,以滿足不同 Web3 項目的整合偏好。目前,開發工具包已整合到各種 Web3 項目中,如 Uniswap、AAVE、Polkadot Apps、Liquity、XX Messenger 和RMRK。
根據官方網站上提供的資料,目前有 150 多個項目與 Crust Network 整合。這些應用程式中有很大一部分(超過34%)是 DeFi 項目。這是因為 DeFi 項目通常對資料檢索有高效能要求。
如前所述,在 Crust Network 上,資料被複制到至少 20 個節點,在許多情況下,複製到 100 多個節點。雖然這確實需要更大的初始頻寬,但從多個節點同時檢索資料的能力加快了檔案檢索,並在出現故障或節點離開網路時提供了強大的冗餘。Crust Network 依賴於這種高水平的冗餘,因為它不像其他鏈那樣具有資料補充或修復機制。在這些去中心化的儲存網路中,Crust Network 是最年輕的。
5.3 Arweave 生態

如上圖所示,Arweave 也有一個強大的生態系統。其中重點標註了大約 30 個應用,它們完全基於Arweave 開發。儘管沒有 Filecoin 的 115 個應用程式那麼多,但這些應用程式仍然滿足使用者的基本需求,涵蓋了廣泛的領域,包括基礎設施、交易所、社交和 NFT 等。
特別值得注意的是建立在Arweave上的去中心化資料庫。Arweave 主要將其區塊組織用於資料儲存,同時在使用者端執行鏈外計算。因此,使用 Arweave 的成本僅由鏈上儲存的資料量決定。
這種計算與鏈的分離,被稱為基於儲存的共識正規化(SCP),解決了區塊鏈的可擴充套件性挑戰。SCP 在 Arweave 上是可行的,由於資料輸入儲存在鏈上,鏈下計算會可信地產生與鏈上計算相同的狀態。
SCP 的成功實施為 Arweave 上眾多資料庫的開發開啟了大門。在 Arweave 上構建的四個不同的資料庫:

● WeaveDB:作為 Arweave 上的智慧合約構建的鍵值資料庫,它使用白名單地址進行訪問控制邏輯。
● HollowDB:作為 Arweave 上的智慧合約構建的鍵值資料庫,它使用白名單地址和ZK證明來確保資料的可驗證性。ZK 證明也用於確保資料的可驗證性。
● Kwil: 一個 SQL 資料庫,執行自己的 P2P 節點網路,但使用 Arweave 作為儲存層。它使用公鑰/私鑰對進行訪問控制邏輯,並使用自己的共識機制進行資料驗證。
● Glacier:一個 NoSQL 資料庫,架構為 ZK-Rollup,使用 Arweave 作為其資料可用性層。它使用公鑰/私鑰對作為訪問控制邏輯,使用 ZK 證明作為資料可驗證性。
6. 增長驅動力
去中心化儲存的增長取決於幾個核心因素,根據其特點,這些因素可分為三大類:總體市場前景、技術和公眾意識。這些因素相互關聯,相互補充,可以進一步劃分為更細微的子類別。隨後的段落對每個因素進行了更詳細的細分。
6.1 市場前景
6.1.1 雲端儲存市場的潛力
隨著網際網路滲透到當代生活中,雲端儲存服務幾乎對每個人都至關重要。2022 年,全球雲端儲存市場達到了驚人的 786 億美元,增長軌跡沒有減弱的跡象。一項市場研究表明,到 2027 年,該行業的估值可能達到 1837.5 億美元。
與此同時,IDC 預計,到 2029年,雲端儲存市場的估值將達到 3760 億美元。IDC 的預測進一步說明了對資料儲存日益增長的需求,該預測預計到 2025 年,全球資料圈將擴充套件到 175 zettaytes。鑑於這些充滿希望的前景,可以得出這樣的結論:去中心化儲存作為 Web2 同類產品的替代品,將從整體市場增長中獲益,推動其走上上升軌道。

6.1.2 數字資產驅動力
作為 Web3 的關鍵基礎設施之一,去中心化儲存的增長與整個加密貨幣市場的擴張有著內在的聯絡。即使不考慮儲存需求的激增,如果數字資產的採用率繼續上升,去中心化儲存的市場規模也可能穩步增長。沒有權力下放的基礎設施,就無法實現真正的去中心化。加密貨幣採用率的增加可能標誌著公眾對去中心化的重要性有了更多的理解,從而推動了去中心化儲存的使用。
6.2 技術驅動力
6.2.1 基於雲端計算的產品和計算資源
資料的價值往往體現在它所提供的分析意義,這就需要進行資料計算。然而,在現有的去中心化儲存市場中,明顯缺乏成熟的基於計算的產品是大規模資料應用的一個重大阻礙。Bacalhau 和 Shale 等項目正在應對這一挑戰,並將其工作重點放在 Filecoin 上。其他值得注意的項目包括 Fluence 和 Space and Time,它們分別在開發人工智慧查詢系統和計算市場。隨著基於計算的產品的蓬勃發展,對計算資源的需求也將隨之增長。這種需求可以通過 $RNDR 的價格軌跡來略窺一二,這是一種面向需要額外計算能力的使用者的對等 GPU 計算網路。其今年迄今的業績增長了驚人的 500%,反映出投資者對需求增長的預期。隨著這些行業的成熟,生態系統變得更加全面,隨著使用者的湧入,去中心化儲存的採用將大幅增加。

6.2.2 去中心化物理基礎設施網路 (DePIN)

去中心化物理基礎設施網路(DePIN)是基於區塊鏈的網路,將現實世界的數字基礎設施整合到Web3生態系統中。DePIN 的關鍵領域包括儲存、計算、內容交付網路(CDN)和虛擬專用網路(VPN)。這些變革性網路尋求通過採用加密經濟激勵和區塊鏈技術來提高效率和伸縮性。

DePIN 的優勢在於其產生良性迴圈的潛力,包括三個重要組成部分。首先,協議採用token 經濟設計來激勵參與者,通常是通過 token 增強實際的應用程式和網路使用。隨著經濟模式的鞏固,代幣價格和協議使用量的飆升迅速引起了人們的關注,促進了使用者和資本的湧入。這種不斷增長的資本池和不斷擴大的使用者群吸引了更多的生態建設者和開發者進入該行業,使週期永久化。作為 DePIN 的核心賽道,儲存也將成為DePIN擴張的主要受益者之一。
6.2.3 人工智慧(AI)
人工智慧的快速發展有望催化加密生態系統的增長,加速數字資產各個領域的發展。人工智慧從兩個主要方面為去中心化儲存帶來激勵——通過刺激儲存需求和增強去中心化物理基礎設施網路(DePIN)的重要性。
隨著基於生成式 AI 的產品數量呈指數級增長,它們生成的資料也呈指數級增加。資料的激增刺激了對儲存解決方案的需求,從而推動了去中心化儲存市場的增長。
儘管 Generative AI 已經出現了顯著的增長,但預計它將繼續長期保持這種勢頭。根據EnterpriseAppsToday 的統計,到 2025 年,生成人工智慧將佔全球所有生成資料的 10%。此外,CAGR 預計生成式 AI 將以 36.10% 的複合年增長率增長,到2032年將達到 1886.2 億美元,這表明其巨大的潛力。

在過去的一年裡,生成式 AI 的受歡迎程度顯著提高,Google Trend 和 YouTube 搜尋就是明證。這一增長進一步突顯了人工智慧對去中心化儲存解決方案需求的積極影響。
人工智慧技術所需的儲存和計算資源激增凸顯了 DePIN 的價值。隨著 Web 2.0 基礎設施市場由中央實體控制的壟斷,DePIN 成為尋求具有成本效益的基礎設施和服務的使用者的一種有吸引力的替代方案。通過使資源的獲取民主化,DePIN 提供了顯著更低的成本,從而增加了採用率。隨著人工智慧繼續向上發展,其需求將進一步刺激 DePIN的增長。反過來,這有助於去中心化儲存行業的擴張。
6.2.4 Filecoin 虛擬機器 (FVM)
Filecoin 虛擬機器(FVM)不僅釋放了 Filecoin 本身的潛力,還徹底改變了整個去中心化儲存市場。由於 Filecoin 是最大的去中心化儲存提供商,佔據了很大一部分市場份額,其增長基本上與整個行業的擴張平行。FVM 的出現將 Filecoin 從一個資料儲存網路轉變為一個全面的去中心化資料經濟。除了實現永久儲存外,FVM 還將 DeFi 整合到生態系統中,從而產生更多的收益機會,並吸引更大的使用者群和資本流入該行業。

截至 6 月 22 日,FVM 上線 100 天時,Filecoin 網路上已經部署了 1100 多個支援 dApp的獨特智慧合約。此外,已經建立了 8 萬多個錢包,啟動了與這些 FVM 驅動的 dApp的互動。FVM 賬戶和合同的總餘額已超過 280 萬 FIL。目前,FVM 生態系統內的協議都與 DeFi 有關,增強了 $FIL 的效用。隨著這種上升趨勢的持續,我們預計將出現大量應用程式,這可能會在儲存市場引發另一輪增長浪潮。此外,我們還期待其他儲存網路引入類似 FVM 的虛擬機器機制,引發生態熱潮。例如,Crust Network 於 7 月 17 日正式推出了其 EVM 儲存,將 Crust 主網、Polkadot 和 EVM 合同相結合,構建了一個新的 Crust 協議,無縫地為任何 EVM 公鏈提供儲存服務。
6.2.5 基於去中心化資料庫的社交和遊戲
不論是遊戲還是社交應用,都需要一個去中心化的資料庫服務,該服務能夠抵抗審查並實現高速讀寫。去中心化的資料庫能夠增強當前的 Web3 應用程式,而且能夠支援在不同領域開發新的應用程式和體驗。
● 去中心化社交 - 通過將大量的社交資料儲存在去中心化資料庫中,使用者將對自己的資料擁有更大的控制權,能夠在平臺之間遷移,並釋放內容貨幣化的機會。
● 遊戲 - 管理和儲存玩家資料、遊戲內資產、使用者設定和其他遊戲相關資訊是基於區塊鏈的遊戲的一個重要方面。去中心化資料庫可以確保這些資料可以由其他應用程式和遊戲無縫交換和組合。當前 GameFi 領域的一個熱門話題是全鏈遊戲,這意味著將所有核心模組,包括靜態資源儲存、遊戲邏輯計算和資產管理,部署到區塊鏈上。具有高速讀寫功能的去中心化資料庫是實現這一願景的重要基礎設施。

遊戲和社交應用程式是網際網路使用者最多的行業,也是最有可能產生殺手級應用程式的行業,比如今年 2 月爆發的 Demus。我們相信,Web3 遊戲和社交應用的爆發也將帶來對去中心化資料庫的巨大需求。
6.3 公共意識
除了市場前景和技術之外,公眾意識是推動去中心化儲存市場增長的關鍵組成部分。中心化儲存和去中心化儲存的比較清楚地突出了後者的眾多優勢。然而,吸引更多使用者的能力取決於越來越多的人意識到這些好處。這可能是一個漫長的過程,需要整個行業的共同努力。從內容輸出到品牌曝光營銷,行業從業者必須努力傳達去中心化儲存如何徹底改變雲端儲存領域。這一努力補充了其他增長因素,放大了市場擴張和技術演變的影響。

7. 結論與展望
總體而言,去中心化儲存是一個技術挑戰巨大的基礎設施行業,投資週期長,但增長潛力巨大。
投資週期長主要是由於分散式技術的迭代週期本身就長,項目開發人員需要在去中心化和效率之間找到微妙的平衡。提供高效、高可用的資料儲存和檢索服務,同時確保資料隱私和所有權,無疑需要進行廣泛的探索。即使是 IPFS 也經常經歷不穩定的訪問情況,而像 Storj 這樣的其他項目也不夠去中心化。
該市場的潛在增長空間也備受期待。僅在 2012 年,AWS S3 就儲存了1萬億個物件。考慮到一個物件可能在 10 到 100 MB之間,這意味著僅 AWS S3 就使用了 10000 到100000 PB 的儲存空間。
根據 Messari 的資料,截至 2022 年底,最大的提供商 Filecoin 的儲存利用率僅為 3% 左右。這意味著 Filecoin 上只有大約 600 PB 的儲存空間被積極利用。顯然,去中心化儲存市場仍有很大的發展空間。
而隨著人工智慧 DePin 的興起,我們對去中心化儲存的未來保持著光明的前景,因為幾個關鍵的增長驅動因素將促進市場的擴張。
參考資料
宣告:本報告是由 @ChenxiL46898047 和 @BC082559,@GryphsisAcademy 的學員,在@Zou_Block 和 @CryptoScott_ETH 的指導下完成的原創作品。作者自行對所有內容負責,該內容並不必然反映 Gryphsis Academy 的觀點,也不必然反映委託撰寫報告的組織的觀點。編輯內容和決策不受讀者的影響。請知悉,作者可能擁有本報告中提到的加密貨幣。本檔案僅供資訊參考,不應作為投資決策的依據。強烈建議您進行自己的研究,並在進行投資決策之前諮詢中立的財務、稅務或法律顧問。請記住,任何資產的過去表現並不保證未來的回報。



