SeeDAO | 零知識機器學習（ZKML）簡介

05-21

零知識機器學習（Zero-knowledge machine learning，簡稱 ZKML）是最近在密碼學領域引起轟動的研發方向。但它是什麼呢？以及為什麼它是有用的？首先，將這個術語拆成兩份，零知識（ZK）和機器學習（ML），並分別解釋它們是什麼。

零知識證明是一類密碼學協議。其中一方（證明者）可以向另一方（驗證者）證明一個給定的命題是真實的，而不洩露任何額外的信息。這一領域在研究、協議實現和應用等多個方面都取得了重大進展。

零知識的兩種主要“原語”（組件）能為一組給定的計算創建計算完整性證明，驗證該證明比執行計算本身要容易得多（我們稱之為“簡潔性”）。零知識證明還提供了這樣的可能性：在保證計算正確性的同時隱藏部分計算過程（我們稱之為 "零知識"）。

生成零知識證明的計算量很大，比原始計算高數倍。這意味著對於某些計算，生成零知識證明是不可行的，因為在最好的硬件上也需要花費不切實際的時間。然而，近年來密碼學、硬件和分佈式系統領域的進展使得更密集的零知識證明計算變得可行。這些進步讓構建使用密集計算證明的協議成為可能，從而擴大了新應用的設計空間。

零知識密碼學是 Web3 最流行的技術之一，因為它允許開發人員構建可擴展的和私密的應用程序。隨著零知識技術不斷成熟，很可能會出現新應用的寒武紀大爆發，因為構建零知識應用的工具所需的領域專業知識會更少，且開發者使用會更加容易。以下是一些實際應用案例（許多項目正在開發中，尚未完成）。

ZK rollup 為以太坊擴容

公鏈這樣的分佈式系統的計算能力有限，因為所有參與的節點（計算機）都必須自行驗證每個區塊中的計算。在使用 ZK 證明後，我們可以在鏈下執行這些計算並生成 ZK 證明，然後在鏈上驗證證明，從而在不犧牲去中心化和安全性的前提下實現可擴展性。示例應用：

• Starknet 已上線主網，採用其獨創的 ZK-STARK 證明系統。與 ZK-SNARK 相比，ZK-STARK 更安全，能夠抵抗來自量子計算機的攻擊，且在系統初始設定時無需可信設置；ZK-STARK 開銷更大，證明大小和時間較長，當交易數量變多時，平均每個交易的開銷會變小。

• Scroll 測試網階段，致力於創建一個 EVM（以太坊虛擬機）等效的 ZK rollup，與其他以太坊 L2 擴容方案相比，它與 EVM 的兼容性更好。

• Polygon zkEVM 已上線主網，是以太坊 L2 擴容方案之一，基於 ZK-STARK 開發。Polygon Miden 正在開發中，目標是高吞吐量的隱私公鏈。

• zkSync 已上線主網，目前是最活躍的零知識證明 L2 區塊鏈，當前採用 ZK-SNARK 證明系統，後續將遷移到 ZK-STARK。

構建隱私保護應用

零知識證明的特性使得證明過程中的部分計算可以隱藏起來，這對於構建創建加密證明以保護用戶隱私和個人數據的應用程序非常有用。示例應用：

• Semaphore

• MACI

• Penumbra

• Aztec Network 為以太坊構建一個私有擴容解決方案（ZK Rollup），其中用戶的餘額和交易對外部觀察者是完全隱藏的。

身份和數據證明

WorldID Worldcoin 正在構建 WorldID，這是一種隱私保護的人格證明協議。它允許擁有 WorldID 的任何人發佈加密聲明，表明他們是獨特的人類，並且在不透露其身份的情況下尚未執行過任何操作（如註冊社交網絡）。

• Sismo

• Clique

• Axiom

L1 區塊鏈

由於零知識證明可以幫助外包計算並保證計算的隱私性，因此可以創建隱私/簡潔（證明規模小，易於驗證）的 L1 區塊鏈。示例應用:

• Zcash

• Mina

機器學習是人工智能的一個子領域，它涉及到算法的開發和應用，這些算法讓計算機可以從數據中自行學習和調整，並通過不斷迭代優化其性能。大語言模型，如 GPT-4 和 Bard，是最先進的自然語言處理系統，利用海量的訓練數據生成類似人類的文本，而文生圖模型，如 DALL-E 2、Midjourney 和 Stable Diffusion，可以將文本描述轉換為逼真的視覺表達。機器學習技術的快速進步有望解決醫療、金融、交通等各個領域的複雜挑戰，通過利用數據驅動的洞察和預測，改進決策制定並優化結果。隨著這些模型變得更加複雜，它們有望徹底改變許多行業，改變我們生活、工作和與技術互動的方式。

在人工智能生成的內容越來越像人類創建的內容的世界中，零知識密碼學的潛在應用可以幫助我們確定，某一特定內容是通過對特定輸入應用特定模型產生的。如果為大語言模型（如 GPT4）、文生圖模型（如 DALL-E 2）或任何其他模型創建了零知識電路，就能驗證這些模型的輸出。在有需要時，這些證明的零知識屬性也將允許我們隱藏輸入或模型的某些部分。一個很好的例子是在某些敏感數據上應用機器學習模型，用戶在不向任何第三方透露其輸入的情況下，得到模型的推理結果（例如在醫療行業中）。

注意：當我們談論零知識機器學習時，我們指的是為機器學習模型的推理步驟創建零知識證明，而不是訓練步驟（訓練本身就已經需要大量計算資源）。

目前的最先進的零知識系統配合高性能硬件，與證明目前可用的大語言模型（"LLMs"）的能力相比，仍有幾個數量級的差距，但在證明較小模型方面已經有了一些進展。

關於創建機器學習模型的證明，我們研究了最先進的零知識密碼學，並彙集了相關研究、文章、應用和代碼庫。關於零知識機器學習的資源可以在 GitHub 上 ZKML 社區的 awesome-zkml 代碼庫中找到。

Modulus Labs 團隊最近發佈了一篇名為 “智能的代價” 的論文，他們在論文中針對各種不同規模的模型對現有的零知識證明系統進行了基準測試。目前，使用 plonky2 這樣的證明系統，在一臺功能強大的 AWS 機器上運行約 50 秒鐘，就可以為大約 1800 萬個參數的模型創建證明。下圖展示了隨著神經網絡參數數量的增加，不同證明系統的運行時間差異：

來源：智能的代價：用零知識證明機器學習推理 Modulus Labs

Zkonduit 的 ezkl 庫是另一項致力於改善零知識機器學習系統的計劃，它允許您為使用 ONNX 導出的機器學習模型創建零知識證明。這使任何機器學習工程師都能為其模型的推理步驟創建零知識證明，並向任何驗證者證明輸出結果。

有幾個團隊正在努力改進零知識技術，優化硬件以加快零知識證明的計算速度，尤其是對於證明者和驗證者算法等資源密集型任務。隨著零知識技術的成熟，由於專用硬件、證明系統架構（證明大小、驗證時間、證明生成時間等）的改進以及性能更強的零知識協議實現，我們將有可能在更短的時間內，在性能更弱的機器上，證明更大的模型。我們希望這些進步能帶來新的零知識機器學習應用和用例。

為了確定零知識機器學習是否適用於特定應用程序，我們可以用韋恩圖比對零知識密碼學的特性與用例需求。

解釋如何將 ZK 和 ML 及其他技術結合在一起的韋恩圖

啟發式算法：利用經驗法則或 "啟發式"方法為傳統優化方法難以解決的問題找到好的解決方案。啟發式優化方法不是試圖找到問題的最優解，而是根據問題對整個系統的相對重要性和優化難度，在合理的時間內找到好的或 "足夠好"的解決方案。

全同態加密機器學習：全同態加密允許開發者在加密數據上執行計算，解密後的結果將是對原始未加密輸入執行計算的輸出結果。它能以保護隱私的方式執行模型推理（完全的數據隱私，不像零知識機器學習，證明者需要訪問所有數據）；但是，它無法像零知識證明那樣，以密碼學的方式證明所執行計算的正確性。例如，Zama 團隊正在創建一個名為 Concrete ML 的全同態加密機器學習框架。

零知識證明 vs. 有效性證明：這兩個術語在業內經常交替使用，因為有效性證明是不隱藏部分計算或其結果的零知識證明。就零知識機器學習而言，當前大多數應用都在利用零知識證明的有效性證明方面。

有效機器學習：機器學習模型的 SNARK/STARK 證明，其中所有計算對驗證者都是公開可見的。任何驗證者都可以證明機器學習模型的計算正確性。

零知識機器學習：機器學習模型的零知識證明，其中的計算對驗證者是隱藏的（使用零知識屬性）。證明者可以證明機器學習模型的計算正確性，而無需透露任何其他信息。

具體用例

計算完整性（有效機器學習）

有效性證明（SNARKs/STARKs）可用於證明某些計算的正確性，在機器學習的語境中，我們是在證明機器學習模型推理或某個模型使用特定輸入創建了某些輸出。

例如，專注於零知識機器學習的初創公司 Modulus Labs 正在構建這些用例：

• 鏈上可驗證的機器學習交易機器人 RockyBot

• 自我進化的區塊鏈（示例）：

• 為 Lyra finance 期權自動做市商協議添加智能功能

為 Astraly（零知識預言機）創建透明的基於人工智能的聲譽系統

• 為 Aztec Protocol（具有隱私功能的 zk-rollup）• 研究技術突破，以實現基於機器學習的合約級別合規工具

能夠輕鬆證明和驗證輸出是由給定模型和輸入產生的。這使得機器學習模型可以鏈下運行在專用硬件上，其零知識證明也可以在鏈上輕鬆驗證。例如，Giza 正在幫助 Yearn（DeFi 收益聚合協議）證明一些使用機器學習的複雜收益策略正在鏈上正確運行。

機器學習即服務（MLaaS）透明性

當不同的公司通過其應用程序接口（API）提供機器學習模型服務時，作為用戶確實很難知道服務提供商是否真的提供了他們所說的模型，因為應用程序接口（API）是一個黑盒子。附帶有效性證明的機器學習模型 API 將有助於向用戶提供透明性，因為用戶可以驗證他們使用的是哪個模型。

零知識異常及欺詐檢測

創建可利用性或欺詐的零知識證明。異常檢測模型可以在智能合約數據上進行訓練，並通過去中心化自治組織（DAO）協定作為有趣的指標，以便能夠自動執行安全程序，例如更為積極、預防性地暫停合約運行。有一些初創公司正在研究在智能合約上使用機器學習模型進行安全分析，下一步可能會是零知識異常檢測證明。

隱私（零知識機器學習）

除了有效性證明外，我們還可以隱藏部分計算細節，以便支持隱私保護的機器學習應用。下面是幾個例子：

• 去中心化 Kaggle：在不透露模型權重的情況下，證明模型在某些測試數據上的準確率大於 x%。

• 隱私保護的模型推理：將病人私人數據的醫療診斷結果輸入模型，並將敏感的模型推理（如癌症檢測結果）發送給病人。（來源：vCNN 論文，第 2/16 頁）

• Worldcoin

零知識機器學習在 Worldcoin 的潛在用例

零知識機器學習在 Worldcoin 中的一個潛在用途是可升級的虹膜代碼。World ID 用戶可以在其移動設備的加密存儲中自行保管其簽名的生物識別信息，下載用於生成虹膜代碼的機器學習模型，並在本地創建零知識證明，證明其虹膜代碼確實是使用正確的模型從簽名圖像中生成的。由於智能合約能夠驗證零知識證明並證明虹膜代碼的生成，因此該虹膜代碼可以無許可地插入到已註冊的 Worldcoin 用戶集合。這就意味著，如果 Worldcoin 升級了創建虹膜代碼的算法，從而破壞了與之前迭代版本的兼容性，那麼用戶就不必重新使用 Orb（虹膜掃描的專用設備），而只需在本地設備上進行升級即可。

作者｜worldcoin

翻譯｜Backdoor

校對｜Johnny Jiang

排版｜Bo

審核｜Bo

原文鏈接👇

https://worldcoin.org/blog/engineering/intro-to-zkml

SeeDAO 是一個基於區塊鏈的數字城邦，其表現形態為去中心化的數字網絡（SeeDAO Network) 和映射在全球各地的物理據點（Seeshore）由 SeeDAO 成員共建、共治、共享。目前已形成翻譯公會、投研公會、研發公會等多個公會，一萬餘名成員。旨在從教育、信息、活動等多方面助力優質 Web3 項目的誕生。

官網：https://seedao.xyz

中文 Twitter ：https://twitter.com/see_dao

Global Twitter : https://twitter.com/en_SeeDAO

Discord ：https://discord.com/invite/seedao-xyz

Notion ：https://seedao.notion.site

Mirror: https://seedao.mirror.xyz

電報：https://t.me/theseedao

添加小助手微信進入 SeeDAO 新手營：seedao2023

Mirror

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論