
作者:J1N,Techub News
前言
筆者今天分享的 Kuzco 是一個專門服務 LLM 大語言模型算力挖礦網絡,今年入選 a16z 在紐約啟動的 Crypto Startup Accelerator(CSX)秋季加速器計劃,被該計劃選中的項目會在 8 周內獲得 a16z 至少 50 萬美元的投資,並會得到 a16z 運營團隊的指導和支持。目前來說離該計劃結束大約剩 2 周時間。
Kuzco 項目還處於非常早期的階段,與 io.net 同屬於 GPU 算力網絡領域,但走的是不同的發展方向。而 io.net 因為有強大的資金支持和背景,已經比 Kuzco 更早完成了對用戶的空投,併成功上線了幣安、Coinbase、Bybit 等主流加密貨幣交易所,獲得了更大的市場曝光。
筆者更是親身參與了 io.net 的挖礦,老實說,整個過程就像是讓顯卡「躺著賺錢」,只需要把顯卡空掛著,它就自動給你生成收益,連電費都不怎麼花。每臺礦機每天耗電才 1.2 度,三個月總共才 10.8 美元電費。再加上二手顯卡的折舊費和上網工具的零頭,100 到 200 美元的成本輕輕鬆鬆搞定。最終獲得 4000 美元收益,怎麼看都覺得,這項目就像是左腳踩右腳螺旋上升的「空中樓閣」。
而後續代幣價格的下跌驗證了這一點。此外,筆者還編譯了一篇文章,標題是《價格暴跌 70%:AI 算力租賃泡沫是如何破滅的?》,這篇文章也進一步反映了 AI 算力市場中的泡沫。無論是租賃市場的價格還是項目代幣的下跌,都是市場在修正這些項目的真實價值,這種價格回調是符合市場規律的,說明未來可能會朝著更加理性的方向發展。
Kuzco 在挖礦機制上與之前的熱門項目 io.net 有顯著不同。io.net 是「空中樓閣」,依靠顯卡空掛就能輕鬆獲得數十倍的收益,背後支撐的實際價值並不明顯。而 Kuzco 則更為腳踏實地,且得到了 a16z 的支持。我花了幾周時間,認真測試了不同配置的礦機,包括單卡、多卡以及不同系統的搭建。通過這些實際操作,我將為大家分享這些實操經驗,讓大家瞭解一個為用戶提供實際價值的挖礦項目,而不是僅靠泡沫支撐的虛假繁榮。
專門服務 LLM 大語言模型算力挖礦網絡
Kuzco 是一個 Solana 生態的去中心化 GPU 網絡,旨在利用個人用戶的閒置 GPU 資源,為大型語言模型(如 Llama3、Mistral、Phi3)提供高效且廉價的算力服務。用戶可以通過與 OpenAI 兼容的 API 來使用這些模型。Kuzco 的分佈式架構能夠整合閒置的算力資源,實現大型語言模型的運行,同時通過獎勵機制激勵提供算力的礦工。
項目運營情況
截至 10 月 21 日,Kuzco 項目有 2000 臺在線 GPU 礦機,最高時曾達到 6000 臺。最常用的 GPU 型號包括 3090、3060 等。礦工目前獲得的是 KZO Point 獎勵,但這些積分還不能變現,同時項目也還沒有公佈代幣經濟模型。筆者推測,隨著 a16z 加速器計劃的推進,該項目未來可能會有更多新的進展和更新發布。
如何部署
官方硬件要求
Kuzco 項目可以在 Mac、Windows 和 Linux 操作系統上運行,支持多種不同的硬件配置。系統最低要求是 16GB 的運行內存、30GB 的可用磁盤空間和至少 10MB/s 的網絡帶寬。Kuzco 支持至少有 8GB 顯存的 NVIDIA(N 卡)和 AMD(A 卡)顯卡,普通用戶的 N 卡最低要求是 GTX750,而專業的算力顯卡大部分都支持。
不過,筆者不推薦使用 A 卡進行算力挖礦,因為 AMD 顯卡的兼容性較差,尤其是在 AI 任務中的表現不如 N 卡。如果你一定要用 A 卡,需要查看官方的兼容性支持列表。在 AI 領域,筆者必須說一句:AMD,NO!
筆者的五卡平臺,主板華子 Z490
筆者測試了幾款硬件的挖礦效率,但因為網絡波動,效率表現可能會有波動。
GTX1070:20 tok/s
RTX2060:30 tok/s
RTX2070S:40 tok/s
RTX3080: 80 tok/s
RTX4060Ti:50 tok/s
RTX4070S:70 tok/s
M2:20 tok/s
M3:30 tok/s
單位:Avager Tokens / Second (平均每秒完成的 Tokens 計算量)
實時監測礦機運行情況
部署方式
Kuzco 提供了客戶端應用,用戶可以下載並使用它來啟動挖礦,但這種方式有時不穩定,可能會掉線,並且不會自動重啟。筆者建議更穩定的做法是使用 Linux 系統或 Windows 的 WSL(Windows Subsystem for Linux)環境,通過命令行(CLI)或 Docker 容器來啟動挖礦。如果需要使用多張顯卡,可以在 Linux 中通過 Docker 容器指定某個 GPU 來進行多卡挖礦。例如要指定 GPU0:「docker run --rm --runtime=nvidia --gpus '"device=0"' -d kuzcoxyz/worker:latest --worker <workerid> --code <code>」,即可啟動多個 GPU
多卡挖礦時需要請注意以下硬件設備硬件層面:
電源:電源是關鍵,不能省錢。建議按照「1 人民幣 =1 瓦」的標準來購買,並儘量使用金牌電源。挖礦時根據顯卡的數量選擇 1500W 到 2000W 的電源,或者使用多個電源,但多個電源需要額外的啟動線連接主板才能正常供電。否則無法正常啟動。
功耗信息
線材:在高功耗的環境下,電源線容易損壞,所以筆者建議使用質量更好的電源線。另外,不同品牌的模塊電源使用的線材接口是不一樣的,不能通用。如果使用了不同品牌的線材,可能會導致設備損壞或燒燬。因此,線材必須與電源的品牌保持一致,確保兼容性。
電源線老化損壞
主板:主板的每個通道(不論 x1、x8、x16)只能支持一張顯卡。比如有幾個通道就能支持幾張顯卡。以太坊挖礦時期流行的 B85 主板是不錯的選擇。
筆者參與以太坊挖礦時留下的 B85 平臺,已報廢
CPU:因為需要同時處理多個任務,CPU 的線程越多越好。在使用 Docker 啟動挖礦時,初期會佔用大量的 CPU 資源。如果使用多張顯卡,必須按順序逐一啟動,否則系統可能會崩潰或卡死。
年輕人就要上 i9,沒有必要為了面子上 e5
顯卡:一個 Docker 進程大約佔用 6 GB 顯存(官方文檔寫 8 GB,實際上 6 GB 即可運行),如果顯卡有 12GB 顯存,你可以在一張顯卡上運行兩個 Docker 進程。挖礦時,顯卡的工作負載會佔用 50% 到 90%,並且顯卡的溫度應保持在 85 度以內,才是合理和安全的。
PCIE 轉接線:建議使用 x1 轉 x16 的 PCIE 轉接線,x1 插主板,x16 插顯卡。如果使用 40 系列顯卡,需要使用 x16 的延長線。
網絡連接質量:網絡連接質量會對挖礦效率產生很大影響。筆者測試發現,使用新加坡的網絡節點接收到的算力任務比香港節點更多,也就是說,選擇更好的網絡節點可以提高挖礦效率。
挖礦過程中如果出現故障情況,首先要檢查主板和軟件的運行狀況。如果問題出現在軟件層面,可以通過查看終端錯誤信息來判斷,可能是內存錯誤,需要重啟電腦;或者是因為官方文件更新,本地礦機未及時更新代碼導致,解決方法是更換節點或更新代碼。
運行錯誤
在硬件層面,如果礦機無法開機,首先檢查主板上的故障燈。以華碩主板為例,最常遇到的是 VGA 亮白燈,其表示顯卡電源有問題,遇到這種情況可以嘗試重新插拔 PCIE 和顯卡電源線。不過,有時白燈可能會亮起但機器依然正常運行。
總結
雖然筆者把 io.net 稱作「空中樓閣」,意指它的市值被嚴重高估,但它確實憑藉 10 億美元的估值成功融資了 4000 萬美元。然而,io.net 上線後,出現了很多仿盤,這些仿盤的產品和背後的資方都無法經受嚴格考證,說明 io.net 的成功並不是每個項目都能輕易複製的。
基於這個觀察,筆者一直在尋找一個更有實際價值的挖礦項目。最終,筆者發現了 Kuzco。Kuzco 首先得到了 a16z 的孵化和支持,這增加了其的可信度和潛力。其次,Kuzco 的挖礦機制實實在在通過 GPU 提供算力服務。
更重要的是,從宏觀角度來看,Kuzco 所在的領域,大型語言模型(LLM)是當前大眾使用最廣泛的 AI 產品,全球每天都有無數人在使用這些模型,而這些模型需要巨大的算力支持。筆者認為,為這樣龐大的需求提供算力,不僅非常有意義,而且具有實際的商業價值,因此,Kuzco 是一個值得關注的項目。
再就是參與 GPU 算力網絡的成本較低,特別是 40 系列顯卡在二手市場的價格穩定,折舊成本低,因此值得購買。不過,筆者提醒不要選擇租用顯卡,因為租卡的費用比買二手顯卡要高很多。同時,Kuzco 的空投激勵不明確,如果貿然大規模租卡會存在較高的風險。
並且礦機本身有很高的實用價值,不僅僅能用來挖 Kuzco ,還比直接投資高風險 Altcoin 更穩定可靠。由於礦機有很好的擴展性,除了挖 Kuzco 以外,還可以用來挖其他 GPU 項目,或者用它成為區塊鏈的節點驗證者,運行一些腳本和服務來增加更多的收益。這意味著即使不再挖 Kuzco,礦機依然可以繼續產生價值。
最後很多人問挖礦一天能獲得多少收益,這個問題沒有明確的答案,除了項目方,沒人能準確知道最終的收益是多少。挖礦的回報有很大的不確定性,可能會有很高的收益,也可能低於預期,所以無法提前確定具體能賺多少錢。