因經常發表尖銳批判性觀點而被稱為“山寨幣殺手” 加密分析師 Eric Wal 在 X 平臺上又對知名的 AI 概念幣項目 Bittensor (TAO)發佈嚴厲批判,幾乎將這個項目說的一無是處。這個帖子已經吸引了 180多萬曝光,4000多點贊收藏。
以下內容由 Followin 編譯:
$TAO 代幣的所謂“無用性”確實很驚人,現在這個“AI 幣”竟然市值 100 億美元了。
所以,TAO 到底有什麼用?
TAO 的機制是運行一堆不同的子網。 子網是什麼?
簡單來講,就是文字提示(text prompting)工具,這樣就是很容易理解了。
接下來再具體講,實際原理是什麼?可以去查看這個官方文檔(https://github.com/opentensor/prompting)
一個子網上的礦工運行 2 個不同的 LLM:Zephyr 和 wiki 代理。
但大多數情況下,他們都只運行基本模型 Zephyr(現在正在切換到 Solar 模型)。
整個原理很簡單:
您發送提示詞,然後由礦工運行的大模型(LLM)回覆答案,就像 ChatGPT 一樣。
礦工會因為回覆答案而獲得 TAO 代幣獎勵。 這就是 TAO 代幣的誕生方式。
但這確實意味著,對於每一個提示詞,實際上有一千名礦工將冗餘地完成完全相同的任務。
然後,網絡將通過檢查它們彼此之間的相似程度來驗證這些答案。 如果某個礦工給出的答案是異常值,就將不會獲得 TAO 代幣。
這裡就有一個問題。例如你提供了一個提示:“什麼是水?”
礦工們會回答“水是一種分子式為 H2O 的化合物”,並且他們都會被激勵去學習相同的 LLM,因為如果只有你給出異常的回覆,那麼你就會被懲罰。
這樣的結果就是一千個不同的礦工並行重複一千次一樣的答案。
我們沒有 AI 魔法可以驗證一個模型是否真正有效運行。 沒有什麼可以阻止礦工互相複製回覆並對其進行調整,相互欺騙。
這個驗證機制本身非常基礎:
在當前版本中,驗證器會生成一個或多個參考答案,所有礦工的響應都會與這些參考答案進行比較。 那些與參考答案最相似的人將獲得最高的獎勵並最終獲得最大的激勵。
暫且不說可以多麼容易進行欺騙操作,想想就知道這個系統的效率低得令人難以理解。 對於每個提示,你有 1000 名礦工在做同樣的工作? 這樣你就能達到“去中心化智能”的水平嗎?
看看我的夥計們。 只要在坦桑尼亞放一個礦工就可以了。給個提示詞。 如果它被關閉或認定輸出錯誤數據,則轉移到其他地方的另一個礦工。 如果你甚至無法防止他們複製和調整答案來偽造他們的工作,你不需要 1000 個不同的冗餘 LLM 來並行運行這些基本的語言模型。
運行這些“去中心化”模型的目的是什麼? Zephyr、Solar 和 wiki-agent 具有與 ChatGPT 相同類型的內容過濾器。 Zephyr 甚至接受了 ChatGPT 對話輸出的訓練。 因此,你有 1000 個礦工為你提供相同的底層答案,但效率比中心化礦工低 1000 倍,並且仍然無法驗證是否生成了 1000 個單獨的答案,因為你唯一要做的就是進行相似性檢查 。
現在,這個戴著皇冠的垃圾事實上:您甚至無法以普通用戶身份使用這個網絡的提示。
不相信的話可以試試。 嘗試以用戶身份實際連接該網絡,並從 1000 名礦工那裡獲得 Zephyr 生成的回覆。
結果就是你不能做到。
這個子網中發生的事情都是內部進行的,驗證器生成挑戰提示,1000 個礦工生成相同的基本 LLM 響應並白擼 TAO 代幣。
然後這些 TAO 代幣被賣給這個FDV 市值 100 億美元的散戶白痴買家,他們試圖通過購買這個狗屎 AI memecoin 來接觸“去中心化 AI”。
如果讓一個高中生去創造一個 AI 幣項目,那麼他幾乎肯定就會想到 Bittensor (TAO)。 “呃,我可能只需要 1000 名礦工根據提示生成答案,所以這就像是,呃,去中心化了?”
“好吧,那你如何檢查答案呢?你如何進行驗證?”
“呃,也許這個網絡可以檢查,但也只是檢查這些答案是否相似或是否是shit?”
這是一種毫無意義的去中心化訓練,其目的只是模糊地類似於用“去中心化 AI”做一些事情,這當然是一個很酷的 meme,但它實際上並沒有為你提供任何保證,也沒有任何實用性,除了 效率低 1000 倍的只能回答自己的問題的 ChatGPT 機器人,這樣它就有藉口可以印刷代幣,然後傾銷給散戶。
所以,fuck 它歸零吧。
針對 TAO 的批評已經引發了大量關注和討論,包括 Bittensor 創始人 @const_reborn。針對礦工之間共享參考答案的問題,Const 進行了反駁。他表示,
“驗證器會生成一個或多個參考答案,所有礦工的響應都會與這些答案進行比較。”
值得注意的是,驗證器首先檢索文件來構建這些參考答案。 礦工沒有這種額外的上下文,必須使用 RAG 才能獲得正確的答案。
這創建了一個獎勵最佳檢索設計的激勵系統。 冗餘用於準確測量這一點,網絡上的推理不會執行冗餘查詢。
對於那些瞭解機器學習的人來說,其設計非常深刻:一種與自動編碼器同構的激勵系統,或者說單向函數。
請注意,當驗證者構建參考答案時,他們手頭有實際的參考。 即您正在查看問題所涉及的特定文件。
另一方面,礦工需要從問題出發,弄清楚要檢索哪些數據,然後編譯答案。驗證的不對稱性迫使礦工在智能檢索方面變得越來越好。獎勵中的速度因素也迫使他們運行快速的基礎設施來做到這一點。





