因经常发表尖锐批判性观点而被称为“山寨币杀手” 加密分析师 Eric Wal 在 X 平台上又对知名的 AI 概念币项目 Bittensor (TAO)发布严厉批判,几乎将这个项目说的一无是处。这个帖子已经吸引了 180多万曝光,4000多点赞收藏。
以下内容由 Followin 编译:
$TAO 代币的所谓“无用性”确实很惊人,现在这个“AI 币”竟然市值 100 亿美元了。
所以,TAO 到底有什么用?
TAO 的机制是运行一堆不同的子网。 子网是什么?
简单来讲,就是文字提示(text prompting)工具,这样就是很容易理解了。
接下来再具体讲,实际原理是什么?可以去查看这个官方文档(https://github.com/opentensor/prompting)
一个子网上的矿工运行 2 个不同的 LLM:Zephyr 和 wiki 代理。
但大多数情况下,他们都只运行基本模型 Zephyr(现在正在切换到 Solar 模型)。
整个原理很简单:
您发送提示词,然后由矿工运行的大模型(LLM)回复答案,就像 ChatGPT 一样。
矿工会因为回复答案而获得 TAO 代币奖励。 这就是 TAO 代币的诞生方式。
但这确实意味着,对于每一个提示词,实际上有一千名矿工将冗余地完成完全相同的任务。
然后,网络将通过检查它们彼此之间的相似程度来验证这些答案。 如果某个矿工给出的答案是异常值,就将不会获得 TAO 代币。
这里就有一个问题。例如你提供了一个提示:“什么是水?”
矿工们会回答“水是一种分子式为 H2O 的化合物”,并且他们都会被激励去学习相同的 LLM,因为如果只有你给出异常的回复,那么你就会被惩罚。
这样的结果就是一千个不同的矿工并行重复一千次一样的答案。
我们没有 AI 魔法可以验证一个模型是否真正有效运行。 没有什么可以阻止矿工互相复制回复并对其进行调整,相互欺骗。
这个验证机制本身非常基础:
在当前版本中,验证器会生成一个或多个参考答案,所有矿工的响应都会与这些参考答案进行比较。 那些与参考答案最相似的人将获得最高的奖励并最终获得最大的激励。
暂且不说可以多么容易进行欺骗操作,想想就知道这个系统的效率低得令人难以理解。 对于每个提示,你有 1000 名矿工在做同样的工作? 这样你就能达到“去中心化智能”的水平吗?
看看我的伙计们。 只要在坦桑尼亚放一个矿工就可以了。给个提示词。 如果它被关闭或认定输出错误数据,则转移到其他地方的另一个矿工。 如果你甚至无法防止他们复制和调整答案来伪造他们的工作,你不需要 1000 个不同的冗余 LLM 来并行运行这些基本的语言模型。
运行这些“去中心化”模型的目的是什么? Zephyr、Solar 和 wiki-agent 具有与 ChatGPT 相同类型的内容过滤器。 Zephyr 甚至接受了 ChatGPT 对话输出的训练。 因此,你有 1000 个矿工为你提供相同的底层答案,但效率比中心化矿工低 1000 倍,并且仍然无法验证是否生成了 1000 个单独的答案,因为你唯一要做的就是进行相似性检查 。
现在,这个戴着皇冠的垃圾事实上:您甚至无法以普通用户身份使用这个网络的提示。
不相信的话可以试试。 尝试以用户身份实际连接该网络,并从 1000 名矿工那里获得 Zephyr 生成的回复。
结果就是你不能做到。
这个子网中发生的事情都是内部进行的,验证器生成挑战提示,1000 个矿工生成相同的基本 LLM 响应并白撸 TAO 代币。
然后这些 TAO 代币被卖给这个FDV 市值 100 亿美元的散户白痴买家,他们试图通过购买这个狗屎 AI memecoin 来接触“去中心化 AI”。
如果让一个高中生去创造一个 AI 币项目,那么他几乎肯定就会想到 Bittensor (TAO)。 “呃,我可能只需要 1000 名矿工根据提示生成答案,所以这就像是,呃,去中心化了?”
“好吧,那你如何检查答案呢?你如何进行验证?”
“呃,也许这个网络可以检查,但也只是检查这些答案是否相似或是否是shit?”
这是一种毫无意义的去中心化训练,其目的只是模糊地类似于用“去中心化 AI”做一些事情,这当然是一个很酷的 meme,但它实际上并没有为你提供任何保证,也没有任何实用性,除了 效率低 1000 倍的只能回答自己的问题的 ChatGPT 机器人,这样它就有借口可以印刷代币,然后倾销给散户。
所以,fuck 它归零吧。
针对 TAO 的批评已经引发了大量关注和讨论,包括 Bittensor 创始人 @const_reborn。针对矿工之间共享参考答案的问题,Const 进行了反驳。他表示,
“验证器会生成一个或多个参考答案,所有矿工的响应都会与这些答案进行比较。”
值得注意的是,验证器首先检索文件来构建这些参考答案。 矿工没有这种额外的上下文,必须使用 RAG 才能获得正确的答案。
这创建了一个奖励最佳检索设计的激励系统。 冗余用于准确测量这一点,网络上的推理不会执行冗余查询。
对于那些了解机器学习的人来说,其设计非常深刻:一种与自动编码器同构的激励系统,或者说单向函数。
请注意,当验证者构建参考答案时,他们手头有实际的参考。 即您正在查看问题所涉及的特定文件。
另一方面,矿工需要从问题出发,弄清楚要检索哪些数据,然后编译答案。验证的不对称性迫使矿工在智能检索方面变得越来越好。奖励中的速度因素也迫使他们运行快速的基础设施来做到这一点。





