Tether推出了一款去中心化的本地人工智慧，其技术源自于艾萨克·阿西莫夫的《基地》系列小说中的心理史学。

Cryptoslate

05-11

本文为机器翻译

展示原文

Tether的第二项储备资产是情报

Tether 的 QVAC 项目以一个对于稳定币公司来说不同寻常的短语开篇。该公司将“QVAC Psy”描述为一系列“植根于心理史学原理”的基础模型。

心理史学指的是艾萨克·阿西莫夫的《基地》系列小说，其中哈里·谢顿运用数学、统计学和社会动力学来预测庞大人口的行为，并缩短银河帝国崩溃后的黑暗时代。

《科幻百科全书》将阿西莫夫的心理史学描述为“虚构的科学”，而谢登的作品则是一个预测未来事件并通过系统崩溃来保存知识的计划。

Tether 的宣传语就像是用科幻语言包裹的使命宣言。该公司通过将储备金、流动性和分销渠道转化为货币基础设施，打造了加密货币领域最大的稳定币。

QVAC 将同样的理念应用于智能领域。Tether 的首要储备资产仍然是USDT的核心——类似美元的负债。其第二项储备资产正在转变为计算能力、模型、数据集以及在中心化云之外运行人工智能的能力。

从美元储备到情报储备

USDT进军人工智能领域的运作机制与其核心业务一脉相承。USDT将对离岸美元的需求转化为以短期主权债券为主的储备资产组合。

Tether在其 2026 年第一季度业绩更新报告中披露，净利润为 10.4 亿美元，储备缓冲为 82.3 亿美元，代币相关负债约为 1830 亿美元，直接和间接持有的美国国债约为 1410 亿美元。该储备基础使其能够……

利用运营实力，将经常性收入、资产负债表容量和为长期基础设施投资提供资金的空间Tether。

CryptoSlate 此前已追踪到这种储备引擎如何将稳定币的规模转化为战略配置。今年 1 月，Tether 购入 8,888 枚BTC，表明利息收入和运营利润可以转化为持续的比特币需求。QVAC 将同样的逻辑应用于不同的资产类别。

除了比特币、黄金、初创企业、能源、挖矿、通信和其他基础设施投资外， Tether还将资金投入到智能领域本身。此举拓展了该公司的自我定位，使其从私人美元流动性发行者转变为私人数字基础设施的构建者。

“心理史学”这一术语契合了这一方向，因为Tether将人工智能视为文明层面而非软件垂直领域。QVAC的公开资料描述了一个“无限稳定智能平台”，这是一个面向“去中心化思维”的本地优先系统，也是对集中式人工智能的一种回应。

QVAC 的愿景页面认为，将所有想法都通过集中式服务器进行路由太慢、太脆弱、太受控制，然后将 QVAC 定位为用户所拥有的智能的边缘原生基础。

这种框架与Tether更广泛的稳定币理念相呼应。资金流动无需许可。数据应保留在用户手中。智能应用应在用户所在之处运行。

阿西莫夫的引述背后隐藏着一个严肃的论点。Tether的意思是，当人工智能像具有弹性的基础设施一样运作时，它会变得更加持久耐用。

云模式功能更强大，但也存在提供商风险、定价风险、策略风险、延迟风险等。

QVAC 是一个基于不同种族构建的边缘堆栈。

QVAC 的关键区别在于架构。OpenAI、Anthropic、Google DeepMind 和 xAI 在最大通用能力、编码、多模态、长上下文推理、智能体行为和企业云分发等方面展开竞争。

QVAC 的目标是从不同的角度出发：可部署性、隐私性、延迟性、可组合性以及在单一提供商之外的生存能力。

QVAC 的欢迎文档将该项目定义为一个开源、跨平台的生态系统，支持在 Linux、macOS、Windows、Android 和 iOS 等平台上运行本地优先的 P2P 人工智能应用。该文档还指出，用户可以在本地运行逻辑语言模型 (LLM)、执行语音识别和检索增强生成，以及处理其他人工智能任务，也可以通过内置的 P2P 功能将推理任务委托给其他用户。

这使得 QVAC 与 Frontier Labs 的基准有所不同。Frontier AI 优化的是集中式服务所能提供的最强通用模型。而 QVAC 则优化推理发生的位置、运行时的控制者、哪些数据会离开设备，以及当集中式服务不可用时应用程序是否能够继续运行。

Tether 于 2026 年 4 月推出的 SDK 描述了一个统一的开发工具包，该工具包允许开发人员在任何设备上构建、运行和微调 AI，应用程序旨在跨 iOS、Android、Windows、macOS 和 Linux 不变地运行。

它还表示，QVAC SDK 使用统一的抽象层来处理本地推理引擎，包括 QVAC Fabric（llama.cpp 的一个分支），以及与 whisper.cpp、Parakeet 和 Bergamot 的集成，用于语音和翻译。

这更接近于一个操作层，而非单一模型的发布。开源人工智能生态系统已经拥有许多强大的组件：Llama、Qwen、Mistral、Gemma、DeepSeek、Hugging Face、llama.cpp、Ollama、vLLM、LM Studio，以及大量本地推理项目。

QVAC 认为，开发者需要一个连贯的边缘框架，通过一个接口将模型加载、推理、语音、OCR、翻译、图像生成、RAG、P2P 模型分发、委托推理和本地微调连接起来。

QVAC 将自身定位为情报分发层，并假设足够好的本地模型将继续改进。

QVAC Fabric 是这一论断的技术核心。TetherTether，Fabric 通过 Vulkan 和 Metal 后端支持对现代消费级硬件进行微调，包括搭载高通 Adreno 或 ARM Mali GPU 的 Android 设备、Apple Silicon 设备以及配备 AMD、Intel 或 NVIDIA 硬件的标准 Windows 或 Linux 系统。

它还描述了针对移动 GPU 内存限制的动态分块，以及具有 GPU 加速和掩码损失指令调整的 LoRA 工作流程。

如果这种工作流程在外部开发人员的使用中也适用，那么它与典型的开源模型发布方式之间的区别就变得至关重要了。模型权重是一层，本地化适配则是下一层。

MedPsy是QVAC的第一个硬性测试。

MedPsy 为 QVAC 提供了首个具体的模型级验证点。5 月 7 日发布的 Hugging Face 技术报告将 QVAC MedPsy 描述为一系列纯文本医疗和保健语言模型，专为边缘部署而构建，参数量分别为 17 亿和 40 亿。

该主张简单明了且雄心勃勃：通过严格控制的医学后训练流程训练的小型模型，可以超越大型医学基线，同时保持适用于笔记本电脑、高端移动设备和智能手机级应用程序的实用性。

数据是争论的核心。QVAC 表示，MedPsy-1.7B 在七项封闭式医疗基准测试中得分 62.62，高于谷歌的 MedGemma-1.5-4B-it（得分 51.20），尽管其规模不到 MedGemma-1.5-4B-it 的一半。

报告还指出，MedPsy-4B 的得分为 70.54，略高于 MedGemma-27B-text-it 的 69.95，而其体积却小了近七倍。

QVAC 报告称，在 HealthBench 和 HealthBench Hard 上，差距更大，MedPsy-4B 的得分分别为 74.00 和 58.00，而 MedGemma-27B-text-it 的得分分别为 65.00 和 42.67（根据报告中显示的 CompassJudger 评估）。

如果这些结果能够被独立地重复验证，将支持 QVAC 的核心论点：特定领域的边缘尺度模型可以在受限的高价值类别中挑战更大的系统。

训练方案还展示了QVAC的竞争策略。报告指出，MedPsy采用Qwen3骨干网络，并将多阶段监督式微调和强化学习应用于医疗质量保证任务。

实验过程中，该模型生成了超过3000万行合成文本，采用了两阶段课程体系，并选择百川M3-235B作为长篇推理监督的单一教师模型。QVAC还指出，训练语料库尚未发布。这一说明至关重要。

目前最有力的公开基准声明仍然来自 QVAC 本身，而要全面调查污染、覆盖范围、快速建设和教师影响所需的培训数据仍然不可用。

量化过程中边缘角度变得更加锐利。QVAC 表示，他们已发布了适用于 llama.cpp 和 QVAC SDK 的 GGUF 变体，其中 Q4_K_M 可将文件大小减少 69%，而两种 MedPsy 尺寸的平均得分损失均不到 1 分。

该报告建议使用 Q4_K_M 并进行 imatrix 校准，以兼顾大小和质量：4B 型号为 2.72 GB，1.7B 型号为 1.28 GB。QVAC 型号的常见问题解答还警告说，MedPsy 仅支持文本和英语，不适用于紧急情况，容易产生幻觉，并且依赖于开发人员在整个应用程序架构中保护隐私。这为技术中心提供了合适的框架。

MedPsy之所以前景广阔，是因为医学界有充分的理由倾向于局部推断。但只有外部研究人员复现基准测试流程并在真实的临床工作流程约束下进行测试，才能最终证实其有效性。

这场悬而未决的斗争是便利与控制之间的较量。

本地人工智能与云端人工智能之争通常被定义为隐私与性能之间的权衡。QVAC 则将其重新定义为便捷性与控制力之间的较量。云端人工智能的优势在于便捷性。用户只需打开应用，发送请求，即可收到答案，无需承担模型权重、设备内存、量化、嵌入或运行时兼容性等操作负担。

服务提供商承担了所有复杂性。这种便利性非常强大，也解释了为什么集中式人工智能平台能够如此迅速地扩展。用户只需极少的设置即可获得前沿功能。

QVAC 要求开发者和用户承担更多责任，以换取不同的安全模型。其回报包括本地执行、离线操作、减少数据暴露、降低对 API 访问的依赖，以及实现点对点推理和模型分发。

Tether 的 SDK 发布会上表示，基于 QVAC 的应用程序即使在网络连接不佳的环境下也能继续运行，“即使网络中断，AI 也能继续工作”。其 2025 年 QVAC 发布会更进一步，描述了 AI 代理直接在本地设备上运行、用于设备间协作的点对点网络，以及 WDK 集成，这将使 AI 代理能够使用比特币和USDT进行交易。

这就是Tether 的完整论点：金钱、计算和自主代理应该共享相同的主权设计模式。

去中心化的说法需要仔细斟酌。QVAC在推理层真正实现了去中心化，用户可以下载模型、在本地运行，并将敏感数据保存在设备上。

它比托管式 API 更去中心化，因为提供商不再驻留在每个提示符中。

根据 Tether 的 SDK 资料，它还通过 Holepunch 技术栈添加了点对点原语，包括委托推理和去中心化模型分发。这些都是实质性的设计选择。

治理是另一个独立的层面。QVAC 由Tether提供资金、命名、协调和推广。其旗舰应用、模型系列、SDK 路线图以及“稳定智能”语言均源自同一家企业赞助商。

这种结构与“本地优先”的价值主张相符。它将去中心化主张的范围缩小到证据最充分的领域。

QVAC 实现了推理发生的去中心化。但更广泛的生态系统仍然需要证据来证明其对默认注册表、发布渠道、安全规范、模型包含和长期治理的分布式控制。

复制是下一个Threshold。

QVAC的信誉如今取决于结果的可重复性。如果MedPsy的结果能够在QVAC自身评估体系之外得到验证，那么Tether将拥有一个可信的案例，来验证其情报储备理论：小型、开放、可本地部署的模型，能够在敏感领域与大型云端系统竞争。

如果独立测试缩小或逆转基准差距，QVAC 的基础设施优势依然存在，但其模型主张则显得苍白无力。更广泛的争论最终回归到技术领域最古老的权衡：便利性集中权力，而控制则需要付出努力。

阿西莫夫框架在此发挥了作用。 《基地》中的心理史关注的是承受压力的大型系统，而泰瑟的版本则聚焦于集中化下的基础设施。语言宏大，技术论证尚不完善，但方向清晰连贯。

Tether正在利用全球最大稳定币的现金流构建一个专注于本地执行、对等网络、开源工具和边缘规模模型的 AI 技术栈。它正在将稳定币的理念从货币扩展到智能领域。

问题不再是稳定币公司是否有能力开发人工智能。TetherTether有这个能力。

问题是 QVAC 能否建立足够强大的模型和基础设施，使用户能够接受本地控制带来的摩擦。

MedPsy是第一个可衡量的Threshold。独立重复实验将确定QVAC的心理史语言是否仍然是一种隐喻，还是开始类似于严肃的边缘人工智能堆栈的早期运行逻辑。