2026年5月7日——Tether人工智能研究团队今日发布了QVAC MedPsy,这是一种新型医学语言模型,旨在直接运行于智能手机、可穿戴设备和其他处理能力有限的设备上。其性能可与规模更大的模型相媲美,甚至在某些情况下超越后者,同时保持本地化和私密性。该系统并非通过扩大模型规模来提升性能,而是专注于提高效率,从而降低计算需求,并最终摆脱对远程云基础设施的依赖。
如今大多数系统仍然依赖于运行在远程服务器上的大型模型,这需要敏感数据通过云服务器传输。在医疗保健领域,这些数据包括患者记录、诊断查询和临床笔记,所有这些都受到严格的隐私和合规性约束。随着市场规模从目前的约360亿美元增长到预计到2033年将超过5000亿美元,这种架构的合理性正变得越来越难以维系。
此次发布挑战了人工智能领域最根深蒂固的假设之一:更高的性能需要更大的模型和更多的计算资源。QVAC MedPsy 颠覆了这一传统模式。一个拥有 17 亿参数的模型在七项封闭式医学基准测试中取得了 62.62 的平均分,比 Google 的 MedGemma-1.5-4B-it 高出 11.42 分,而其规模却不到后者的一半。在 HealthBench Hard 等真实临床场景中,这个 17 亿参数的模型甚至超越了规模几乎是其 16 倍的 MedGemma 27B。我们的 QVAC MedPsy 40 亿参数版本在相同的七项封闭式基准测试中获得了 70.54 的分数,超过了规模几乎是其 7 倍的模型,包括 MedGemma-27B-text,并在 HealthBench Hard、HealthBench 和 MedXpertQA 等临床模拟评估中表现更佳。总体而言,此次评估涵盖了八个不同的基准测试套件:MedQA-USMLE 和 MedMCQA 用于评估临床知识和医学考试;MMLU Health 和 MMLU-Pro Health 用于评估健康素养;MedXpertQA 用于评估专家临床推理能力;PubMedQA 用于评估生物医学研究理解能力;AfriMedQA 用于评估全球医疗资源匮乏地区的医疗保健能力;以及 HealthBench(包括 HealthBench Hard)用于评估真实临床场景的能力。性能提升源于分阶段的培训后医学流程,该流程结合了广泛的医学监督、更高价值的临床推理数据以及针对更复杂医学推理案例的强化学习。
这些模型还显著降低了推理成本。我们的 QVAC MedPsy 4B 模型仅需约 909 个 token 即可生成响应,而同类系统则需要 2,953 个 token,减少了 3.2 倍;1.7B 模型平均只需约 1,110 个 token,而同类系统则需要 1,901 个 token,减少了 1.7 倍。这意味着更快的响应速度,并且无需依赖云基础设施即可在本地运行。这些模型还以量化的 GGUF 格式发布,方便本地部署。推荐的 Q4_K_M 版本大小分别为:QVAC MedPsy-1.7B 约 1.2 GB,QVAC MedPsy-4B 约 2.6 GB。测试表明,这些压缩版本在保持大部分基准性能的同时,也使模型适用于移动和边缘环境。
这改变了医疗人工智能的实际应用范围。以往需要外部处理的系统现在可以部署在临床医生的现场系统中,用于安全、本地化的数据处理和分析,也可以部署在移动设备上,或者部署在因网络连接、延迟或隐私限制而无法使用云端模型的环境中。此外,它还降低了医疗保健领域采用医疗人工智能的主要障碍之一,即无需将敏感数据传输到受控环境之外。
Tether首席执行官 Paolo Ardoino 表示: “QVAC MedPsy 的重点在于提升模型层面的效率,而非扩大模型规模。在我们的测试中,拥有 17 亿参数的 QVAC MedPsy 模型性能优于 MedGemma-4B 等规模更大的系统,而我们 40 亿参数的模型性能甚至超过了规模近七倍的模型,同时每次响应使用的令牌数量却减少了近三倍。这种组合意义重大,因为它直接降低了计算需求、延迟和成本。它允许模型在标准硬件上本地运行,而无需依赖远程基础设施。在医疗保健领域,这彻底改变了限制;您可以在数据已存在的地方(例如医院系统内部或设备上)运行医学推理,而无需通过云端传输敏感信息或等待外部处理。”
过去十年,人工智能的发展一直依赖于云计算。QVAC MedPsy 则指明了一个不同的方向,在这个方向中,效率、本地化和隐私才是性能的关键。如果这些优势能在实际部署中得到体现,它们将重塑医疗人工智能基础设施的经济格局,使优势转向那些本地运行、成本更低、延迟更低、且能更好地控制敏感数据的系统。
更多信息请访问Tether
关于Tether Data
Tether Data, SA de CV(简称“Tether Data”)是Tether公司愿景的一部分,旨在通过技术促进自由、透明和创新。其使命是使个人和组织能够直接连接和共享信息,无需不必要的中介机构。通过创建安全的点对点系统, Tether Data使用户能够更好地控制其数据、通信和数字互动。Tether Data致力于通过以去中心化基础设施取代集中式模型,重新定义信息在网络中的流动方式,该基础设施的设计兼顾隐私性、效率和弹性。公司的目标是使全球连接更快、更安全、更私密,从而赋能个人和机构自由安全地交换信息。
关于 QVAC
QVAC 是Tether Data 的先进人工智能研究计划,致力于构建开放、去中心化和自适应的智能系统。其使命是实现本地人工智能和无限智能。QVAC 秉持着一个坚定不移的愿景:人工智能可以在任何设备上运行和学习,从而赋能个人和社区,而非将权力集中在企业数据中心。






