Tether上线可在手机上运行的AI医疗保健系统,其性能比谷歌的同类产品高出16次。

本文为机器翻译
展示原文

Tether上线的QVAC MedPsy 拥有 17 亿个参数,在 HealthBench Hard 测试中超越了MedGemma-27B,使用的计算资源减少了次,并且不需要云基础设施。

以USDT稳定币闻名的Tether公司刚刚发布了QVAC MedPsy,这是一系列医疗人工智能模型,旨在无需云连接即可直接在智能手机、可穿戴设备和边缘设备上运行。该产品最引人注目之处并非其不同寻常的出身——一家稳定币公司涉足医疗人工智能领域——而是其附带的性能数据。

在 OpenAI 的 HealthBench Hard 基准测试中,Tether 的 17 亿参数模型超越Google 的 MedGemma-27B,后者的规模几乎是 Tether 的 16次。HealthBench Hard 基准测试通过多轮临床对话评估人工智能,由 262 位医生进行评分。

该 40 亿参数模型的性能也比其规模更大的竞争对手高出近 7次,而平均每次响应仅使用 909 个代币,相比之下,类似系统则使用 2,953 个代币,计算成本下降了3.2次。

代币效率的优势不仅仅体现在技术数据上。更少的代币意味着更快的响应速度、更低的成本,而最重要的是,它能够完全在主流消费级硬件上进行本地化运行。

这些模型以量化的 GGUF 文件形式发布,大小次为 1.2GB 和 2.6GB,足够小,可以安装在移动设备上,同时在从 MedQA-USMLE 到 AfriMedQA的评估套件中保持了大部分性能,AfriMedQA 是一套专注于非洲资源匮乏的医疗保健背景的标准。

数据隐私——真正的竞争优势

Tether 首席执行官 Paolo Ardoino 将 QVAC MedPsy 定位为效率问题,而不是规模问题:在数据所在之处(医院系统内或个人设备上)进行医疗推断,而无需将敏感信息传输到第三方基础设施。

背景目前大多数医疗人工智能都是通过云服务器处理患者数据,并制作与 HIPAA 法规相关的风险,因此这一论点对于远程医院和诊所系统具有实际意义。

然而,技术潜力并不等同于临床应用能力。牛津大学二月份的一项研究表明,大型语言模型仍然经常给出不准确的医疗建议,并且难以处理复杂的症状,这使得研究人员得出结论:人工智能应该扮演“秘书而非医生”的Vai。

QVAC MedPsy 发布之背景,医疗保健人工智能市场目前价值约 360 亿镁,预计到 2033 年将超过 5000 亿镁——这是一个足够大的市场,即使基于设备的模型还不能取代临床医生的Vai,它们也能找到自己的位置。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
83
收藏
12
评论