Tether上線的QVAC MedPsy 擁有 17 億個參數,在 HealthBench Hard 測試中超越了MedGemma-27B,使用的計算資源減少了次,並且不需要雲基礎設施。
以USDT穩定幣聞名的Tether公司剛剛發佈了QVAC MedPsy,這是一系列醫療人工智能模型,旨在無需雲連接即可直接在智能手機、可穿戴設備和邊緣設備上運行。該產品最引人注目之處並非其不同尋常的出身——一家穩定幣公司涉足醫療人工智能領域——而是其附帶的性能數據。
在 OpenAI 的 HealthBench Hard 基準測試中,Tether 的 17 億參數模型超越Google 的 MedGemma-27B,後者的規模幾乎是 Tether 的 16次。HealthBench Hard 基準測試通過多輪臨床對話評估人工智能,由 262 位醫生進行評分。
該 40 億參數模型的性能也比其規模更大的競爭對手高出近 7次,而平均每次響應僅使用 909 個代幣,相比之下,類似系統則使用 2,953 個代幣,計算成本下降了3.2次。
代幣效率的優勢不僅僅體現在技術數據上。更少的代幣意味著更快的響應速度、更低的成本,而最重要的是,它能夠完全在主流消費級硬件上進行本地化運行。
這些模型以量化的 GGUF 文件形式發佈,大小次為 1.2GB 和 2.6GB,足夠小,可以安裝在移動設備上,同時在從 MedQA-USMLE 到 AfriMedQA的評估套件中保持了大部分性能,AfriMedQA 是一套專注於非洲資源匱乏的醫療保健背景的標準。
數據隱私——真正的競爭優勢
Tether 首席執行官 Paolo Ardoino 將 QVAC MedPsy 定位為效率問題,而不是規模問題:在數據所在之處(醫院系統內或個人設備上)進行醫療推斷,而無需將敏感信息傳輸到第三方基礎設施。
背景目前大多數醫療人工智能都是通過雲服務器處理患者數據,並製作與 HIPAA 法規相關的風險,因此這一論點對於遠程醫院和診所繫統具有實際意義。
然而,技術潛力並不等同於臨床應用能力。牛津大學二月份的一項研究表明,大型語言模型仍然經常給出不準確的醫療建議,並且難以處理複雜的症狀,這使得研究人員得出結論:人工智能應該扮演“秘書而非醫生”的Vai。
QVAC MedPsy 發佈之背景,醫療保健人工智能市場目前價值約 360 億鎂,預計到 2033 年將超過 5000 億鎂——這是一個足夠大的市場,即使基於設備的模型還不能取代臨床醫生的Vai,它們也能找到自己的位置。


