테더(Tether) 스마트폰에서 실행되는 의료 AI를 공개했는데, 이 AI는 훨씬 규모가 큰 최첨단 모델보다 뛰어난 성능을 보이며 클라우드를 완전히 배제할 수도 있습니다.

이 기사는 기계로 번역되었습니다
원문 표시

2026년 5월 7일 – 테더(Tether)의 AI 연구 그룹은 오늘 스마트폰, 웨어러블 기기 및 처리 능력이 제한적인 기타 장치에서 직접 실행되도록 설계된 새로운 유형의 의료 언어 모델인 QVAC MedPsy를 출시했습니다. 이 모델은 로컬 환경에서 안전하게 실행되면서도 훨씬 더 큰 모델과 동등하거나 경우에 따라서는 그 이상의 성능을 제공합니다. 모델 크기를 통해 성능을 확장하는 대신, 이 시스템은 효율성에 초점을 맞춰 컴퓨팅 요구 사항을 줄이고 결과적으로 원격 클라우드 인프라에 대한 의존도를 없앱니다.

오늘날 대부분의 시스템은 여전히 ​​원격 서버에서 실행되는 대규모 모델에 의존하고 있으며, 민감한 데이터가 클라우드 서버를 거쳐 이동해야 합니다. 의료 분야에서는 환자 기록, 진단 조회, 임상 기록 등이 여기에 포함되며, 이 모든 데이터는 엄격한 개인정보 보호 및 규정 준수 제약을 받습니다. 현재 약 360억 달러 규모인 의료 시장이 2033년에는 5,000억 달러 이상으로 성장할 것으로 예상되는 상황에서, 이러한 아키텍처의 타당성을 입증하기는 점점 더 어려워지고 있습니다.

이번 릴리스는 AI 분야에서 가장 뿌리 깊은 가정 중 하나인 "더 나은 성능을 위해서는 더 큰 모델과 더 많은 컴퓨팅 자원이 필요하다"는 통념에 도전합니다. QVAC MedPsy는 이러한 모델을 뒤집습니다. 17억 개의 파라미터를 가진 모델은 7개의 폐쇄형 의료 벤치마크에서 평균 62.62점을 달성하여 Google의 MedGemma-1.5-4B-it보다 11.42점 높은 성능을 보였습니다. 이는 모델 크기가 절반도 되지 않음에도 불구하고 달성한 결과입니다. HealthBench Hard와 같은 실제 임상 시나리오에서는 17억 파라미터 모델이 거의 16배 더 큰 MedGemma 27B보다도 우수한 성능을 보여주었습니다. 40억 파라미터 버전의 QVAC MedPsy는 동일한 7개의 폐쇄형 벤치마크에서 70.54점을 기록하며 MedGemma-27B-text를 포함하여 거의 7배 더 큰 모델들을 능가했고, HealthBench Hard, HealthBench, MedXpertQA와 같은 임상 환경 평가에서도 더 높은 성능을 제공했습니다. 전반적으로 이번 평가는 임상 지식 및 의학 시험을 위한 MedQA-USMLE 및 MedMCQA, 건강 문해력을 위한 MMLU Health 및 MMLU-Pro Health, 전문가 임상 추론을 위한 MedXpertQA, 생의학 연구 이해도를 위한 PubMedQA, 의료 서비스 접근성이 낮은 전 세계 지역을 위한 AfriMedQA, 그리고 실제 임상 시나리오를 위한 HealthBench(HealthBench Hard 포함) 등 총 8개의 다양한 벤치마크 세트를 대상으로 진행되었습니다. 이러한 성과 향상은 광범위한 의학적 감독, 가치 있는 임상 추론 데이터, 그리고 난이도 높은 의학적 추론 사례에 초점을 맞춘 강화 학습을 결합한 단계별 교육 후 의료 프로세스를 통해 이루어졌습니다.

이 모델들은 추론 비용을 크게 줄여줍니다. QVAC MedPsy 4B 모델은 유사 시스템의 2,953개 토큰에 비해 약 909개 토큰으로 응답을 생성하여 3.2배의 비용 절감을 달성했으며, 1.7B 모델은 평균 약 1,110개 토큰으로 1,901개 토큰 대비 1.7배의 비용 절감을 보여줍니다. 이는 응답 시간 단축과 클라우드 인프라에 의존하지 않고 로컬에서 실행할 수 있는 가능성을 의미합니다. 또한, 이 모델들은 로컬 배포를 위해 양자화된 GGUF 형식으로 제공되며, 권장되는 Q4_K_M 버전은 QVAC MedPsy-1.7B의 경우 약 1.2GB, QVAC MedPsy-4B의 경우 약 2.6GB입니다. 테스트 결과, 이러한 압축 버전은 벤치마크 성능의 대부분을 유지하면서 모바일 및 엣지 환경에서 모델을 실용적으로 사용할 수 있도록 해줍니다.

이는 의료 AI가 실제로 활용될 수 있는 영역을 변화시킵니다. 이전에는 외부 처리가 필요했던 시스템을 현장 시스템 내에서 임상의를 지원하여 안전한 로컬 데이터 처리 및 분석을 수행하거나, 모바일 기기에서 사용하거나, 연결성, 지연 시간 또는 개인정보 보호 제약으로 인해 클라우드 기반 모델이 비실용적인 환경에서도 사용할 수 있게 됩니다. 또한 의료 분야에서 AI 도입을 가로막는 주요 장벽 중 하나였던 민감한 데이터를 통제된 환경 외부로 이동해야 하는 필요성을 줄여줍니다.

테더(Tether) 의 CEO인 파올로 아르도이노는 “QVAC MedPsy를 개발할 때, 규모를 확장하는 것보다 모델 수준에서 효율성을 개선하는 데 집중했습니다.”라고 말했습니다. “테스트 결과, 17억 개의 파라미터를 가진 QVAC MedPsy 모델은 MedGemma-4B와 같은 더 큰 시스템보다 우수한 성능을 보였고, 40억 개의 파라미터를 가진 모델은 규모가 거의 7배에 달하는 모델보다 뛰어난 결과를 내면서도 응답당 토큰 사용량은 최대 3배 적었습니다. 이러한 성능 조합은 컴퓨팅 요구 사항, 지연 시간 및 비용을 직접적으로 줄여주기 때문에 매우 중요합니다. 원격 인프라에 의존하지 않고 표준 하드웨어에서 로컬로 모델을 실행할 수 있게 해줍니다. 의료 분야에서는 이러한 변화가 제약 조건을 완전히 바꿔놓습니다. 민감한 정보를 클라우드를 통해 이동하거나 외부 처리를 기다릴 필요 없이, 병원 시스템이나 기기 등 이미 데이터가 존재하는 곳에서 의료 추론을 실행할 수 있게 되는 것입니다.”

지난 10년간 인공지능(AI)의 발전은 클라우드 기반 컴퓨팅 접근성에 크게 좌우되어 왔습니다. 하지만 QVAC MedPsy는 효율성, 지역성, 그리고 개인정보 보호가 성능을 좌우하는 새로운 방향을 제시합니다. 이러한 장점이 실제 환경에서 입증된다면, 의료 AI 인프라의 경제성을 재편하여 저비용, 저지연, 그리고 민감한 데이터에 대한 더 큰 통제력을 갖춘 로컬 운영 시스템에 유리한 구도를 만들어낼 수 있을 것입니다.

자세한 내용은 테더(Tether) 에서 확인하세요.


테더(Tether) 데이터 소개

테더(Tether) 데이터(Tether Data, SA de CV, 이하 "테더(Tether) 데이터")는 기술을 통해 자유, 투명성, 혁신을 증진하고자 하는 테더의 광범위한 비전의 일환입니다. 테더 데이터의 사명은 불필요한 중개자 없이 개인과 조직이 직접 연결하여 정보를 공유할 수 있도록 지원하는 것입니다. 안전한 P2P 시스템을 구축함으로써 테더(Tether) 데이터는 사용자에게 데이터, 통신 및 디지털 상호 작용에 대한 더 큰 제어권을 제공합니다. 테더(Tether) 데이터는 전 세계적인 연결성을 더욱 빠르고 안전하며 개인정보가 보호되는 방식으로 만들어 개인과 기관 모두가 자유롭고 안전하게 정보를 교환할 수 있도록 지원하는 것을 목표로 합니다.


QVAC 소개

QVAC는 테더(Tether) 데이터의 첨단 AI 연구 이니셔티브로, 개방형, 분산형, 적응형 인텔리전스 시스템 구축에 전념합니다. QVAC의 목표는 로컬 AI와 무한한 인텔리전스를 구현하는 것입니다. 기업 데이터 센터에 권력이 집중되는 대신, AI가 모든 기기에서 존재하고 학습하여 개인과 커뮤니티에 힘을 실어주는 세상을 만들겠다는 확고한 비전을 추구합니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
50
즐겨찾기에 추가
10
코멘트