Tether ra mắt trí tuệ nhân tạo y tế chạy trên điện thoại, vượt trội hơn nhiều mô hình SoTA lớn hơn và có thể loại bỏ hoàn toàn điện toán đám mây.

Bài viết này được dịch máy
Xem bản gốc

Ngày 7 tháng 5 năm 2026 – Nhóm Nghiên cứu AI của Tether hôm nay đã ra mắt QVAC MedPsy, một loại mô hình ngôn ngữ y tế mới được thiết kế để chạy trực tiếp trên điện thoại thông minh, thiết bị đeo và các thiết bị khác có sức mạnh xử lý hạn chế, mang lại hiệu suất sánh ngang và trong một số trường hợp, vượt trội hơn các mô hình lớn hơn đáng kể trong khi vẫn duy trì tính cục bộ và riêng tư. Thay vì mở rộng hiệu suất thông qua kích thước mô hình, hệ thống tập trung vào hiệu quả, giảm cả yêu cầu tính toán và do đó, loại bỏ sự phụ thuộc vào cơ sở hạ tầng đám mây từ xa.

Hầu hết các hệ thống hiện nay vẫn phụ thuộc vào các mô hình lớn chạy trên máy chủ từ xa, đòi hỏi dữ liệu nhạy cảm phải được truyền qua máy chủ đám mây. Trong lĩnh vực chăm sóc sức khỏe, điều đó bao gồm hồ sơ bệnh nhân, truy vấn chẩn đoán và ghi chú lâm sàng, tất cả đều phải tuân thủ các quy định nghiêm ngặt về quyền riêng tư và tuân thủ pháp luật. Khi thị trường mở rộng từ khoảng 36 tỷ đô la hiện nay lên dự kiến ​​vượt quá 500 tỷ đô la vào năm 2033, kiến ​​trúc đó ngày càng khó để biện minh.

Phiên bản này thách thức một trong những giả định cố hữu nhất trong AI, đó là hiệu suất tốt hơn đòi hỏi mô hình lớn hơn và nhiều sức mạnh tính toán hơn. Thay vào đó, QVAC MedPsy đã đảo ngược mô hình đó. Một mô hình với 1,7 tỷ tham số đã đạt điểm trung bình là 62,62 trên bảy bài kiểm tra y tế trắc nghiệm, vượt trội hơn MedGemma-1.5-4B-it của Google tới 11,42 điểm mặc dù kích thước nhỏ hơn một nửa. Trong các tình huống lâm sàng thực tế như HealthBench Hard, mô hình 1,7 tỷ tham số thậm chí còn đánh bại MedGemma 27B, một mô hình lớn hơn gần mười sáu lần. Phiên bản QVAC MedPsy 4 tỷ tham số của chúng tôi đạt điểm 70,54 trên cùng bảy bài kiểm tra trắc nghiệm, vượt trội hơn các mô hình lớn hơn gần bảy lần, bao gồm cả MedGemma-27B-text, và mang lại hiệu suất cao hơn trong các bài đánh giá theo kiểu lâm sàng như HealthBench Hard, HealthBench và MedXpertQA. Nhìn chung, đánh giá bao gồm tám bộ tiêu chuẩn đa dạng: MedQA-USMLE và MedMCQA cho kiến ​​thức lâm sàng và các kỳ thi y khoa; MMLU Health và MMLU-Pro Health dành cho việc nâng cao kiến ​​thức về sức khỏe; MedXpertQA dành cho lý luận lâm sàng chuyên môn; PubMedQA dành cho việc hiểu biết về nghiên cứu y sinh; AfriMedQA dành cho bối cảnh chăm sóc sức khỏe toàn cầu ở những khu vực thiếu thốn; và HealthBench, bao gồm HealthBench Hard, dành cho các tình huống lâm sàng thực tế. Sự cải thiện hiệu suất đến từ một quy trình y tế được xây dựng theo từng giai đoạn sau đào tạo, kết hợp giám sát y tế toàn diện, dữ liệu lý luận lâm sàng có giá trị cao hơn và học tăng cường tập trung vào các trường hợp lý luận y tế khó hơn.

Các mô hình này cũng giúp giảm đáng kể chi phí suy luận. Mô hình QVAC MedPsy 4B của chúng tôi tạo ra phản hồi chỉ với khoảng 909 token so với 2.953 token của các hệ thống tương đương, giảm 3,2 lần, trong khi mô hình 1.7B trung bình khoảng 1.110 token so với 1.901 token, giảm 1,7 lần. Điều đó có nghĩa là thời gian phản hồi nhanh hơn và khả năng chạy cục bộ mà không cần phụ thuộc vào cơ sở hạ tầng đám mây. Các mô hình cũng được phát hành ở định dạng GGUF lượng tử hóa để triển khai cục bộ, với các phiên bản Q4_K_M được khuyến nghị có kích thước khoảng 1,2 GB cho QVAC MedPsy-1.7B và 2,6 GB cho QVAC MedPsy-4B. Trong quá trình thử nghiệm, các phiên bản nén này vẫn giữ được hầu hết hiệu suất chuẩn trong khi vẫn giúp các mô hình trở nên thiết thực cho môi trường di động và biên.

Điều này làm thay đổi phạm vi ứng dụng thực tế của trí tuệ nhân tạo trong y tế. Các hệ thống trước đây yêu cầu xử lý bên ngoài giờ đây có thể được triển khai để hỗ trợ các bác sĩ lâm sàng trong các hệ thống tại chỗ nhằm xử lý và phân tích dữ liệu an toàn, cục bộ, trên thiết bị di động hoặc trong môi trường mà các hạn chế về kết nối, độ trễ hoặc quyền riêng tư khiến các mô hình dựa trên đám mây trở nên không khả thi. Nó cũng làm giảm một trong những rào cản chính đối với việc áp dụng trong chăm sóc sức khỏe, đó là nhu cầu di chuyển dữ liệu nhạy cảm ra khỏi môi trường được kiểm soát.

“Với QVAC MedPsy, trọng tâm của chúng tôi là cải thiện hiệu quả ở cấp độ mô hình, thay vì mở rộng quy mô,” Paolo Ardoino, Giám đốc điều hành của Tether cho biết. “Trong các thử nghiệm của chúng tôi, mô hình QVAC MedPsy với 1,7 tỷ tham số đã hoạt động tốt hơn các hệ thống lớn hơn như MedGemma-4B, và mô hình 4 tỷ tham số của chúng tôi đã vượt trội hơn kết quả từ các mô hình có kích thước gần gấp bảy lần, trong khi sử dụng ít hơn tới ba lần số token cho mỗi phản hồi. Sự kết hợp đó rất quan trọng vì nó trực tiếp giảm yêu cầu tính toán, độ trễ và chi phí. Nó cho phép mô hình chạy cục bộ trên phần cứng tiêu chuẩn thay vì dựa vào cơ sở hạ tầng từ xa. Trong lĩnh vực chăm sóc sức khỏe, điều đó thay đổi hoàn toàn các ràng buộc; bạn có thể chạy suy luận y tế ở nơi dữ liệu đã tồn tại, bên trong hệ thống bệnh viện hoặc trên thiết bị, mà không cần chuyển thông tin nhạy cảm qua đám mây hoặc chờ xử lý bên ngoài.”

Trong thập kỷ qua, sự tiến bộ trong trí tuệ nhân tạo (AI) gắn liền với khả năng truy cập vào điện toán đám mây. QVAC MedPsy hướng đến một hướng đi khác, nơi hiệu quả, tính cục bộ và quyền riêng tư quyết định hiệu suất. Nếu những lợi ích này được chứng minh trong các triển khai thực tế, chúng có thể định hình lại nền kinh tế của cơ sở hạ tầng AI y tế, chuyển lợi thế sang các hệ thống hoạt động cục bộ với chi phí thấp hơn, độ trễ thấp hơn và khả năng kiểm soát dữ liệu nhạy cảm tốt hơn.

Xem thêm tại Tether


Về dữ liệu Tether

Tether Data, SA de CV (“Tether Data”) là một phần trong tầm nhìn rộng lớn hơn của Tether nhằm thúc đẩy tự do, minh bạch và đổi mới thông qua công nghệ. Sứ mệnh của công ty là cho phép mọi người và các tổ chức kết nối và chia sẻ thông tin trực tiếp, không cần đến các trung gian không cần thiết. Bằng cách tạo ra các hệ thống ngang hàng an toàn, Tether Data mang đến cho người dùng quyền kiểm soát lớn hơn đối với dữ liệu, thông tin liên lạc và tương tác kỹ thuật số của họ. Tether Data hướng đến việc định nghĩa lại cách thức thông tin lưu chuyển trên các mạng bằng cách thay thế các mô hình tập trung bằng cơ sở hạ tầng phi tập trung được thiết kế cho quyền riêng tư, hiệu quả và khả năng phục hồi. Mục tiêu của công ty là làm cho kết nối toàn cầu nhanh hơn, an toàn hơn và riêng tư hơn, trao quyền cho cả cá nhân và tổ chức trao đổi thông tin một cách tự do và an toàn.


Giới thiệu về QVAC

QVAC là sáng kiến ​​nghiên cứu trí tuệ nhân tạo tiên tiến của Tether Data, chuyên xây dựng các hệ thống trí tuệ mở, phi tập trung và thích ứng. Sứ mệnh của nó là Trí tuệ Nhân tạo Địa phương và Trí tuệ Vô hạn. Nó được dẫn dắt bởi tầm nhìn không khoan nhượng về một thế giới nơi trí tuệ nhân tạo tồn tại và học hỏi trên mọi thiết bị, trao quyền cho cá nhân và cộng đồng thay vì tập trung quyền lực vào các trung tâm dữ liệu của doanh nghiệp.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
50
Thêm vào Yêu thích
10
Bình luận