GPT-5 có thể đọc phim X-quang tốt hơn bác sĩ con người?!
Nghiên cứu mới nhất cho thấy, GPT-5 có độ chính xác trong việc suy luận và hiểu hình ảnh y khoa lần lượt cao hơn các chuyên gia con người 24,23% và 29,40%.
Nhóm nghiên cứu từ Trường Y khoa Đại học Emory đã so sánh GPT-5 với GPT-4o và các biến thể nhỏ hơn của GPT-5 (GPT-5-mini, GPT-5-nano), phân tích khả năng xử lý thông tin đa phương thức của chúng trong lĩnh vực y tế.
Thông qua một loạt các bài kiểm tra tiêu chuẩn hóa, người ta nhận thấy GPT-5 hoạt động tốt hơn các mô hình khác trong tất cả các bài kiểm tra, đặc biệt là trong bài kiểm tra đa phương thức MedXpertQA, điểm suy luận và hiểu của nó tăng gần 30% và 36% so với GPT-4o, thậm chí còn cao hơn cả bác sĩ con người.
Việc AI đọc hồ sơ bệnh án là điều thường thấy, nhưng việc AI đọc tốt hơn bác sĩ con người thì không phổ biến, vậy GPT-5 đã làm được điều này như thế nào?
AI vượt trội hơn bác sĩ tập sự trong lĩnh vực y học đa phương thức
Các nhà nghiên cứu đã tiến hành kiểm tra hệ thống đối với GPT-5, GPT-4o cùng các phiên bản mini và nano của GPT-5.
Bài kiểm tra được chia thành ba loại: kỳ thi USMLE thuần văn bản, bài kiểm tra đa phương thức MedXpertQA và VQA-RAD của khoa X-quang, tất cả đều trong thiết lập không có mẫu, không dựa trên việc điều chỉnh dữ liệu.
USMLE là kỳ thi cấp phép hành nghề bác sĩ của Hoa Kỳ, có hệ thống đề thi chuẩn hóa và hệ thống chấm điểm nghiêm ngặt, là tiêu chuẩn tham khảo quan trọng cho giáo dục y học và đánh giá nhân tài trên toàn cầu.
Kỳ thi này được chia thành ba bước: Bước 1 chủ yếu kiểm tra kiến thức y học cơ bản, Bước 2 tập trung vào kiến thức ứng dụng lâm sàng, Bước 3 chú trọng thực hành.
Trong nghiên cứu này, GPT-5 đã vượt trội hoàn toàn so với GPT-4o trong kỳ thi USMLE, với điểm trung bình dẫn đầu so với các mô hình khác.
Từ đó có thể thấy, trước khi AI tự đọc hồ sơ bệnh án, vẫn phải rèn luyện thêm.
Địa chỉ bài báo: https://arxiv.org/abs/2508.08224
Các liên kết tham khảo:
[1]https://x.com/omarsar0/status/1955252499142627788
[2]https://x.com/emollick/status/1955381296743715241
[3]https://x.com/DrDatta_AIIMS/status/1954586822849523789
Bài viết này đến từ tài khoản WeChat "Lượng Tử Vị", tác giả: Văn Lạc, được 36Kr xuất bản với sự cho phép.