Trong hơn một thập kỷ, bệnh nhân đã tìm kiếm sự điều trị y tế vô ích, nhưng sau khi nhập toàn bộ bệnh sử của mình vào ChatGPT, nguyên nhân gây bệnh đã được tiết lộ ngay lập tức: đột biến gen! AI y tế từ những gã khổng lồ như Microsoft và OpenAI đã lặng lẽ ra mắt, với tỷ lệ chính xác vượt qua các bác sĩ chuyên nghiệp! Tương lai của dịch vụ chăm sóc y tế có thể được viết lại hoàn toàn!
AI một lần nữa làm rung chuyển cộng đồng y tế!
Một bệnh nhân bị một căn bệnh không thể giải thích hành hạ trong hơn mười năm, và hàng chục bác sĩ không thể tìm ra cách chữa trị.
Cho đến khi anh nhập báo cáo vào ChatGPT, AI đã đưa ra câu trả lời chính xác: Đột biến gen MTHFR A1298C!
Trên Reddit, tin tức này đã lan truyền rất nhanh!
⚠️Lưu ý: Trước khi áp dụng các đề xuất của ChatGPT, bệnh nhân đã trao đổi và xác nhận lần với bác sĩ điều trị. Hãy đảm bảo kết hợp ý kiến của các bác sĩ chuyên môn và không chỉ dựa vào AI làm cơ sở y tế.
Trong hơn một thập kỷ, bệnh nhân đã bị làm phiền bởi nhiều triệu chứng không thể giải thích được. Ông đã làm mọi thứ có thể, bao gồm cả chụp MRI cột sống, chụp CT và xét nghiệm máu, nhưng ông vẫn còn bối rối.
Sau đó, ông cũng đã trải qua thử nghiệm y học chức năng và bất ngờ phát hiện ra rằng mình có đột biến đồng hợp tử: đột biến gen MTHFR A1298C. Đây là Đột biến gen MTHFR methylenetetrahydrofolate reductase phổ biến, và Đột biến phổ biến nhất được gọi là MTHFR C677T.
Mọi người đều có hai bản sao của gen MTHFR, một từ mẹ và một từ cha. Hình trên cho thấy các kiểu gen có thể có của MTHFR C677T. MTHFR A1298C xảy ra ở vị trí 1298 của gen MTHFR. Đột biến này ảnh hưởng đến 7-12% dân số Hoa Kỳ.
Ông cũng đã gặp bác sĩ thần kinh và được xét nghiệm bệnh đa xơ cứng (MS).
Cho đến khi anh ấy nhập tất cả báo cáo khám bệnh và bệnh sử trong nhiều năm vào ChatGPT.
Thật kinh ngạc. Một cảnh tượng bất ngờ đã xảy ra: ChatGPT phát hiện rằng mặc dù nồng độ vitamin B12 trong huyết thanh là bình thường nhưng lại không phù hợp với chứng đau thần kinh dai dẳng và mệt mỏi mãn tính.
Sự bất thường này chỉ ra một khả năng bị bỏ qua từ lâu - tình trạng tắc nghẽn methyl hóa.
Sau một vài tháng, cảm giác ngứa ran của bệnh nhân giảm dần và tình trạng sương mù não cũng tan biến.
Bác sĩ trưởng đã xem xét báo cáo điều trị và vô cùng kinh ngạc khi phát hiện ra rằng Đột biến gen chính là nguyên nhân gây ra mọi triệu chứng!
Rohan Paul, một kỹ sư AI theo dõi tiến trình của AGI, đã được khích lệ bởi tin tức này. Ông cho rằng rằng "đã đến lúc ý kiến thứ hai từ các mô hình AI y tế trở thành chuẩn mực trong thực hành y tế".
Các dòng tweet có liên quan cũng đã được chủ tịch của OpenAI đăng lại.
Cựu cộng tác viên và tác giả của Forbes, Derick David cho biết đây là thời điểm "AlphaGo" trong lĩnh vực y tế: AI hiện nay chẩn đoán bệnh tốt hơn con người.
Những phép màu y học AI đang diễn ra liên tiếp
Có rất nhiều ví dụ tương tự!
Chị gái của người dùng Reddit crasstyfartman được ChatGPT chẩn đoán mắc bệnh máu di truyền hiếm gặp——
Trước đó, cô đã dành hơn một thập kỷ để gặp bác sĩ và bác sĩ y học tự nhiên, tất cả đều nói với cô rằng đó chỉ là vấn đề tâm lý. Họ thậm chí còn đảo mắt khi cô yêu cầu xét nghiệm. Cô ấy khăng khăng. ChatGPT đã đúng.
Sau khi phàn nàn với bác sĩ trong 22 năm, cư dân mạng buyableblah cuối cùng đã nhận được chẩn đoán với sự trợ giúp của ChatGPT.
Tôi đã làm điều tương tự, nhưng là bệnh lạc nội mạc tử cung. Cuối cùng tôi đã siêu âm và phát hiện ra một khối u lạc nội mạc tử cung 6 cm (gọi là u lạc nội mạc tử cung), hiện đã phát triển thành 7,3 cm và tôi dự định sẽ cắt bỏ nó vào cuối năm nay.
Một cư dân mạng thậm chí còn sử dụng ChatGPT cứu vãn một chú chó cưng bị bác sĩ thú y "kết án tử hình oan".
Người dùng Reddit sometimeslater0212 bày tỏ sự không hài lòng sâu sắc với hệ thống y tế:
Tôi đã cho các bác sĩ của mình xem những phát hiện từ ChatGPT, nhưng tất cả họ đều chế giễu. Một số người nói, "Tôi chưa bao giờ nghe thấy một gợi ý chẩn đoán tương tự", trong khi những người khác nói, "Đừng tin ChatGPT".
Kiểu kiêu ngạo này thực sự rất khó chịu.
Nhưng không chỉ có OpenAI. Microsoft, Google, IBM và nhiều công ty khác đã đưa ra AI y tế.
Các sản phẩm AI dành cho người tiêu dùng của Microsoft được sử dụng trong hơn 50 lần tình huống liên quan đến sức khỏe mỗi ngày.
Từ câu hỏi đầu tiên của người dùng về tình trạng đau đầu gối cho đến việc tìm kiếm khẩn cấp phòng khám gần đó vào đêm khuya, các công cụ tìm kiếm và trợ lý AI ngày càng trở thành tuyến phòng thủ đầu tiên cho các dịch vụ chăm sóc sức khỏe.
Tuần trước, Microsoft đã phát hành MAI-DxO. Và hệ thống AI này hoạt động tốt hơn nhiều so với bác sĩ.
Các nhà nghiên cứu đã sử dụng hồ sơ ca bệnh thực tế được công bố hàng tuần trên Tạp chí Y khoa New England làm chuẩn mực.
Kết quả cho thấy AI Diagnostic Orchestrator (MAI-DxO) của Microsoft có tỷ lệ chính xác là 85% khi chẩn đoán các trường hợp NEJM, cao hơn gấp bốn lần so với các bác sĩ giàu kinh nghiệm trong thử nghiệm.
Hơn nữa, chi phí cho MAI-DxO thấp hơn so với bác sĩ.
Microsoft: Con đường đến ASI y tế
NEJM xuất bản "Hồ sơ bệnh án của Bệnh viện đa khoa Massachusetts" hàng tuần, trong đó ghi lại chi tiết toàn bộ quá trình chẩn đoán và điều trị của bệnh nhân.
Những trường hợp như vậy thường rất khó chẩn đoán và thường đòi hỏi nhiều chuyên gia cùng sê-ri các xét nghiệm để đưa ra phán quyết cuối cùng.
NEJM: Tạp chí Y khoa New England, một trong những tạp chí y khoa có uy tín nhất trên thế giới
Vậy, AI hoạt động như thế nào trong những trường hợp phức tạp này?
Để khám phá vấn đề này, dựa trên trường hợp NEJM, đội ngũ nghiên cứu của Microsoft đã thiết kế một bộ thử thách chẩn đoán tương tác được gọi là Chuẩn mực chẩn đoán tuần tự (SD Bench).
304 trường hợp NEJM đã được chuyển đổi thành mô phỏng chẩn đoán và điều trị từng bước: giống như trong hoàn cảnh thực tế, các mô hình AI hoặc bác sĩ con người có thể đặt câu hỏi từng bước, sắp xếp các xét nghiệm, thu thập kết quả và cập nhật ý tưởng chẩn đoán theo thời gian thực và cuối cùng đưa ra kết luận. Các kết luận cuối cùng sẽ được so sánh với các câu trả lời tiêu chuẩn do NEJM đưa ra.
Mỗi yêu cầu xét nghiệm tạo ra một khoản phí ảo để mô phỏng mức tiêu thụ tài nguyên y tế thực tế. Dựa trên điều này, các nhà nghiên cứu đánh giá mô hình từ hai góc độ chính: độ chính xác chẩn đoán và hiệu quả tài nguyên.
Hình 1: Sơ đồ của một tác nhân AI suy luận và giải quyết vấn đề chẩn đoán tuần tự
Nhập thông tin trường hợp ban đầu, chẳng hạn như:
Một phụ nữ 29 tuổi được đưa vào bệnh viện với tình trạng đau họng, sưng quanh họng và chảy máu. Các triệu chứng của cô ấy không cải thiện sau khi điều trị bằng thuốc kháng khuẩn.
Theo quy trình "chẩn đoán tuần tự", AI bắt đầu lý luận:
(1) Đánh giá tình trạng bệnh nhân
(2) Tiếp theo, AI bắt đầu phỏng vấn y tế, bao gồm các lĩnh vực sau: tiền sử bệnh, tiền sử dùng thuốc, dấu hiệu khối u ác tính, tiền sử nhiễm vi-rút, tiền sử răng miệng, xu hướng chảy máu, các xét nghiệm thường quy (như xét nghiệm máu, đông máu) và các xét nghiệm hình ảnh (như chụp MRI cổ).
(3) Thảo luận nội bộ của nhóm chuyên gia bác sĩ ảo
(4) Kiểm tra từng mục và cập nhật chẩn đoán
(5) Hệ thống AI đưa ra kết luận chẩn đoán
(6) So sánh với kết quả chẩn đoán có thẩm quyền của NEJM và ý kiến đánh giá của chuyên gia
Trong video bên dưới, người đứng đầu dự án sẽ giới thiệu quy trình cơ bản.
Hướng tới chẩn đoán chính xác
Các nhà nghiên cứu đã tiến hành đánh giá toàn diện các mô hình AI tạo ra tiêu biểu nhất, bao gồm 304 trường hợp thực tế từ Tạp chí Y học New England (NEJM). Các mô hình cơ bản liên quan đến đánh giá bao gồm GPT, Llama, Claude, Gemini, Grok và DeepSeek.
Liên kết bài báo: https://arxiv.org/abs/2506.22405v2
Ngoài việc đánh giá chuẩn các mô hình này, các nhà nghiên cứu cũng thiết kế Microsoft AI Diagnostic Orchestrator (MAI-DxO) —
Một hệ thống mô phỏng một nhóm gồm nhiều bác sĩ ảo cùng nhau xử lý các trường hợp phức tạp thông qua nhiều ý tưởng chẩn đoán khác nhau.
Hình 5: Tổng quan về hệ thống phối hợp MAI-DxO
So với một mô hình đơn lẻ, các công cụ điều phối không chỉ tích hợp dữ liệu từ nhiều nguồn khác nhau tốt hơn mà còn cung cấp khả năng bảo mật, minh bạch và thích ứng tốt hơn khi hoàn cảnh chăm sóc sức khỏe thay đổi.
Kiến trúc không phụ thuộc vào mô hình này cũng cải thiện kiểm toán và khả năng phục hồi của hệ thống, cả hai đều rất quan trọng đối với các tình huống lâm sàng có rủi ro cao và phát triển nhanh chóng.
Kết quả đánh giá cho thấy MAI-DxO cải thiện đáng kể hiệu suất chẩn đoán của tất cả các mô hình. Trong đó suất tốt nhất là sự kết hợp giữa MAI-DxO và mô hình o3 của OpenAI, với độ chính xác chẩn đoán là 85,5% trong các trường hợp NEJM.
Để so sánh, thí nghiệm cũng đánh giá 21 bác sĩ đang hành nghề tại Hoa Kỳ và Vương quốc Anh, những người có từ 5 đến 20 năm kinh nghiệm lâm sàng. Trong cùng một nhiệm vụ, độ chính xác trung bình của các trường hợp họ hoàn thành chỉ là 20%.
MAI-DxO có thể cấu hình được và cho phép đặt giới hạn chi phí, giúp khám phá sự đánh đổi giữa “chi phí và giá trị” trong quá trình chẩn đoán.
Nếu không có hạn chế, AI có thể bị cám dỗ kê đơn tất cả các xét nghiệm có thể, bất kể chi phí, kinh nghiệm của bệnh nhân hay sự chậm trễ trong chẩn đoán và điều trị. Nghiên cứu phát hiện ra rằng MAI-DxO không chỉ chính xác hơn bác sĩ và các mô hình đơn lẻ mà còn có tổng chi phí xét nghiệm thấp hơn.
Biểu đồ phân tán sau đây so sánh các mô hình AI khác nhau về "độ chính xác chẩn đoán" và "chi phí thử nghiệm trung bình". Đường cong MAI-DxO trong hình nằm ở vùng trên bên trái có hiệu suất tốt nhất và chữ thập đỏ biểu thị trình độ trung bình của bác sĩ.
AI+bác sĩ: Bước đầu tiên để tạm biệt phương pháp điều trị y tế đắt đỏ
Bác sĩ thường lựa chọn giữa chiều rộng hoặc độ sâu chuyên môn. Ví dụ, bác sĩ đa khoa xử đối diện nhiều vấn đề khác nhau ở nhiều nhóm tuổi và hệ thống, trong khi bác sĩ chuyên khoa tập trung vào một bệnh hoặc hệ thống duy nhất.
Tuy nhiên, sự phức tạp của các trường hợp NEJM vượt xa phạm vi của một bác sĩ đơn lẻ. AI không bị giới hạn bởi điều này và có thể tính đến cả chiều rộng và độ sâu. Ngoài ra, ở nhiều khía cạnh, khả năng lý luận lâm sàng của AI đã vượt qua so với bác sĩ con người.
Khả năng này có tiềm năng cách mạng hóa chăm sóc sức khỏe - không chỉ trao quyền cho bệnh nhân tự quản lý các vấn đề sức khỏe thường gặp mà còn hỗ trợ bác sĩ ra quyết định.
Hiện nay, chi tiêu cho y tế tại Hoa Kỳ chiếm gần 20% GDP, trong đó có tới một phần tư là chi tiêu không hiệu quả.
AI được kỳ vọng sẽ là lực lượng chủ chốt trong việc hạn chế tình trạng lãng phí này.
Vấn đề không phải là thay thế bác sĩ mà là mở ra một mô hình đồng quản lý y tế mới: AI + bác sĩ, chẩn đoán chung.
Tham khảo: https://www.reddit.com/r/ChatGPT/comments/1lrmom4/chatgpt_solved_a_10_year_problem_no_doctors_could/
https://x.com/rohanpaul_ai/status/1939800536121057652
https://x.com/rohanpaul_ai/status/1941321376838951320
https://microsoft.ai/new/the-path-to-medical-superintelligence/
https://www.cdc.gov/folic-acid/data-research/mthfr/index.html
Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, được 36Kr xuất bản với sự cho phép.






