OpenAI phát hành HealthBench, một chuẩn mực đánh giá AI y tế

Bài viết này được dịch máy
Xem bản gốc

Theo tin từ Foresight News, HT đã phát hành tiêu chuẩn đánh giá AI y tế HealthBench và đã được đưa lên GitHub với mã nguồn mở. Tiêu chuẩn này được phát triển bởi hơn 250 bác sĩ từ toàn cầu, bao gồm 5000 cuộc trò chuyện y tế thực tế, nhằm đánh giá hiệu suất của các mô hình ngôn ngữ lớn trong các tình huống y tế.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận