Mô hình AI mới Rosalind của OpenAI có thể rút ngắn thời gian khám phá thuốc đến nhiều năm. Có lẽ bạn không thể sử dụng nó.

avatar
Decrypt
04-18
Bài viết này được dịch máy
Xem bản gốc

OpenAI vừa đặt tên cho mô hình AI chuyên dụng đầu tiên của mình theo tên Rosalind Franklin - nhà hóa học người Anh, người có công trình nghiên cứu tinh thể học tia X đã giúp hé lộ cấu trúc xoắn kép của DNA, và người nổi tiếng vì bị từ chối công nhận thành tựu này trong suốt cuộc đời mình.

GPT-Rosalind, được công bố hôm thứ Năm , là một mô hình suy luận được xây dựng chuyên dụng cho sinh học, khám phá thuốc và y học chuyển dịch. Đây là sản phẩm đầu tiên trong chuỗi mô hình Khoa học Sự sống mà OpenAI gọi là "series Khoa học Sự sống" - một chiến lược nhắm thẳng vào thị trường nơi nhiều phòng thí nghiệm chuyên ngành từ các trường đại học đến Google DeepMind đang cạnh tranh gay gắt.

Theo các chuyên gia, việc đưa một loại thuốc từ giai đoạn phát hiện mục tiêu đến khi được cơ quan quản lý phê duyệt ở Mỹ mất trung bình từ 10 đến 15 năm . Phần lớn thời gian đó không phải trôi qua ở những khoảnh khắc đột phá, mà là trong quá trình miệt mài: phân tích hàng nghìn bài báo, truy vấn cơ sở dữ liệu, thiết kế thuốc thử và giải thích các kết quả không rõ ràng. Đây chính là điều mà GPT-Rosaling đang cố gắng giải quyết.

OpenAI lập luận rằng mô hình này có thể rút ngắn giai đoạn nghiên cứu ban đầu. Theo công ty, GPT-Rosalind được thiết kế để giúp các nhà khoa học "khám phá nhiều khả năng hơn, phát hiện ra những mối liên hệ có thể bị bỏ sót và đưa ra các giả thuyết tốt hơn sớm hơn."

Các kết quả kiểm định đã chứng minh phần nào tham vọng đó. Trên BixBench—một bộ dữ liệu kiểm định được xây dựng dựa trên các tác vụ tin sinh học thực tế—GPT-Rosalind đạt tỷ lệ đậu 0,751, điểm số cao nhất trong số các mô hình có kết quả đã được công bố. Trên LABBench2, nó vượt trội hơn so với phiên bản tiền nhiệm GPT-5.4 ở sáu trong số mười một tác vụ.

GPT-Rosalind vượt trội hơn GPT 5.4 trong mọi trường hợp liên quan đến khoa học sự sống, nhưng nó là một mô hình rất chuyên biệt và sẽ hoạt động kém hiệu quả trong bất kỳ lĩnh vực nào khác ngoài lĩnh vực đó.

OpenAI cũng thông báo Dyno Therapeutics sẽ giúp thử nghiệm và đánh giá mô hình của họ dựa trên các trình tự RNA chưa được công bố để loại trừ khả năng ghi nhớ. Kết quả tốt nhất trong mười lần gửi của GPT-Rosalind đạt trên mức phân vị thứ 95 của các chuyên gia con người trong các nhiệm vụ dự đoán trình tự, và khoảng phân vị thứ 84 trong nhiệm vụ tạo sinh.

Tuy nhiên, Joy Jiao, trưởng nhóm nghiên cứu khoa học sự sống của OpenAI, lại khá thận trọng về khả năng thực sự của mô hình này. Bà giải thích rằng công ty không coi Rosalind là một mô hình có khả năng tự động tạo ra các phương pháp điều trị mới, nhưng nói với các phóng viên rằng nó có thể là một trợ giúp đắc lực trong việc đẩy nhanh tiến độ nghiên cứu. "Chúng tôi thực sự nghĩ rằng có một cơ hội để giúp các nhà nghiên cứu tiến nhanh hơn qua một số phần phức tạp và tốn nhiều thời gian nhất của quy trình khoa học", Jiao nói trong một cuộc họp báo, theo tờ LA Times .

Hệ sinh thái xung quanh mô hình có thể quan trọng không kém gì chính mô hình đó. OpenAI cũng đang phát hành một plugin nghiên cứu Khoa học Sự sống miễn phí cho Codex, kết nối với hơn 50 cơ sở dữ liệu và công cụ khoa học—tra cứu cấu trúc protein, tìm kiếm trình tự, đánh giá tài liệu, quy trình xử lý dữ liệu gen. Người dùng doanh nghiệp có quyền truy cập GPT-Rosalind sẽ nhận được lớp suy luận ở trên cùng. Những người dùng khác sẽ nhận được plugin với các mô hình tiêu chuẩn.

OpenAI đã thu hút được một danh sách khách hàng trong lĩnh vực dược phẩm và công nghệ sinh học cho lần ra mắt sản phẩm này, bao gồm Amgen, Moderna và Thermo Fisher Scientific. Bên cạnh đó, họ cũng đang hợp tác nghiên cứu với Phòng thí nghiệm Quốc gia Los Alamos về thiết kế protein và chất xúc tác dựa trên trí tuệ nhân tạo.

"Lĩnh vực khoa học sự sống đòi hỏi sự chính xác ở mọi bước. Các câu hỏi vô cùng phức tạp, dữ liệu rất độc đáo và rủi ro cực kỳ cao", Sean Bruich, Phó Chủ tịch cấp cao về Trí tuệ nhân tạo và Dữ liệu của Amgen, cho biết trong thông báo chính thức.

Việc truy cập vào Rosalind bị hạn chế một cách có chủ ý. Mô hình này chỉ dành cho doanh nghiệp tại Hoa Kỳ, được bảo mật sau khi trải qua quá trình đánh giá về trình độ và an toàn. Mối lo ngại này không phải là trừu tượng: một liên minh quốc tế gồm hơn 100 nhà khoa học đã kêu gọi kiểm soát chặt chẽ hơn dữ liệu sinh học được sử dụng để huấn luyện AI, viện dẫn rủi ro thiết kế mầm bệnh. Việc triển khai hạn chế của OpenAI là một phản ứng trực tiếp. Trong giai đoạn xem trước nghiên cứu, việc sử dụng sẽ không tiêu tốn tín dụng API hiện có.

Đây cũng không phải là bước đi đầu tiên của OpenAI vào quy trình làm việc khoa học. Không gian làm việc viết bài khoa học Prism ra mắt hồi tháng Giêng là bước đầu tiên. GPT-Rosalind là bước tiếp theo sắc bén hơn, chuyên biệt hơn—và là tín hiệu cho thấy các mô hình chuyên biệt theo lĩnh vực đang trở thành một mặt trận cạnh tranh đáng gờm.

Hiện chưa có loại thuốc nào được phát hiện hoàn toàn bằng trí tuệ nhân tạo vượt qua được thử nghiệm giai đoạn 3. Con số đó vẫn là con số không. Nhưng nếu GPT-Rosalind giúp một nhà nghiên cứu thiết kế một thí nghiệm tốt hơn nhanh hơn sáu tháng trên hàng nghìn phòng thí nghiệm, thì hiệu ứng tích lũy về những gì được phát hiện và thời điểm phát hiện có thể là yếu tố quyết định tất cả. Đó mới là luận điểm chính ở đây, và nó đáng được theo dõi sát sao.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
68
Thêm vào Yêu thích
18
Bình luận