OpenAI는 최근 자사의 첫 번째 도메인 특화 AI 모델에 로잘린드 프랭클린 의 이름을 붙였습니다. 프랭클린은 X선 결정학 연구를 통해 DNA의 이중 나선 구조를 밝혀내는 데 기여한 영국의 화학자로, 생전에 그 공로를 인정받지 못한 것으로 유명합니다.
목요일에 공개된 GPT-Rosalind는 생물학, 신약 개발 및 임상 의학을 위해 특별히 설계된 추론 모델입니다. 이는 OpenAI가 '생명 과학 모델 시리즈'라고 부르는 것의 첫 번째 모델로, 대학부터 구글 딥마인드에 이르기까지 많은 전문 연구소들이 경쟁하는 시장을 겨냥한 직접적인 전략입니다.
전문가들에 따르면, 미국에서 신약 후보 물질 발굴부터 규제 승인까지 평균 10년에서 15년이 걸립니다. 그 시간의 대부분은 획기적인 발견보다는 수천 편의 논문을 분석하고, 데이터베이스를 검색하고, 시약을 설계하고, 모호한 결과를 해석하는 고된 작업에 소요됩니다. GPT-Rosaling은 바로 이러한 문제를 해결하고자 합니다.
OpenAI는 이 모델이 초기 단계 작업을 단축할 수 있다고 주장합니다. 회사 측은 GPT-Rosalind가 과학자들이 "더 많은 가능성을 탐색하고, 놓칠 수 있는 연결 고리를 찾아내고, 더 나은 가설을 더 빨리 도출할 수 있도록" 설계되었다고 설명했습니다.
벤치마크 결과는 적어도 그러한 목표를 어느 정도 뒷받침합니다. 실제 생물정보학 작업을 중심으로 구축된 벤치마크인 BixBench에서 GPT-Rosalind는 0.751의 통과율을 기록하며, 공개된 결과가 있는 모델 중 최고 점수를 받았습니다. LABBench2에서는 11개 작업 중 6개에서 이전 모델인 GPT-5.4보다 우수한 성능을 보였습니다.
GPT-Rosalind는 생명 과학 관련 모든 분야에서 GPT 5.4를 능가하지만, 매우 특수한 모델이기 때문에 그 외의 분야에서는 성능이 떨어질 것입니다.
OpenAI는 또한 Dyno Therapeutics가 미공개 RNA 서열을 기반으로 한 모델 테스트 및 평가를 지원하여 암기 오류를 배제할 것이라고 발표했습니다. GPT-Rosalind는 서열 예측 작업에서 상위 10개 제출물을 기준으로 인간 전문가의 95% 이상, 생성 작업에서는 약 84% 수준의 성능을 보였습니다.
하지만 오픈아이(OpenAI)의 생명과학 연구 책임자인 조이 지아오는 해당 모델의 실제 능력에 대해 신중한 입장을 보였습니다. 그녀는 로잘린드가 자율적으로 새로운 치료법을 개발할 수 있는 모델이라고 보지는 않지만, 연구 속도를 높이는 데 큰 도움이 될 수 있다고 기자들에게 설명했습니다. LA 타임스에 따르면 지아오는 기자회견에서 "연구자들이 과학 과정에서 가장 복잡하고 시간이 많이 걸리는 부분을 더 빠르게 진행할 수 있도록 도울 수 있는 실질적인 기회가 있다고 생각합니다."라고 말했습니다 .
모델을 둘러싼 생태계는 모델 자체만큼이나 중요할 수 있습니다. OpenAI는 또한 50개 이상의 과학 데이터베이스 및 도구(단백질 구조 검색, 서열 검색, 문헌 검토, 유전체학 파이프라인 등)에 연결되는 Codex용 무료 생명과학 연구 플러그인을 출시합니다. GPT-Rosalind 접근 권한이 있는 기업 사용자는 추론 레이어를 이용할 수 있으며, 그 외 사용자는 표준 모델과 함께 플러그인을 사용할 수 있습니다.
OpenAI는 출시를 앞두고 암젠, 모더나, 써모 피셔 사이언티픽 등 제약 및 바이오테크 고객사를 확보했습니다. 이와 별도로 로스앨러모스 국립연구소와 AI 기반 단백질 및 촉매 설계에 대한 연구 협력도 진행하고 있습니다.
암젠의 인공지능 및 데이터 담당 수석 부사장인 션 브루이히는 공식 발표에서 "생명과학 분야는 모든 단계에서 정확성을 요구합니다. 질문은 매우 복잡하고, 데이터는 매우 독특하며, 걸려 있는 위험 부담은 엄청나게 큽니다."라고 말했습니다.
로잘린드(Rosalind)에 대한 접근은 의도적으로 제한되어 있습니다. 이 모델은 미국 기업 전용이며, 자격 및 안전성 검토를 거쳐야 사용할 수 있습니다. 이러한 제한은 추상적인 문제가 아닙니다. 100명이 넘는 과학자들로 구성된 국제 연합은 병원체 설계 위험을 지적하며 AI 학습에 사용되는 생물학적 데이터에 대한 더욱 엄격한 통제를 요구한 바 있습니다. OpenAI의 제한적인 출시 정책은 이러한 요구에 대한 직접적인 대응입니다. 연구용 미리보기 기간 동안에는 기존 API 크레딧이 소모되지 않습니다.
이는 오픈아이(OpenAI)가 과학 워크플로우에 진출한 첫 번째 사례는 아닙니다. 지난 1월에 출시된 프리즘(Prism) 과학 논문 작성 워크스페이스가 그 첫걸음이었습니다. GPT-로잘린드(GPT-Rosalind)는 더욱 정교하고 전문화된 후속 제품으로, 특정 분야에 특화된 모델이 중요한 경쟁 요소로 부상하고 있음을 보여줍니다.
인공지능이 완전히 개발한 신약 중 3상 임상시험을 통과한 것은 아직 없습니다. 하지만 GPT-로잘린드가 수천 개의 연구실에서 연구자가 더 나은 실험을 설계하는 데 도움을 주어 평균 6개월을 단축할 수 있다면, 발견되는 신약의 종류와 시기에 미치는 파급 효과는 엄청날 수 있습니다. 이것이 바로 이 프로젝트의 핵심 주장이며, 앞으로 주목해야 할 부분입니다.




