OpenAI 的新型 AI 模型 Rosalind 或可將藥物研發週期縮短數年。但你可能無法使用它。

04-18

本文為機器翻譯

展示原文

OpenAI 剛剛將其第一個特定領域的 AI 模型以羅莎琳德·富蘭克林的名字命名——這位英國化學家的 X 射線晶體學研究幫助揭示了 DNA 的雙螺旋結構，但她生前卻因此被剝奪了應有的榮譽。

週四發佈的GPT-Rosalind 是一款專為生物學、藥物研發和轉化醫學領域打造的推理模型。它是 OpenAI 所稱的生命科學模型系列的首款產品，直接進軍這個眾多專業實驗室（從大學到谷歌 DeepMind）都在爭奪市場份額的市場。

專家表示，在美國，從發現靶點到獲得監管部門批准，一種藥物的研發平均需要10到15年。大部分時間並非耗費在靈光乍現的時刻，而是耗費在繁瑣的研究中：分析成千上萬篇論文、查詢數據庫、設計試劑以及解讀模稜兩可的結果。而這正是GPT-Rosaling試圖解決的問題。

OpenAI認為該模型可以縮短早期研究時間。正如該公司所說，GPT-Rosalind旨在幫助科學家“探索更多可能性，發現可能被忽略的聯繫，並更快地得出更好的假設”。

基準測試結果至少在一定程度上印證了這一雄心壯志。在圍繞真實生物信息學任務構建的基準測試 BixBench 上，GPT-Rosalind 的通過率為 0.751，在已發表結果的模型中得分最高。在 LABBench2 上，它在 11 項任務中的 6 項上都優於其前身 GPT-5.4。

GPT-Rosalind 在所有涉及生命科學的案例中都勝過 GPT 5.4，但它是一個非常特殊的模型，在生命科學以外的任何領域都會表現不佳。

OpenAI 還宣佈， Dyno Therapeutics將協助其基於未發表的 RNA 序列對模型進行測試和評估，以排除記憶效應的可能性。GPT-Rosalind 的十次最佳提交結果在序列預測任務中排名高於人類專家的 95% 分位，在序列生成任務中排名約為 84% 分位。

儘管如此，OpenAI生命科學研究負責人Joy Jiao對該模型的實際能力持謹慎態度。她解釋說，公司並不認為Rosalind能夠自主研發新療法，但她告訴記者，該模型可以極大地幫助加快研究進程。據《洛杉磯時報》報道，Jiao在新聞發佈會上表示：“我們認為，該模型確實有機會幫助研究人員更快地完成科學過程中一些最複雜、最耗時的環節。”

模型周圍的生態系統可能與模型本身同樣重要。OpenAI 還發布了一款免費的生命科學研究插件，用於 Codex，該插件可連接到 50 多個科學數據庫和工具，包括蛋白質結構查找、序列搜索、文獻綜述和基因組學流程。擁有 GPT-Rosalind 訪問權限的企業用戶可以獲得額外的推理層。其他用戶則可以使用包含標準模型的插件。

OpenAI已為此次發佈會拉攏了一批製藥和生物技術客戶，包括安進、Moderna和賽默飛世爾科技。此外，該公司還與洛斯阿拉莫斯國家實驗室開展人工智能引導的蛋白質和催化劑設計研究合作。

安進公司人工智能與數據高級副總裁肖恩·布魯伊奇在官方聲明中表示：“生命科學領域要求每一步都精準無誤。問題非常複雜，數據非常獨特，而且風險極高。”

Rosalind 的使用權限受到嚴格限制。該模型僅供美國企業使用，且需通過資質和安全審查。這種擔憂並非空穴來風：一個由 100 多位科學家組成的國際聯盟已呼籲加強對用於訓練人工智能的生物數據的管控，理由是存在病原體設計風險。OpenAI 的限制性推廣正是對此的直接回應。在研究預覽期間，使用該模型不會消耗現有的 API 額度。

這並非OpenAI首次涉足科學工作流程領域。今年1月推出的Prism科學寫作工作空間便是第一步。GPT-Rosalind則是更精細、更專業的後續產品，也標誌著特定領域模型正成為一股不容忽視的競爭力量。

目前還沒有任何完全由人工智能發現的藥物通過三期臨床試驗。這個數字仍然是零。但如果 GPT-Rosalind 能夠幫助研究人員在數千個實驗室中更快地設計出更優的實驗方案，並且節省六個月的時間，那麼它對最終發現的藥物種類和時間產生的累積效應，可能會徹底改變整個行業。這才是本文的真正論點，值得密切關注。