4분 만에 노벨상 수상을 성공적으로 재현한 CMU는 GPT-4 화학자, 독립적으로 코딩되고 제어되는 로봇을 개발하여 화학 연구를 전복시켰으며 Nature에 게재됨

avatar
36氪
12-21
이 기사는 기계로 번역되었습니다
원문 표시

AI가 화학 연구를 전복하고 다시 한번 자연에 등장합니다! CMU와 Emerald Cloud Lab 팀이 개발한 GPT-4 기반 AI 도구는 4분 이내에 2010년 노벨상 연구 결과를 성공적으로 재현했습니다.

올해 ChatGPT 대형 모델이 인기를 얻었고 예기치 않게 화학 분야 전체를 뒤흔들었습니다.

첫째, Google DeepMind의 AI 도구인 GNoME는 200만 개의 결정 구조를 성공적으로 예측했으며, Microsoft는 MatterGen을 출시하여 필요한 재료 특성의 설계를 크게 가속화했습니다.

오늘 CMU와 Emerald Cloud Lab의 연구팀은 새로운 자동화 AI 시스템인 Coscientist를 개발했으며 이는 Nature에 등재되었습니다.

다양한 반응을 설계, 코딩 및 실행할 수 있어 화학 실험실을 완전히 자동화할 수 있습니다.

실험 평가에서 Coscientist는 GPT-4를 사용하여 인간의 지시에 따라 화학 문헌을 검색하고 분자 합성을 위한 반응 경로를 성공적으로 설계했습니다.

GPT-4는 인터넷의 사용 설명서를 탐색하고 데이터베이스에서 최고의 키트와 시약을 선택하여 실제 생활에서 분자를 만듭니다.

논문 주소: https://www.nature.com/articles/s41586-023-06792-0

가장 충격적인 점은 Coscientist가 노벨상 수상 연구를 단 4분 만에 재현했다는 점입니다.

특히, 새로운 AI 시스템은 "팔라듐 촉매 결합 반응"의 성공적인 최적화를 포함하여 6가지 다른 작업에서 화학 연구를 가속화할 수 있는 잠재력을 보여주었습니다.

'팔라듐 촉매 결합반응'에 관한 연구는 미국의 화학자 리차드 프레드 헥(Richard Fred Heck)이 수행했으며, 일본의 화학자 2명이 2010년 노벨 화학상을 수상했습니다.

연구를 주도한 CMU 화학자 게이브 고메(Gabe Gome)는 “인간이 발명한 화학 반응을 자율적으로 계획하고 설계하고 실행할 수 있는 비유기 지능을 본 순간 정말 놀랐다”고 말했다.

GPT-4 자동화 화학 연구

현재 과학 분야에서는 인공지능 도구가 확산되고 있지만, 연구실에서 일하는 연구자나 코딩에 능숙하지 않은 사람들은 인공지능을 쉽게 접할 수 없습니다.

우리 모두는 화학 연구가 반복적인 주기에 기반을 두고 있다는 것을 알고 있습니다. 이 주기에서는 특정 목표를 달성하기 위해 실험이 설계, 실행 및 개선됩니다.

화학자의 경우 수행되는 연구는 다방면에 걸쳐 진행됩니다. 즉, 화학 반응을 수행하는 데 필요한 기술적 능력뿐만 아니라 이를 계획하고 설계하는 데 필요한 지식도 필요합니다.

예를 들어, 새로운 물질을 합성할 때 화학자들은 최종 목표 물질부터 단계별로 생각하여 초기 분자를 결정하는 "재합성 분석"이 필요하며, 그런 다음 데이터베이스에서 적합한 반응 조건을 검색하고 가장 높은 합성 경로를 선택합니다. 성공 확률.

그러나 실제 실험에서는 화학반응을 통해 기대했던 높은 수율과 선택성을 갖춘 생성물을 생산하지 못하는 경우가 종종 있음이 밝혀졌습니다.

이때 다시 문헌을 검색하고 새로운 실험 경로를 설계하고 실험을 다시 시도해야 하며 전체 반복 과정은 파악하기 어려워집니다.

인간 화학자에게는 해당 지식이 있어도 화학 반응을 설계하고 실행하는 것이 쉽지 않습니다. 설계된 화학 반응은 종종 이상적인 속도로 생성물을 생성하기 어렵기 때문입니다.

OpenAI가 지난 3월 GPT-4를 출시했을 때 Gomes와 팀원들은 대형 모델이 화학자들에게 도움이 되도록 만드는 방법에 대해 생각하기 시작했습니다.

Gomes는 "Coscientists는 정말 잘 훈련된 화학자가 할 수 있는 대부분의 일을 할 수 있습니다"라고 말했습니다.

인간 과학자가 Coscientist에게 특정 분자 합성을 요청하면 Coscientist는 인터넷을 검색하여 합성 경로를 고안한 다음 원하는 반응에 대한 실험 프로토콜을 설계합니다.

구체적인 실험 계획을 얻은 후 피펫팅 스테이션에 지시하는 코드를 작성한 다음 코드를 실행하여 로봇이 프로그래밍된 작업을 수행하도록 할 수 있습니다.

정말 멋진 점은 Coscientist가 반응 결과로부터 학습하고 이를 개선하기 위해 프로토콜 변경을 제안할 수도 있다는 것입니다.

이 반복 주기는 원하는 실험 목표를 달성하기 위해 반응을 최적화합니다.

AI는 화학 로봇을 제어하는 ​​코드를 작성합니다.

분명히 현재의 첨단 화학 로봇은 인간 화학자가 작성한 컴퓨터 코드로 제어되는 경우가 많습니다.

Coscientist 시스템은 AI가 작성한 컴퓨터 코드로 로봇이 제어된다는 사실을 처음으로 실현했습니다.

연구원들은 먼저 Coscientist에게 몇 가지 간단한 작업을 완료하도록 요청했습니다. 로봇 액체 처리기를 제어하여 격자 모양으로 배열된 96개의 작은 구멍이 있는 접시에 유색 액체를 분배하는 것이었습니다.

"한 줄씩 걸러 색을 그려라", "파란색 대각선을 그려라", "노란색으로 3x3 직사각형을 그려라", "빨간색 십자가를 그려라" 등의 질문을 받았다.

액체 취급 로봇을 이용한 다양한 설계에 대한 교육을 받은 우주학자

액체 핸들러는 초기 시험일 뿐이며 팀원들은 Emerald Cloud Lab을 통해 Coscientist에게 더 많은 유형의 로봇 장비를 소개할 예정입니다.

실험실에는 화학 시료에 흡수된 빛의 파장을 측정하는 분광계를 포함하여 다양한 자동화 장비가 갖추어져 있습니다.

접시에는 세 가지 다른 색상(빨간색, 노란색, 파란색)의 액체가 들어 있습니다. 우주 과학자들은 이 액체가 어떤 색인지, 접시 위의 위치를 ​​결정하도록 요청받습니다.

Coscientists는 "눈"이 없으며 신비한 색판을 분광 광도계에 자동으로 전달하고 각 구멍에 흡수된 빛의 파장을 분석하여 어떤 색이 있는지와 색판에서의 위치를 ​​식별하는 코드만 작성할 수 있습니다.

이 작업을 위해 연구자들은 Coscientist에게 약간의 힌트를 주어 다양한 색상이 빛을 흡수하는 방식을 고려하도록 지시해야 했습니다.

나머지 작업은 완전히 AI 시스템에 맡겨 완료하면 됩니다.

Coscientist가 생성한 코드입니다. 이는 다음 단계로 분류됩니다: 메서드에 대한 메타데이터 정의, 랩웨어 모듈 로드, 액체 처리기 설정, 필요한 시약 전송 수행, 히터 셰이커 모듈 설정, 반응 실행 및 모듈 종료 .

4분 안에 노벨상을 재현하고 코드 오류를 독립적으로 수정

Coscientist의 궁극적인 테스트는 조립된 모듈 과 훈련을 함께 결합하여 "스즈키와 소노가시라 반응"을 수행하라는 연구팀의 명령을 완료하는 것입니다.

1970년대에 발견된 이 반응은 금속 팔라듐을 촉매로 사용하여 유기 분자의 탄소 원자 사이에 결합을 형성합니다.

이러한 반응은 염증, 천식 및 기타 질병을 치료하기 위한 새로운 약물을 생산하는 데 유용한 것으로 입증되었습니다. 또한 유기 반도체뿐만 아니라 많은 스마트폰과 디스플레이에 사용되는 유기발광다이오드에도 사용됩니다.

놀랍게도 이러한 획기적인 반응과 광범위한 영향은 Sukuzi, Richard Heck 및 Ei-ichi Negishi에게 수여된 2010년 노벨상으로 공식적으로 인정되었습니다.

물론 Coscientists는 이전에 이러한 반응을 시도한 적이 없었습니다.

Coscientist의 기술 문서 검색용 소프트웨어 모듈 설계한 MacKnight는 "가장 놀라운 순간은 그것이 모든 올바른 질문을 묻는 것을 보는 것이었습니다."라고 말했습니다.

Coscientist는 주로 Wikipedia에서 답변을 찾았지만 American Chemical Society, Royal Society of Chemistry 및 Suzuki와 Sonogashira 반응을 설명하는 학술 논문이 포함된 기타 사이트를 비롯한 여러 다른 사이트에서도 답변을 찾았습니다.

팔라듐 촉매 결합반응의 전 과정

Coscientist는 팀에서 제공한 화학 물질을 사용하여 원하는 반응을 생성하는 정확한 프로그램을 4분 이내에 설계했습니다.

실제 세계에서 프로그램을 실행하기 위해 로봇을 사용하려고 시도했을 때 액체 샘플을 가열하고 흔드는 장치를 제어하기 위해 작성한 코드에 "실수"가 있었습니다.

그러나 누구도 묻지 않고 Coscientist는 즉시 문제를 발견하고 장치의 기술 매뉴얼을 다시 참조하여 코드를 수정하고 다시 시도했습니다.

결과는 투명한 액체의 작은 샘플 몇 개에 포함되어 있습니다. Boiko는 샘플을 분석하여 Suzuki 반응과 Sonogashira 반응의 스펙트럼 특성을 발견했습니다.

Boiko와 MacKnight가 Gomes에게 Coscientist의 결과에 대해 말했을 때 Gomes는 회의적이었습니다.

"나는 그들이 나를 농담하는 줄 알았다"고 회상했다.

그러나 결과는 거기에 불과합니다. 믿을 수 없습니다.

"따라서 이 잠재적인 힘을 현명하게 사용하고 오용을 방지해야 할 필요성이 있습니다." 고메스는 인공 지능의 기능과 한계를 이해하는 것이 의도적이든 아니든 인공 지능의 유해한 사용을 효과적으로 방지할 수 있는 정보에 입각한 규칙과 정책을 개발하는 첫 번째 단계라고 말했습니다. 우연한.

Coscientist의 기본 아키텍처

연구진은 복잡한 과학 실험을 자율적으로 설계, 계획, 실행할 수 있는 다중 LLM 기반 지능형 에이전트(이하 Coscientist)를 제안했다. Coscientists는 도구를 사용하여 인터넷 및 관련 문서를 검색하고, 로봇 실험 API(응용 프로그래밍 인터페이스)를 사용하고, 다른 LLM을 활용하여 다양한 작업을 완료할 수 있습니다.

연구원들은 Coscientist의 다재다능함과 6가지 작업에 대한 성과를 입증했습니다.

(1) 알려진 화합물의 화학적 합성을 계획하기 위해 공공 데이터를 사용합니다.

(2) 대량 하드웨어 문서를 효율적으로 검색하고 찾아봅니다.

(3) 문서를 사용하여 클라우드 실험실에서 고급 명령을 실행합니다.

(4) 기본 지침을 사용하여 액체 취급 장비를 정확하게 제어합니다.

(5) 여러 하드웨어 모듈 의 동시 사용과 다양한 데이터 소스의 통합이 필요한 복잡한 과학 작업을 처리합니다.

(6) 이전에 수집된 실험 데이터의 분석이 필요한 최적화 문제를 해결합니다.

과학자들은 "여러 모듈(웹 및 문서 검색, 코드 실행)과의 상호 작용 및 실험을 통해" 복잡한 문제를 해결하는 데 필요한 지식을 얻습니다.

메인 모듈(Planner)의 목표는 아래에 정의된 명령어를 호출하여 사용자 입력을 기반으로 계획을 수행하는 것입니다.

플래너는 보조자 역할을 하는 GPT-4 채팅 인스턴스입니다. 사용자의 초기 입력 및 명령 출력은 플래너에게 사용자 정보로 간주됩니다. 플래너의 시스템 프롬프트(LLM 목표를 정의하는 정적 입력)는 모듈 방식으로 설계되었으며 작업 공간을 정의하는 네 가지 명령인 "GOOGLE", "PYTHON", "DOCUMENTATION" 및 "EXPERIMENT"로 설명됩니다.

계획자는 지식을 수집하기 위해 필요에 따라 이러한 명령을 호출합니다. GOOGLE 명령은 그 자체가 LLM 모듈 웹 검색 모듈 사용하여 인터넷을 검색하는 역할을 합니다.

PYTHON 명령을 사용하면 기획자는 "코드 실행" 모듈 사용하여 실험 준비 시 계산을 수행할 수 있습니다.

EXPERIMENT 명령은 DOCUMENTATION 모듈 에 설명된 API를 통해 "자동화"됩니다.

GOOGLE 명령과 마찬가지로 DOCUMENTATION 명령은 소스에서 기본 모듈 에 정보(이 경우 필수 API에 대한 문서)를 제공합니다.

연구원들은 Opentrons Python API 및 ECL(Emerald Cloud Labs) SLL(Symbolic Laboratory Language)과의 호환성을 입증했습니다. 이러한 모듈 함께 사용자로부터 간단한 일반 텍스트 입력 프롬프트(예: "다중 Suzuki 반응 수행")를 수신할 수 있는 Coscientist를 형성합니다. 위의 이미지는 이 아키텍처 전체를 보여줍니다.

또한 일부 명령은 하위 반응을 사용할 수 있습니다.

GOOGLE 명령은 프롬프트를 적절한 웹 검색 쿼리로 변환하고, Google 검색 API에서 해당 쿼리를 실행하고, 웹을 탐색하고, 답변을 플래너에게 다시 제공합니다.

마찬가지로 DOCUMENTATION 명령은 계획자가 EXPERIMENT 명령을 호출하는 데 필요한 문서(예: 로봇 액체 처리기 또는 클라우드 실험실)를 검색하고 요약합니다.

PYTHON 명령은 격리된 Docker 컨테이너(언어 모델에 의존하지 않음)를 사용하여 코드를 실행하여 플래너가 요청한 예기치 않은 작업으로부터 사용자 컴퓨터를 보호합니다.

중요한 것은 플래너 뒤에 있는 언어 모델이 소프트웨어에 실수가 있을 때 코드를 수정할 수 있다는 것입니다. 생성된 코드를 해당 하드웨어에서 실행하거나 수동 실험을 위한 합성 프로그램을 제공하는 자동화 모듈 의 EXPERIMENT 명령에도 동일하게 적용됩니다.

AI를 통해 누구나 과학자가 될 수 있다

자연의 크기와 복잡성은 거의 무한하며 셀 수 없이 많은 새로운 과학적 발견이 인간의 돌파구를 기다리고 있습니다.

에너지 효율을 획기적으로 향상시키는 새로운 초전도 물질이나 난치병을 치료하고 인간의 수명을 연장시키는 화합물을 상상해 보십시오.

그러나 이러한 혁신을 이루기 위해 필요한 교육과 훈련을 받는 것은 길고 힘든 여정이며, 과학자가 되는 것은 너무나 어렵습니다.

그러나 Gomes와 그의 팀은 Coscientist와 같은 인공 지능 지원 시스템이 과학 연구에 필요한 인력 수요를 충족할 수 있는 대량"AI 과학자"를 세상에 제공할 수 있는 솔루션이라고 생각합니다.

인간 과학자들에게도 휴식과 잠이 필요합니다. 인간이 주도하는 인공지능은 24시간 내내 '과학적 연구'를 수행할 수 있습니다.

"자율 AI 시스템은 새로운 현상, 새로운 반응, 새로운 아이디어를 발견할 수 있습니다."

과학에는 시행착오, 학습과 개선의 과정이 있는데, 인공지능은 이 과정을 크게 가속화할 수 있습니다.

"이것은 거의 모든 분야의 진입 장벽을 크게 낮출 수 있습니다"라고 Gomes는 말했습니다. 예를 들어, 팔라듐 촉매 결합 반응에 대한 교육을 받지 않은 생물학자가 이 반응의 용도를 새로운 방식으로 탐구하고 싶다면 Coscientist에게 실험 계획을 세우는 데 도움을 요청할 수 있습니다.

참고자료

https://www.nature.com/articles/d41586-023-04073-4

이 기사는 WeChat 공개 계정 "Xin Zhiyuan"(ID: AI_era) , 저자: Tao Zirun, 36 Krypton에서 승인을 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트