AI Sự lật đổ nghiên cứu hóa học và một lần nữa xuất hiện trên tạp chí Nature! Công cụ AI hỗ trợ GPT-4 do đội ngũ CMU và Emerald Cloud Lab phát triển đã tái tạo thành công kết quả nghiên cứu đạt giải Nobel năm 2010 trong vòng chưa đầy 4 phút.
Năm nay mô hình lớn ChatGPT trở nên phổ biến và không ngờ nó Sự lật đổ toàn bộ lĩnh vực hóa học.
Đầu tiên, công cụ AI GNoME của Google DeepMind đã dự đoán thành công 2 triệu cấu trúc tinh thể, sau đó Microsoft tung ra MatterGen, giúp tăng tốc đáng kể việc thiết kế các đặc tính vật liệu cần thiết.
Hôm nay, đội ngũ nghiên cứu của CMU và Emerald Cloud Lab đã phát triển một hệ thống AI tự động mới - Coscientist, được liệt kê trên tạp chí Nature.
Nó có thể thiết kế, mã hóa và thực hiện nhiều phản ứng khác nhau, tự động hóa hoàn toàn các phòng thí nghiệm hóa học.
Trong đánh giá thử nghiệm, Coscientist đã sử dụng GPT-4 để tìm kiếm tài liệu hóa học theo hướng dẫn của con người và thiết kế thành công lộ trình phản ứng để tổng hợp một phân tử.
GPT-4 xem qua sách hướng dẫn trên Internet và chọn ra các bộ dụng cụ cũng như thuốc thử tốt nhất trong cơ sở dữ liệu của mình để tạo ra các phân tử trong đời thực.
Địa chỉ giấy: https://www.nature.com/articles/s41586-023-06792-0
Điều gây sốc nhất là Coscientist đã sao chép lại nghiên cứu đạt giải Nobel chỉ trong 4 phút.
Cụ thể, hệ thống AI mới đã chứng minh tiềm năng tăng tốc nghiên cứu hóa học trong sáu nhiệm vụ khác nhau, trong đó tối ưu hóa thành công “các phản ứng ghép đôi được xúc tác bằng palladium”.
Nghiên cứu về “Phản ứng ghép đôi có xúc tác Palladi” được thực hiện bởi nhà hóa học người Mỹ Richard Fred Heck và hai nhà hóa học người Nhật đạt giải Nobel Hóa học năm 2010.
Nhà hóa học CMU Gabe Gome, người đứng đầu cuộc nghiên cứu, cho biết: “Thật ngạc nhiên khi tôi nhìn thấy một trí thông minh phi hữu cơ có khả năng tự lập kế hoạch, thiết kế và thực hiện các phản ứng hóa học do con người phát minh ra”.
Nghiên cứu hóa học tự động GPT-4
Hiện nay, các công cụ AI đang nở rộ trong các lĩnh vực khoa học, nhưng đối với các nhà nghiên cứu làm việc trong phòng thí nghiệm hoặc những người không thành thạo về mã hóa thì AI lại không có sẵn.
Tất cả chúng ta đều biết rằng nghiên cứu hóa học dựa trên các chu kỳ lặp đi lặp lại. Trong chu trình này, các thử nghiệm được thiết kế, thực hiện và sau đó được cải tiến để đạt được các mục tiêu cụ thể.
Đối với một nhà hóa học, nghiên cứu được thực hiện có tính chất đa hướng - không chỉ đòi hỏi các kỹ năng kỹ thuật để thực hiện các phản ứng hóa học mà còn cả kiến thức để lập kế hoạch và thiết kế chúng.
Ví dụ: khi tổng hợp một chất mới, các nhà hóa học cần "phân tích tổng hợp lại" để nghĩ lại từng bước từ chất đích cuối cùng để xác định các phân tử ban đầu, sau đó tìm kiếm các điều kiện phản ứng phù hợp trong cơ sở dữ liệu và chọn Con đường tổng hợp có hiệu suất cao nhất. xác suất thành công.
Tuy nhiên, trong các thí nghiệm thực tế, người ta thấy rằng các phản ứng hóa học thường không tạo ra sản phẩm có hiệu suất và độ chọn lọc cao như mong đợi.
Lúc này, cần phải tra cứu lại tài liệu, thiết kế lộ trình thử nghiệm mới và thử lại thử nghiệm, toàn bộ quá trình lặp đi lặp lại sẽ trở nên khó nắm bắt.
Đối với các nhà hóa học con người, ngay cả với kiến thức tương ứng, việc thiết kế và thực hiện một phản ứng hóa học không phải là điều dễ dàng, bởi vì phản ứng hóa học được thiết kế thường khó tạo ra sản phẩm với tốc độ lý tưởng.
Khi OpenAI phát hành GPT-4 vào tháng 3, Gomes và các thành viên đội ngũ bắt đầu nghĩ về cách tạo ra những mô hình lớn phục vụ các nhà hóa học.
Gomes nói: “Các nhà vũ trụ học có thể làm hầu hết những việc mà các nhà hóa học được đào tạo bài bản có thể làm”.
Khi một nhà khoa học con người yêu cầu Coscientist tổng hợp một phân tử cụ thể, họ sẽ tìm kiếm trên Internet để nghĩ ra lộ trình tổng hợp và sau đó thiết kế một quy trình thử nghiệm cho phản ứng mong muốn.
Sau khi có kế hoạch thử nghiệm cụ thể, nó có thể viết mã để hướng dẫn trạm trộn, sau đó chạy mã để robot thực hiện nhiệm vụ đã được lập trình để thực hiện.
Điều thực sự thú vị là Coscientist cũng có thể học hỏi từ kết quả của phản ứng và đề xuất những thay đổi đối với giao thức để cải thiện nó.
Chu trình lặp đi lặp lại này tối ưu hóa phản ứng để đạt được các mục tiêu thử nghiệm mong muốn.
AI viết mã để điều khiển robot hóa học
Rõ ràng, các robot hóa học công nghệ cao hiện nay thường được điều khiển bằng mã máy tính do con người viết ra.
Hệ thống Coscientist lần đầu tiên nhận ra rằng robot được điều khiển bằng mã máy tính do AI viết.
Đầu tiên, các nhà nghiên cứu yêu cầu Coscientist hoàn thành một số nhiệm vụ đơn giản, điều khiển một robot xử lý chất lỏng để phân phối chất lỏng màu vào một chiếc đĩa có 96 lỗ nhỏ được sắp xếp theo dạng lưới.
Nó được yêu cầu "thả một màu trên mỗi dòng khác", "vẽ một đường chéo màu xanh", "vẽ hình chữ nhật 3x3 màu vàng", "vẽ chữ thập màu đỏ", v.v.
Nhà vũ trụ học hướng dẫn các thiết kế khác nhau với robot xử lý chất lỏng
Bộ xử lý chất lỏng chỉ là bản thử nghiệm ban đầu và các thành viên đội ngũ cũng sẽ giới thiệu cho Coscientist nhiều loại thiết bị robot hơn thông qua Phòng thí nghiệm Đám mây Ngọc lục bảo.
Phòng thí nghiệm được trang bị nhiều dụng cụ tự động, bao gồm cả máy quang phổ đo bước sóng ánh sáng được hấp thụ bởi các mẫu hóa học.
Một chiếc đĩa chứa chất lỏng có ba màu khác nhau (đỏ, vàng và xanh), các nhà vũ trụ học được yêu cầu xác định những chất lỏng này có màu gì và chúng nằm ở vị trí nào trên đĩa.
Các nhà vũ trụ học không có “mắt” và chỉ có thể viết mã để tự động chuyển tấm màu bí ẩn tới máy quang phổ và phân tích bước sóng ánh sáng được hấp thụ bởi mỗi lỗ để xác định có những màu nào và vị trí của chúng trên tấm màu. .
Để thực hiện nhiệm vụ này, các nhà nghiên cứu đã phải cho Coscientist một gợi ý nhỏ, hướng dẫn họ xem xét cách các màu sắc khác nhau hấp thụ ánh sáng.
Nhiệm vụ còn lại hoàn toàn có thể giao cho hệ thống AI hoàn thành.
Mã được tạo bởi Coscientist. Nó được chia thành các bước sau: xác định dữ liệu cho phương pháp , tải mô-đun mô-đun phòng thí nghiệm, thiết lập mô-đun xử lý chất lỏng, thực hiện chuyển thuốc thử cần thiết, thiết lập mô-đun máy lắc gia nhiệt, chạy phản ứng và tắt mô-đun.
Tái hiện giải Nobel trong 4 phút và sửa lỗi mã độc lập
Thử nghiệm cuối cùng của Coscientist là kết hợp mô-đun đã lắp ráp và quá trình đào tạo để hoàn thành lệnh của đội ngũ nghiên cứu nhằm thực hiện "Phản ứng Suzuki và Sonogashira".
Phản ứng này, được phát hiện vào những năm 1970, sử dụng palladium kim loại làm chất xúc tác để hình thành liên kết giữa các nguyên tử cacbon trong các phân tử hữu cơ.
Những phản ứng này đã được chứng minh là hữu ích trong việc sản xuất các loại thuốc mới để điều trị chứng viêm, hen suyễn và các bệnh khác. Chúng cũng được sử dụng trong chất bán dẫn hữu cơ, cũng như trong các điốt phát sáng hữu cơ được tìm thấy trong nhiều điện thoại thông minh và màn hình.
Điều đáng chú ý là những phản ứng mang tính đột phá này và tác động lan rộng của chúng đã được chính thức công nhận với giải thưởng Nobel năm 2010 được trao cho Sukuzi, Richard Heck và Ei-ichi Negishi.
Tất nhiên, các nhà vũ trụ học chưa bao giờ thử những phản ứng này trước đây.
MacKnight, người đã thiết kế mô-đun mềm của Coscientist để tìm kiếm tài liệu kỹ thuật, cho biết: "Khoảnh khắc tuyệt vời nhất đối với tôi là thấy nó hỏi tất cả các câu hỏi phù hợp."
Coscientist chủ yếu tìm câu trả lời trên Wikipedia, nhưng cũng trên một số trang khác, bao gồm Hiệp hội Hóa học Hoa Kỳ, Hiệp hội Hóa học Hoàng gia và các trang khác chứa các bài báo học thuật mô tả phản ứng Suzuki và Sonogashira.
Toàn bộ quá trình phản ứng ghép đôi có xúc tác paladi
Trong vòng chưa đầy 4 phút, Coscientist đã thiết kế một chương trình chính xác tạo ra phản ứng mong muốn bằng cách sử dụng các hóa chất do đội ngũ cung cấp.
Khi nó cố gắng sử dụng robot để thực thi chương trình trong thế giới thực, nó đã "phạm lỗi" trong đoạn mã mà nó viết để điều khiển một thiết bị làm nóng và lắc các mẫu chất lỏng.
Nhưng không cần ai nhắc nhở, Coscientist ngay lập tức phát hiện ra vấn đề, tham khảo lại hướng dẫn kỹ thuật của thiết bị, sửa mã và thử lại.
Kết quả được chứa trong một số mẫu chất lỏng trong suốt nhỏ. Boiko đã phân tích mẫu và phát hiện ra các dấu hiệu quang phổ của phản ứng Suzuki và phản ứng Sonogashira.
Khi Boiko và MacKnight nói với Gomes về kết quả của Coscientist, Gomes tỏ ra nghi ngờ.
“Tôi nghĩ họ đang đùa tôi,” anh nhớ lại.
Nhưng kết quả chỉ có ở đó, thật không thể tin được.
Gomes cho biết hiểu được khả năng và hạn chế của trí tuệ nhân tạo là bước đầu tiên để phát triển các quy tắc và chính sách sáng suốt có thể ngăn chặn một cách hiệu quả việc sử dụng trí tuệ nhân tạo có hại, dù cố ý hay không. tình cờ.
Kiến trúc cơ bản của Coscientist
Các nhà nghiên cứu đã đề xuất một tác nhân thông minh dựa trên nhiều LLM (sau đây gọi là Nhà khoa học vũ trụ), có khả năng tự động thiết kế, lập kế hoạch và thực hiện các thí nghiệm khoa học phức tạp. Các nhà khoa học có thể sử dụng các công cụ để duyệt Internet và tài liệu liên quan, sử dụng Giao diện lập trình ứng dụng thử nghiệm robot (API) và tận dụng các LLM khác để hoàn thành nhiệm vụ khác nhau.
Các nhà nghiên cứu đã chứng minh tính linh hoạt và hiệu suất của Coscientist qua sáu nhiệm vụ:
(1) Sử dụng dữ liệu công khai để lập kế hoạch tổng hợp hóa học các hợp chất đã biết;
(2) Tìm kiếm và duyệt lượng lớn tài liệu phần cứng một cách hiệu quả;
(3) Sử dụng tài liệu để thực thi các lệnh nâng cao trong phòng thí nghiệm đám mây;
(4) Sử dụng các hướng dẫn cơ bản để điều khiển chính xác các dụng cụ xử lý chất lỏng;
(5) Xử lý nhiệm vụ khoa học phức tạp đòi hỏi sử dụng đồng thời nhiều mô-đun cứng và tích hợp các nguồn dữ liệu khác nhau;
(6) Giải các bài toán tối ưu hóa yêu cầu phân tích dữ liệu thực nghiệm đã thu thập trước đó.
Các nhà khoa học thu được kiến thức cần thiết để giải quyết các vấn đề phức tạp "thông qua tương tác với nhiều mô-đun(tìm kiếm trên web và tài liệu, thực thi mã) và thử nghiệm."
Mục tiêu của mô-đun chính (Planner) là thực hiện lập kế hoạch dựa trên đầu vào của người dùng bằng cách gọi các lệnh được xác định bên dưới.
Trình lập kế hoạch là một phiên bản trò chuyện GPT-4 đóng nhân vật trợ lý. Đầu vào và đầu ra lệnh ban đầu của người dùng được coi là thông tin người dùng đối với người lập kế hoạch. Lời nhắc hệ thống của người lập kế hoạch (đầu vào tĩnh xác định mục tiêu LLM) được thiết kế theo kiểu mô-đun và được mô tả dưới dạng bốn lệnh xác định không gian vận hành: "GOOGLE", "PYTHON", "TÀI LIỆU" và "THỬ NGHIỆM".
Người lập kế hoạch gọi những lệnh này khi cần thiết để thu thập kiến thức. Lệnh GOOGLE chịu trách nhiệm tìm kiếm trên Internet bằng cách sử dụng mô-đun tìm kiếm trên web, bản thân mô-đun mô-đun là LLM.
Lệnh PYTHON cho phép người lập kế hoạch sử dụng mô-đun"thực thi mã" để thực hiện các phép tính chuẩn bị cho thí nghiệm.
Lệnh THỬ NGHIỆM được "tự động hóa" thông qua API được mô tả bởi mô-đun TÀI LIỆU.
Giống như lệnh GOOGLE, lệnh DOCUMENTATION cung cấp thông tin cho mô-đun chính từ nguồn, trong trường hợp này là tài liệu về API được yêu cầu.
Các nhà nghiên cứu đã chứng minh khả năng tương thích với API Opentrons Python và Ngôn ngữ phòng thí nghiệm biểu tượng (SLL) của Emerald Cloud Labs (ECL). Cùng với nhau, mô-đun này tạo thành Nhà khoa học vũ trụ, có thể nhận lời nhắc nhập văn bản đơn giản đến từ người dùng (ví dụ: "Thực hiện nhiều phản ứng Suzuki"). Hình ảnh trên cho thấy toàn bộ kiến trúc này.
Ngoài ra, một số lệnh có thể sử dụng phản ứng phụ.
Các lệnh của GOOGLE chuyển đổi lời nhắc thành các truy vấn tìm kiếm trên web thích hợp, chạy các truy vấn đó trong API Tìm kiếm của Google, duyệt web và cung cấp câu trả lời lại cho người lập kế hoạch.
Tương tự, lệnh TÀI LIỆU truy xuất và tóm tắt tài liệu cần thiết (ví dụ: bộ xử lý chất lỏng bằng rô-bốt hoặc phòng thí nghiệm trên đám mây) để người lập kế hoạch gọi lệnh THỬ NGHIỆM.
Lệnh PYTHON thực thi mã bằng cách sử dụng bộ chứa Docker biệt lập (không dựa vào bất kỳ mô hình ngôn ngữ nào) để bảo vệ máy của người dùng khỏi mọi hành động không mong muốn mà người lập kế hoạch yêu cầu.
Điều quan trọng là mô hình ngôn ngữ đằng sau công cụ lập kế hoạch có thể sửa mã khi phần mềm mắc lỗi. Điều tương tự cũng áp dụng cho lệnh THỬ NGHIỆM của mô-đun tự động hóa, thực thi mã được tạo trên phần cứng tương ứng hoặc cung cấp chương trình tổng hợp cho các thử nghiệm thủ công.
AI cho phép mọi người trở thành nhà khoa học
Quy mô và sự phức tạp của thiên nhiên gần như là không giới hạn và vô số khám phá khoa học mới đang chờ đợi những đột phá của con người.
Hãy tưởng tượng những vật liệu siêu dẫn mới giúp cải thiện đáng kể hiệu quả sử dụng năng lượng hoặc các hợp chất có thể chữa khỏi những căn bệnh nan y và kéo dài tuổi thọ của con người.
Tuy nhiên, có được sự giáo dục và đào tạo cần thiết để tạo ra những bước đột phá này là một hành trình dài và gian khổ, và việc trở thành một nhà khoa học đơn giản là quá khó khăn.
Nhưng Gomes và đội ngũ của ông hình dung rằng các hệ thống được hỗ trợ bởi trí tuệ nhân tạo như Coscientist là giải pháp có thể cung cấp cho thế giới lượng lớn“nhà khoa học AI” để đáp ứng nhu cầu nhân lực nghiên cứu khoa học.
Các nhà khoa học con người cũng cần nghỉ ngơi và ngủ. Trí tuệ nhân tạo do con người hướng dẫn có thể tiến hành "nghiên cứu khoa học" suốt ngày đêm.
"Hệ thống AI tự động có thể khám phá những hiện tượng mới, phản ứng mới và ý tưởng mới."
Có một quá trình thử và sai, học hỏi và cải tiến trong khoa học và trí tuệ nhân tạo có thể đẩy nhanh quá trình này một cách đáng kể.
Gomes nói: “Điều này có thể làm giảm đáng kể các rào cản gia nhập ở hầu hết mọi lĩnh vực”. Ví dụ: nếu một nhà sinh vật học không được đào tạo về phản ứng ghép đôi được xúc tác bằng palladium muốn khám phá công dụng của phản ứng theo cách mới, họ có thể yêu cầu Nhà vũ trụ học giúp họ lập kế hoạch cho các thí nghiệm của mình.
Tham khảo
https://www.nature.com/articles/d41586-023-04073-4
Bài viết này đến từ tài khoản công khai WeChat "Xin Zhiyuan" (ID: AI_era) , tác giả: Tao Zirun và 36 Krypton được xuất bản với sự cho phép.




