Bộ gen AI đầu tiên trên thế giới ra đời, lập trình lại mã sự sống trong 3,5 tỷ năm và mở ra "khoảnh khắc ChatGPT" của sinh học.

Bài viết này được dịch máy
Xem bản gốc

[Giới thiệu] "Mã Sự Sống" do AI viết đã trở thành hiện thực! Hôm nay, Stanford và Viện Arc đã công bố một bước đột phá, sử dụng thể thực khuẩn ΦX174 làm khuôn mẫu để tạo ra bộ gen bằng AI lần đầu tiên. Mười sáu gen trong đó đã tiêu diệt thành công vi khuẩn E. coli và thậm chí loại bỏ cả vi khuẩn kháng thuốc, đánh dấu một "khoảnh khắc ChatGPT" thực sự đáng chú ý trong khoa học sự sống.

Lần đầu tiên trong lịch sử loài người, một bộ gen có đầy đủ chức năng đã được tạo ra bằng AI!

Năm 1977, nhà hóa sinh Frederick Sanger và những người khác đã hoàn thành trình tự bộ gen đầu tiên trong lịch sử - thể thực khuẩn ΦX174.

Hơn 40 năm sau, Stanford đã hợp tác với đội ngũ nghiên cứu của Viện Arc để sử dụng AI nhằm tạo ra bộ gen phage lần đầu tiên, bắt đầu với ΦX174.

Trong đó những bộ gen phage được thiết kế bởi AI trông như thế này:

Evo-Φ36

Nói một cách đơn giản, thể thực khuẩn ΦX174 là một loại virus lây nhiễm vi khuẩn E. coli. Nó có thể tiêu diệt vi khuẩn một cách chính xác nhưng lại vô hại đối với cơ thể con người.

Trước đây, việc thiết kế bộ gen không phải là một nhiệm vụ dễ dàng và đòi hỏi phải xem xét nhiều yếu tố, điều này đã hạn chế sự tiến bộ trong lĩnh vực sinh học tổng hợp.

Để đạt được mục đích này, Stanford và đội ngũ khác đã nghĩ ra một "vũ khí bí mật" -

Dựa trên quá trình đào tạo trên hàng triệu bộ gen, các mô hình ngôn ngữ DNA Evo 1 và Evo 2 có thể học các đặc điểm phức tạp của bộ gen ở quy mô không thể tưởng tượng được.

Nguyên lý hoạt động của nó tương tự như ChatGPT và được thiết kế đặc biệt để xử lý DNA.

Địa chỉ bài báo: https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1

Họ đã tổng hợp 285 bộ gen bằng cách sử dụng thể thực khuẩn ΦX174 làm khuôn mẫu.

Cuối cùng, người ta đã chứng minh được rằng 16 bộ gen có thể ức chế hiệu quả sự phát triển của vật chủ, không chỉ tiêu diệt chính xác vi khuẩn E. coli cụ thể mà còn không vô tình gây hại cho các chủng khác.

Một số phage được thiết kế bằng AI có khả năng sinh sản nhanh hơn và có sức cạnh tranh cao hơn so với phiên bản gốc, thậm chí có thể xử lý được vi khuẩn kháng thuốc mà phage tự nhiên khó xử lý.

Sự thành công của thí nghiệm này có ý nghĩa gì?

Nó đánh dấu một bước đột phá lớn trong lĩnh vực AI trong "sinh học tổng hợp"——

Lần đầu tiên, người ta đã xác minh thành công rằng AI có thể tạo ra hoàn toàn bộ gen phage có chức năng sinh học.

Điều này không chỉ mở rộng ranh giới thiết kế cuộc sống của con người mà còn cung cấp các liệu pháp thay thế mới để giải quyết các thách thức về sức khỏe như "kháng kháng sinh".

Lần đầu tiên lịch sử! AI tạo ra một bộ gen "hoàn chỉnh"

Trong bài đăng trên blog kỹ thuật mới nhất, đội ngũ cốt lõi đã chia sẻ chi tiết những bí quyết để thiết kế thành công lô bộ gen đầu tiên được tạo ra bằng AI.

Cho dù thiết kế một gen đơn lẻ hay toàn bộ bộ gen, đây đều là một vấn đề cực kỳ khó khăn.

Tính theo lịch sử của hệ thống lưu trữ thông tin di truyền, bộ gen đã tồn tại khoảng 4 tỷ năm và bộ gen DNA đã tồn tại khoảng 3,5 tỷ năm.

Vào tháng 2 năm nay, Viện Arc đã chứng minh rằng "họ" mô hình dựa trên bộ gen Evo có thể tạo ra thành công các protein đơn lẻ hoặc các hệ thống đa thành phần phức tạp, chẳng hạn như phức hợp CRISPR-Cas.

Nhưng việc thiết kế toàn bộ bộ gen lại là một chiến trường hoàn toàn mới!

Bởi vì thách thức cốt lõi của thiết kế bộ gen nằm ở tính phức tạp: nhiều gen tương tác với nhau và duy trì sự cân bằng tinh tế để đảm bảo sự sao chép, tính đặc hiệu của vật chủ và khả năng thích nghi tiến hóa.

Những thách thức này đơn giản là không tồn tại trong thiết kế protein đơn lẻ.

Để giải quyết thách thức này, đội ngũ nghiên cứu tại Viện Stanford Arc đã phát triển sê-ri công nghệ tiên tiến, trong đó:

  • một quy trình chú thích gen được thiết kế riêng cho các khung đọc chồng chéo;
  • Chiến lược tinh chỉnh có hệ thống và kỹ thuật từ gợi ý để lấy mẫu từ các mô hình ngôn ngữ bộ gen;
  • Một giải pháp sàng lọc mới được thiết kế cho bộ gen phage tổng hợp

ΦX174, cuộc đua tiếp sức kéo dài nửa thế kỷ

Để tạo ra bộ gen tổng hợp, bạn cũng cần có điểm khởi đầu đáng tin cậy.

Thể thực khuẩn ΦX174 - một bộ gen virus nhỏ chỉ có 5386 nucleotide mã hóa 11 gen.

Bên trái: Ảnh chụp vi thể của phage ΦX174; Bên phải: Cấu trúc 3D của một phage ΦX174 đơn lẻ

Kích thước của nó nằm trong phạm vi chi phí tổng hợp DNA hiện tại phải chăng, nhưng cũng đủ phức tạp để thử nghiệm khả năng thiết kế bộ gen.

Tuy nhiên, cấu trúc chồng chéo của gen ΦX174 tạo ra một trường hợp thử nghiệm khắc nghiệt:

Một đột biến đơn lẻ có thể ảnh hưởng đến nhiều protein, đòi hỏi chúng phải hoạt động bình thường dưới nhiều ràng buộc.

Ngoài ra, ΦX174 mã hóa nhiều linh kiện điều hòa và trình tự nhận dạng hoạt động chính xác cùng nhau để đảm bảo rằng phage có thể được đóng gói và sao chép chính xác trong tế bào chủ.

Bộ gen ΦX174 là cuộc chạy đua tiếp sức kéo dài nửa thế kỷ.

Năm 1977, Fred Sanger và đội ngũ đã tạo ra bộ gen người đầu tiên được giải trình tự hoàn chỉnh.

Năm 2003, Craig Venter và đội ngũ đã tổng hợp hoàn chỉnh lần đầu tiên bằng phương pháp hóa học, chứng minh rằng bộ gen có thể được xây dựng từ đầu.

Hiện nay, vào năm 2025, đội ngũ đã sử dụng ΦX174 làm khuôn mẫu để tạo ra bộ gen đầu tiên do AI tạo ra.

Sự tiến hóa này đánh dấu những khả năng cốt lõi định hình ngành di truyền học hiện đại: đầu tiên là học đọc (giải trình tự), sau đó là viết (tổng hợp) và bây giờ là thiết kế (tạo ra AI).

Bộ gen ΦX174

AI "Genome Factory" giải quyết câu đố chồng chéo

Như đã đề cập ở trên, ΦX174 chồng lấn các gen, khiến việc phát hiện bằng các công cụ tiêu chuẩn trở nên khó khăn vì nó chỉ có thể xác định 7 trong số 11 gen.

Để đạt được mục đích này, các nhà nghiên cứu đã tạo ra một quy trình chú thích chuyên dụng:

Bằng cách kết hợp tìm kiếm khung đọc mở (ORF) và so sánh tính tương đồng với cơ sở dữ liệu protein thực khuẩn, chúng tôi đã có thể xác định thành công tất cả các gen và thậm chí dự đoán một số gen A*.

Công cụ này tỏ ra hiệu quả khi đánh giá hàng nghìn chuỗi do AI tạo ra.

Các nhà nghiên cứu đặt ra một giới hạn: bộ gen được tạo ra phải dự đoán được ít nhất bảy kết quả trùng khớp với protein ΦX174 tự nhiên để đảm bảo "bộ dụng cụ sinh tồn" của phage được bảo tồn.

Tinh chỉnh Evo để giúp AI hiểu rõ hơn về vi khuẩn

Mô hình Evo ban đầu, được đào tạo dựa trên dữ liệu thực khuẩn khổng lồ, có thể tạo ra trình tự nhưng thiếu khả năng kiểm soát chính xác đối với ΦX174.

Vì lý do này, giám sát và điều chỉnh là lựa chọn duy nhất.

Sau đó, đội ngũ nghiên cứu tiếp tục huấn luyện Evo trên 14.466 chuỗi phage nhỏ được lựa chọn cẩn thận. Sau khi giảm thiểu sự trùng lặp, mô hình tập trung vào Đột biến liên quan đến ΦX174.

Sau khi tinh chỉnh, thông qua các từ gợi ý được thiết kế cẩn thận và các tham số lấy mẫu, Evo có thể tạo ra các chuỗi tương tự như quá trình tiến hóa của ΦX174 nhưng cũng mang tính đột phá.

Giống như cung cấp cho AI một khuôn mẫu truyền cảm hứng, cho phép nó truyền tải những ý tưởng mới vào những thứ quen thuộc.

Đánh giá và sàng lọc

Sau khi tạo ra các trình tự, các tác giả đã phát triển một hệ thống đánh giá đa chiều có thể kiểm tra sự sắp xếp gen, tính đặc hiệu của vật chủ và sự đa dạng tiến hóa.

Điều quan trọng là phải đảm bảo rằng phage AI có thể lây nhiễm chủng không gây bệnh được sử dụng trong thí nghiệm - Escherichia coli loại C.

Sau đó, họ yêu cầu trình tự này phải bao gồm một protein đột biến tương tự như ΦX174, vì protein này quyết định phạm vi vật chủ của ΦX174.

Các thí nghiệm đã chỉ ra rằng tất cả 16 loại thực khuẩn thể chức năng đều nhắm mục tiêu nghiêm ngặt đến vi khuẩn Escherichia coli loại C và vi khuẩn Escherichia coli loại W.

Hơn nữa, nó không có hiệu quả đối với sáu chủng vi khuẩn khác được thử nghiệm.

Điều này chứng minh rằng tính đặc hiệu của vật chủ có thể được duy trì trong khi các vùng khác của bộ gen tiến hóa đáng kể.

Một loại vi khuẩn ăn vi khuẩn mới đã ra đời sau khi tiêu diệt vi khuẩn chỉ trong 2 giờ

Nghiên cứu phage truyền thống chậm và phức tạp, do đó các nhà nghiên cứu đã cải tiến quy trình sàng lọc.

Họ sử dụng phương pháp lắp ráp Gibson để tổng hợp bộ gen, chuyển đổi nó thành vi khuẩn Escherichia coli loại C có khả năng thích hợp, sau đó theo dõi sự ức chế tăng trưởng của nó trong các đĩa 96 giếng.

Nhiễm trùng thành công sẽ khiến mật độ vi khuẩn (OD₆₀₀) giảm mạnh trong vòng 2-3 giờ.

Phương pháp này cho phép đội ngũ nghiên cứu thử nghiệm nhanh 285 thiết kế, cuối cùng xác nhận 16 loại thực khuẩn thể chức năng và mô tả khả năng thích ứng cũng như phạm vi vật chủ của chúng.

Thử nghiệm thực nghiệm đánh giá các thể thực khuẩn được thiết kế bằng AI

Những bộ gen AI này mang 67-392 đột biến mới so với những bộ gen tự nhiên gần nhất.

Trong đó, Evo-Φ2147 mang 392 đột biến và có mức độ đồng nhất nucleotide trung bình là 93,0% với phage NC51.

Theo một số tiêu chuẩn phân loại, loài này đủ điều kiện để được công nhận là một loài mới.

Ngoài ra, 13 bộ gen chứa các đột biến chưa từng thấy trong tự nhiên, chứng tỏ rằng Evo có thể khai thác không gian trình tự mà quá trình tiến hóa tự nhiên chưa từng khám phá.

Một phát hiện rất thú vị là một trong những thể thực khuẩn tổng hợp, Evo-Φ36, đã kết hợp protein đóng gói DNA J của thể thực khuẩn G4 có họ hàng xa (25 so với 38 axit amin).

Đây là một vấn đề kỹ thuật chưa được giải quyết trong quá khứ.

Sử dụng kính hiển vi điện tử lạnh, các nhà nghiên cứu thấy rằng nó được nhúng vào cấu trúc capsid theo một cách độc đáo và AI khéo léo phối hợp các đột biến bù trừ để cho phép tổ hợp protein mới hoạt động bình thường.

Cuộc truy đuổi vi khuẩn kháng thuốc xuyên thế hệ, lần lần đảo ngược

Kháng thuốc kháng sinh là một trong những thách thức cấp bách nhất mà y học hiện đại phải đối mặt, cướp đi sinh mạng của hàng trăm nghìn người, thậm chí nhiều hơn, mỗi năm.

Vi khuẩn có thể nhanh chóng phát triển khả năng kháng thuốc kháng sinh truyền thống, làm hạn chế đáng kể hiệu quả điều trị.

Liệu pháp phage hứa hẹn có thể đảo ngược tình trạng này, nhưng phage tự nhiên thường không thể theo kịp quá trình tiến hóa của vi khuẩn.

Trong nghiên cứu, đội ngũ nghiên cứu đã tạo ra ba chủng Escherichia coli loại C có khả năng kháng ΦX174, trong đó operon waa (chịu trách nhiệm sửa đổi thụ thể bề mặt của vi khuẩn) bị đột biến.

Kết quả cho thấy "hỗn hợp phage" do AI tạo ra đã tiêu diệt được ba chủng kháng thuốc trong vòng lần lần cấy truyền.

Tuy nhiên, chỉ riêng ΦX174 thì hoàn toàn không có hiệu quả.

Điều đáng nói là những thể thực khuẩn đạt được đột phá này là "bộ gen khảm". Chúng hợp nhất nhiều đoạn AI và các đột biến tập trung ở vùng tương tác thụ thể.

Phân tích trình tự cho thấy các phage thành công kết hợp 2-3 linh kiện di truyền khác nhau được thiết kế bởi AI.

Theo cách này, con người không cần phải dựa vào các loại thực khuẩn thể hiếm trong tự nhiên mà có thể để AI trực tiếp tạo ra các nhóm đa dạng, hình thành nên "nhiều đợt tấn công" và khiến vi khuẩn khó phát triển khả năng kháng thuốc toàn diện.

Tóm lại, AI có thể nhanh chóng sàng lọc ra các trình tự gen hiệu quả, nghĩa là liệu pháp thực khuẩn không còn là quá trình "thử và sai" dựa trên may rủi nữa mà là một "thiết kế" chính xác.

Trong tương lai, con người sẽ có thể chủ động thiết kế các phương pháp điều trị đi trước một bước và luôn đi trước Đột biến của vi khuẩn.

Cuộc cách mạng di truyền 2.0: Viết mã sự sống

Ngày nay, liệu pháp thực khuẩn đang trở thành vũ khí ngày càng hiệu quả chống lại vi khuẩn kháng nhiều loại thuốc.

Gần đây, mục tiêu điều trị y tế chủ yếu nhắm vào các tác nhân gây bệnh thực vật hoặc các thực khuẩn DNA lớn.

Nghiên cứu mới nhất đã chứng minh rằng các mô hình AI có thể nắm bắt được những hạn chế về mặt tiến hóa và thu hẹp khoảng cách giữa các chuỗi do AI tạo ra và thực tế sinh học thông qua đào tạo, kiểm soát chất lượng và xác minh chất lượng cao.

Khi chi phí lặp lại và tổng hợp mô hình giảm, thiết kế toàn bộ bộ gen sẽ mở ra không gian tiến hóa chưa được khám phá và mở ra những lĩnh vực mới cho công nghệ sinh học và nghiên cứu cơ bản.

Sự thay đổi này, từ đọc sang viết rồi đến thiết kế, đánh dấu một chương mới trong khả năng biến đổi sinh học ở cấp độ cơ bản nhất của nhân loại.

Tác giả cốt lõi

Brian Hie

Tôi là Trợ lý Giáo sư Kỹ thuật Hóa học tại Đại học Stanford và là Nghiên cứu viên Đổi mới của Viện Arc, nơi tôi tiến hành nghiên cứu tại giao điểm giữa sinh học và trí tuệ nhân tạo.

Ông nhận bằng Tiến sĩ từ MIT CSAIL và bằng Cử nhân từ Đại học Stanford.

Samuel King

Samuel King là ứng viên tiến sĩ tại Đại học Stanford, hiện đang làm việc tại Viện Arc, nơi nghiên cứu về sinh học tổng hợp và ML.

Ông tốt nghiệp Đại học British Columbia (UBC) với bằng Cử nhân Khoa học (Danh dự) chuyên ngành Sinh học.

Tham khảo:

https://x.com/samuelhking/status/1968329299364376698 https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1

https://arcinstitute.org/news/hie-king-first-synthetic-phage

Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , do Taozi biên tập và được 36Kr đăng tải với sự cho phép.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận