Tóm tắt của tác giả GPT-5: Trong khi OpenAI đang tập trung vào ChatGPT, Anthropic đã không ngừng nghiên cứu mã nguồn – một ví dụ điển hình về việc "ăn cắp" nền tảng.

06-08

Bài viết này được dịch máy

Xem bản gốc

Mùa hè năm 2017, tại một văn phòng bình thường ở Google Brain, tám người trẻ tuổi đã gõ ký tự cuối cùng của bài báo của họ, "Sự chú ý là tất cả những gì bạn cần". Vào thời điểm đó, hầu như không ai nhận ra rằng bài báo này sẽ châm ngòi cho một cuộc cách mạng trí tuệ nhân tạo trị giá nghìn tỷ đô la trong những năm tiếp theo. Theo lời của Lucas Kaiser, " Đối với chúng tôi, đó chỉ là một ngày làm việc bình thường khác. "

Tám tác giả này sau đó đã rời Google, trở thành "Nhóm Tám Người Biến Đổi" huyền thoại nhất trong lịch sử Thung lũng Silicon.

Gần mười năm sau, Lucas, hiện là nhà khoa học cấp cao tại OpenAI, sử dụng Cursor để hỗ trợ nghiên cứu hàng ngày. Điều thú vị là, điều đầu tiên anh yêu cầu AI thực hiện là dành hai ngày để tái tạo hoàn hảo bài báo khoa học của mình, bài báo mà anh không thể chạy được cách đây 15 năm vì đã mất mã nguồn.

Người trực tiếp tham gia thiết kế "cỗ máy thống kê" lớn nhất thế giới đã thẳng thắn thừa nhận tại bàn làm việc của mình: " Chúng ta thực sự vẫn chưa nắm bắt được bí ẩn thực sự của chính 'việc học'. "

Theo quan điểm của Lucas, ngành công nghiệp hiện nay đang rơi vào một cơn cuồng loạn mù quáng kỳ lạ. Mô hình lớn giống như một người học cực kỳ kém hiệu quả; nó phải ngấu nghiến hàng nghìn tỷ từ từ toàn bộ internet, cạn kiệt mọi khuôn mẫu sai sót, trước khi nó có thể thụ động "hiểu" một khái niệm cơ bản. Điều này không chỉ đi ngược lại phương pháp học tập của con người mà còn khiến Định luật Tỷ lệ hiện tại va phải tảng băng trôi kém hiệu quả.

Năm ngoái, khi Lucas trò chuyện với Li Jianzhong, Phó Chủ tịch cấp cao của CSDN, ông đã bác bỏ ý tưởng này, chỉ ra rằng "các mô hình suy luận hiện chỉ tương đương với giai đoạn rất sơ khai của mạng nơ-ron hồi quy (RNN)". Một năm sau, khi tiến độ nhanh chóng trong việc huấn luyện trước các mô hình lớn đã chậm lại đáng kể và ngành công nghiệp đã hoàn toàn chuyển trọng tâm sang triển khai tác nhân và khám phá kỹ thuật, thời gian đang chứng minh chính xác "suy nghĩ lạnh lùng" của ông là đúng.

Dưới đây là tóm tắt nhanh các điểm chính của cuộc trò chuyện này:

Các mô hình ngôn ngữ lớn thực sự có thể học được một khái niệm, nhưng chỉ khi tất cả các khả năng khác đã được khai thác triệt để. Nó khái quát hóa, nhưng nó làm như vậy bằng một cách tư duy độc đáo, "xa lạ" mà chúng ta không thể hoàn toàn hiểu được.

Hiện tại, mô hình chưa thể phát hiện chính xác liệu nó có đang ngày càng đi sâu vào ngõ cụt hay không.

Khi ngày càng nhiều người bắt đầu tích hợp các hệ thống này vào công việc hàng ngày, chúng ta sẽ tích lũy được một lượng lớn dữ liệu về quy trình làm việc thực tế của con người, kéo dài hàng tuần hoặc thậm chí hàng tháng. Một khi ai đó áp dụng học tăng cường vào các quy trình làm việc phức tạp này, nó có thể mang lại cho chúng ta những bất ngờ không ngờ tới.

Ngành công nghiệp trí tuệ nhân tạo thường xuyên trải qua những cơn sóng thần công nghệ; bạn phải luôn đặt cược vào xu hướng đại diện cho "tương lai", thay vì mù quáng khao khát sự thịnh vượng của "ngày hôm nay".

Một khi bạn rời khỏi sự bảo vệ của phòng thí nghiệm chính và nhìn thấy những con số khổng lồ cần thiết để mua card đồ họa cũng như sự khan hiếm của chúng, bạn có thể phải đối mặt với một thực tế khắc nghiệt.

Trong khi thế mạnh cốt lõi của OpenAI bị lu mờ bởi sự thành công vang dội của ChatGPT, Anthropic đã đưa ra một lựa chọn chiến lược vô cùng sáng suốt: tập trung toàn bộ nguồn lực vào chiến trường "mã lập trình", xây dựng một rào cản vững chắc trong điểm mù của các ông lớn với sự tập trung tuyệt đối.

Trực giác mách bảo chúng ta rằng nó nên thông minh hơn.

Người dẫn chương trình: Tôi nghĩ không có chủ đề mở đầu nào hay hơn "khái quát hóa". Đây có thể nói là trọng tâm của toàn bộ ngành công nghiệp hiện nay. Tháng 11 năm ngoái, tôi nghe ông đề cập đến một câu hỏi cốt lõi: liệu suy luận đơn thuần có đủ để đạt được khả năng khái quát hóa, hay chúng ta phải tìm ra những con đường hoàn toàn mới? Đó là nửa năm trước, tương đương với vài năm trong ngành công nghiệp AI đang phát triển nhanh chóng. Quan điểm của ông về vấn đề này đã thay đổi như thế nào trong thời gian đó?

Lukasz : Nếu bạn nhìn vào các Transformer hiện tại, sự kết hợp giữa khả năng suy luận và tác nhân, cùng với việc cho phép chúng truy cập vào hệ thống shell và nhiều công cụ khác nhau, thì khả năng của chúng thực sự đáng kinh ngạc. So với hai năm trước, chưa kể đến thời điểm trước khi Transformer ra đời, sự tiến bộ mà chúng ta đạt được đơn giản là không thể tin được. Nếu trước đây có ai đó nói với tôi rằng chỉ cần lấy một mô hình đơn giản về "dự đoán token tiếp theo", rồi thêm chuỗi suy nghĩ, học tăng cường và các công cụ khác có thể giải phóng sức mạnh lớn đến vậy, tôi sẽ không bao giờ tin điều đó. Cá nhân tôi dành vài giờ mỗi ngày để giao tiếp với Cursor, và hiệu suất của nó rất xuất sắc. Khi bạn thảo luận các vấn đề liên quan đến công việc với nó, nó không chỉ hiểu hoàn hảo mà còn giúp bạn triển khai chúng trực tiếp. Thật sự tuyệt vời.

Tuy nhiên, mặt khác, chúng ta luôn cảm thấy rằng nó vẫn còn khá khác biệt so với con người, dường như chưa đạt đến những giới hạn mà chúng ta kỳ vọng. Theo trực giác, chúng ta nghĩ rằng nó phải thông minh hơn, có khả năng khái quát hóa với ít dữ liệu hơn, đạt được những bước tiến vượt bậc hơn trong tư duy và tiếp thu các khái niệm mới với thông tin tối thiểu.

Gần đây tôi đã đưa ra một phép so sánh: ai đó đã nói đùa rằng người Mỹ luôn làm điều đúng đắn chỉ sau khi đã thử hết mọi lựa chọn sai lầm. Các mô hình ngôn ngữ lớn cũng tương tự. Chúng thực sự có thể học được một khái niệm, nhưng chỉ sau khi đã thử hết mọi khả năng khác. Bạn cần cung cấp cho nó hàng nghìn tỷ token, để nó khám phá tất cả các mô hình rõ ràng. Chỉ khi những mô hình rõ ràng này không còn giải thích được những điều mới mẻ, nó mới chủ động cố gắng hiểu logic cơ bản. Nhưng con người học hỏi không phải theo cách đó. Chúng ta chỉ cần rất ít dữ liệu để nắm vững một khái niệm, và đôi khi chúng ta thậm chí có thể tạo ra các khái niệm từ hư không – mặc dù không hoàn hảo, nhưng chúng ta vẫn làm được. Do đó, chúng ta luôn cảm thấy rằng phải có một cơ chế nào đó khác ẩn đằng sau điều này, đạt được hiệu quả khái quát hóa cao hơn nhiều và sở hữu sự hiểu biết cơ bản và lâu dài hơn.

Tuy nhiên, hiện tại đây chỉ là trực giác. Mỗi lần chúng ta cố gắng xác định cơ chế còn thiếu này, nó dường như biến mất—hay nói chính xác hơn, Transformer nhanh chóng bắt kịp. Trong thời gian này, cả hai con đường đều phát triển. Transformer ngày càng trở nên mạnh mẽ hơn, nhưng lời kêu gọi tìm kiếm các giải pháp thay thế cũng trở nên kiên quyết hơn.

Hiện nay, nhiều phòng thí nghiệm đang khám phá các kiến trúc mới cho "kỷ nguyên hậu Transformer" và đã đạt được một số kết quả nghiên cứu thú vị. Quả thực đang có những thay đổi đáng chú ý trong ngành công nghiệp này. Còn về việc ai sẽ thắng thế cuối cùng, tôi không thể biết được vào thời điểm này. Tôi tin rằng cả hai bên đều có những lập luận rất vững chắc, và quá trình đàm phán này sẽ vô cùng hấp dẫn.

Người dẫn chương trình: Điều này chắc hẳn rất hấp dẫn đối với khán giả của chúng ta. Trong bài thuyết trình gần đây tại NeurIPS, anh cũng đã đề cập đến "hiện tượng bất thường trong không khí" này - dường như có điều gì đó đang âm thầm thúc đẩy một số phòng thí nghiệm mới nổi (neolabs) và các nhà nghiên cứu thành lập phòng thí nghiệm riêng của họ và khám phá các giải pháp thay thế cho các kiến trúc do các công ty lớn thống trị. Cảm giác tinh tế này bắt nguồn từ đâu? Có phải từ một số đột phá thử nghiệm ban đầu, hay chỉ đơn giản là từ trực giác của các nhà nghiên cứu? Anh có thể mô tả cụ thể hơn cho khán giả của chúng ta được không?

Lukasz : Tôi nghĩ phần lớn đó là trực giác , và chúng ta phải luôn cảnh giác vì bầu không khí này thường âm ỉ trong các bữa tiệc và những cuộc trò chuyện thường nhật ở San Francisco. Nó có thể tự củng cố lẫn nhau ở một mức độ nào đó. Nhưng tôi tin rằng cũng có một điều gì đó rất cơ bản trong đó. Thực tế, Yann LeCun đã bày tỏ quan điểm tương tự nhiều năm trước.

Mặc dù các mô hình của chúng ta được gọi là "mạng thần kinh" và được thiết kế để mô phỏng bộ não con người, nhưng chúng thực sự không đạt được điều đó. Ngay cả với một số điểm tương đồng, vẫn có những khác biệt cơ bản. Nếu bạn quan sát cách con người học hỏi và hành động, bạn sẽ thấy rằng chúng ta có thể hoàn thành những việc phức tạp hơn nhiều với lượng dữ liệu ít hơn nhiều so với các mô hình hiện có. Giống như một "cỗ máy học tập", con người dường như sở hữu một khả năng cốt lõi nào đó mà các mô hình hiện tại thiếu. Do đó, về cơ bản, phải có một nguyên tắc khoa học chưa được khám phá nào đó đang hoạt động, chứ không chỉ là một cảm xúc nhất thời.

Tất nhiên, lập luận phản bác cũng rất rõ ràng: các mô hình này tiêu thụ hàng nghìn tỷ token trong quá trình huấn luyện, và con người không bao giờ gặp phải lượng dữ liệu lớn như vậy trong suốt cuộc đời. Do đó , chúng ta thực sự chưa tối ưu hóa các mô hình này cho "huấn luyện với dữ liệu nhỏ". Nếu bạn có cùng sức mạnh tính toán nhưng gặp phải những hạn chế về dữ liệu, bạn có thể dễ dàng tinh chỉnh Transformer để đạt được hiệu suất tốt hơn nhiều. Tại thời điểm này, một số người có thể đặt câu hỏi: tại sao lại phải làm tất cả những điều đó? Chúng ta có rất nhiều dữ liệu, và nó đã trở thành một ngành công nghiệp khổng lồ. Nhưng ngay cả khi chúng ta cố gắng huấn luyện với cùng một lượng dữ liệu như con người - và một lần nữa, con người nhận được lượng lớn đầu vào hình ảnh, di chuyển và thực hiện các hành động trong thế giới thực - thì kích thước của dữ liệu này hoàn toàn khác với văn bản thuần túy, khiến việc so sánh đơn giản trở nên khó khăn. Đây là lý do tại sao hiện nay rất khó để đưa ra một kết luận khoa học dứt khoát.

Nhưng trực giác này vẫn còn đó: vẫn còn những lĩnh vực chưa được khám phá vô cùng giá trị trong lĩnh vực máy học. Điều thú vị là một khi chúng ta tìm ra mảnh ghép còn thiếu này, các công nghệ hiện có có thể trải qua một bước nhảy vọt mang tính cách mạng. Tất nhiên, điều đó cũng có thể không xảy ra; có lẽ khoảng cách đó sẽ không đáng kể trước lượng dữ liệu khổng lồ. Ai biết được? Nhưng với tư cách là một nhà nghiên cứu, điều đó chắc chắn làm tôi say mê, và tôi tin rằng nhiều đồng nghiệp của tôi cũng có chung cảm nhận này.

Sức hấp dẫn của Transformers là không thể phủ nhận; khả năng suy luận của chúng thậm chí có thể giải quyết các vấn đề nghiên cứu toán học tiên tiến. Chắc hẳn bạn đã nghe về những đột phá gần đây mà trí tuệ nhân tạo (AI) đã đạt được trong toán học. Là người từng nghiên cứu toán học trong những năm đầu sự nghiệp, tôi thấy điều này thật đáng kinh ngạc. Tôi chưa bao giờ tưởng tượng rằng chỉ trong một thời gian ngắn như vậy, một chiếc máy tính có thể tham gia vào các cuộc thảo luận toán học với tôi ở trình độ cao như vậy, giống như một học giả thực thụ. Nhưng nó đã thực sự làm được điều đó, và thật đáng kinh ngạc.

Tuy nhiên, với tư cách là một nhà nghiên cứu máy học, tôi đã suy nghĩ lại: chúng ta vẫn chưa thực sự nắm bắt được những bí ẩn của chính "việc học". Mô hình có khả năng học hỏi, điều đó không thể phủ nhận, nhưng khối lượng dữ liệu và sức mạnh tính toán khổng lồ mà nó đòi hỏi khiến chúng ta dường như vẫn còn một bước nữa mới đến được chân lý tối thượng. Đây chỉ là trực giác, hay là một cảm nhận thoáng qua? Ở một khía cạnh nào đó, nó giống với thực tế hơn, nhưng chỉ thời gian mới trả lời được.

Người dẫn chương trình : Giá trị nghiên cứu đằng sau việc khám phá bí ẩn này là không thể phủ nhận. Tuy nhiên, một số người có thể lập luận ngược lại: vậy thì sao nếu mô hình khác với con người? Vì chúng ta sở hữu lượng dữ liệu khổng lồ và phương pháp này hiệu quả, thế là đủ rồi. Tất nhiên, một số lĩnh vực phải đối mặt với tình trạng khan hiếm dữ liệu, chẳng hạn như phát triển thuốc mới. Trong những lĩnh vực này, việc học tập hiệu quả bằng cách sử dụng dữ liệu hạn chế là rất quan trọng. Nhưng nhiều thách thức cốt lõi trong thế giới thực không thực sự liên quan đến những nút thắt dữ liệu nghiêm trọng như vậy.

Đôi khi tôi cảm thấy hai nhóm này đang nói chuyện không ăn khớp với nhau. Có thể hiểu được rằng những người trong các phòng thí nghiệm chính thống có thể chế giễu quan điểm của Yang Likun. Xét cho cùng, với số tiền khổng lồ hiện đang đổ vào lĩnh vực AI, những vấn đề về dữ liệu không giới hạn quả thực đang được giải quyết với tốc độ đáng kinh ngạc.

Lukasz : Nhưng chẳng bao lâu nữa, tất cả những điểm nghẽn còn lại sẽ phát triển thành các vấn đề bị hạn chế về dữ liệu, hay nói đúng hơn, xu hướng này đã khá rõ ràng. Đặc biệt là để mang lại kết quả khả quan trong thế giới vật lý, bạn phải giải quyết vấn đề này ở một mức độ nào đó. Bởi vì thế giới vật lý, không giống như thế giới ảo của văn bản hay internet, không thể mở rộng dữ liệu vô hạn, hiệu quả của việc mở rộng dữ liệu sẽ giảm đi đáng kể sau khi bạn đã huấn luyện trên một số phần cứng robot nhất định. Thế giới vật lý là một thách thức rất lớn. Tất nhiên, hiện nay mọi người đang cố gắng sử dụng dữ liệu mô phỏng và dữ liệu video góc nhìn thứ nhất, những giải pháp thay thế có chi phí thấp hơn.

Tôi là một fan hâm mộ cuồng nhiệt của Waymo. Mỗi khi ai đó hỏi tôi, "Những chiếc xe tự lái đã được hứa hẹn đâu rồi?", tôi luôn nói đùa rằng tôi đi trên chúng mỗi ngày, chúng ở ngay đây này! Nhưng gần đây họ đã hủy bỏ tính năng lái xe trên đường cao tốc, chỉ vì họ không thể xử lý được một số khu vực đang thi công. Có cảm giác như họ đã phải vật lộn với những vấn đề về khu vực thi công này trong nhiều năm. Tôi tin rằng họ đã chạy hàng triệu dặm trong hệ thống mô phỏng của mình và tích lũy được một lượng quãng đường đáng kể trong điều kiện thực tế, nhưng hệ thống vẫn không thể khái quát hóa một cách mượt mà kinh nghiệm từ "khu vực thi công đô thị" sang "khu vực thi công đường cao tốc". Điều này có vẻ không hợp lý.

Tôi không biết chi tiết cụ thể của vấn đề, nhưng không một thiếu niên nào lấy bằng lái xe, hay thậm chí bất kỳ người bình thường nào, lại gặp phải sự nhầm lẫn kiểu này. Con người chúng ta có nhiều thiếu sót, nhưng chúng ta sẽ không bao giờ lái xe được trong khu vực xây dựng của thành phố mà lại hoàn toàn lạc đường trong khu vực xây dựng trên đường cao tốc. Khu vực xây dựng nào cũng như nhau; nguyên tắc vẫn vậy.

Người dẫn chương trình: Ông/Bà có nghĩ rằng một số thách thức này có thể được giải quyết thông qua những cải tiến nội bộ đối với Transformer không? Ông/Bà hy vọng điều gì sẽ xảy ra trong vài năm tới để có câu trả lời rõ ràng hơn cho câu hỏi này?

Lukasz : Điều thú vị nhất về nghiên cứu máy học là phạm vi ứng dụng vô cùng rộng lớn của nó. Bạn không bao giờ có thể dự đoán trước liệu mình có cần điều chỉnh kiến trúc, dữ liệu, hàm mất mát hay quy trình tối ưu hóa hay không. Mỗi phương pháp đều có lý do riêng, và cuối cùng, bạn có thể cần điều chỉnh trên nhiều khía cạnh khác nhau. Mô hình Transformer thực sự tuyệt vời, nhưng sự tuyệt vời của nó không thể tách rời khỏi hàm mất mát "dự đoán từ tiếp theo"; bạn cũng có thể kết hợp nó với học tăng cường (RL), nhưng chỉ khi bạn đưa vào một chuỗi suy nghĩ. Những mảnh ghép công nghệ này chỉ bộc lộ sức mạnh của chúng khi được kết hợp liền mạch với nhau.

Nếu những hướng đi mới mang tính đột phá xuất hiện trong tương lai, mỗi bước có thể cần được đánh giá lại. Tuy nhiên, cũng có khả năng một số thành phần cốt lõi của Transformer sẽ tiếp tục tồn tại. Ví dụ, cơ chế chú ý có thể sẽ vẫn được giữ lại, mặc dù với sự hỗ trợ của các cơ chế mới khác.

Hành trình học máy của tôi bắt đầu với mạng nơ-ron hồi quy (RNN), vì vậy khái niệm "hồi quy" luôn giữ một vị trí đặc biệt trong tâm trí tôi. Tôi yêu thích vẻ đẹp logic của nó. Theo một nghĩa nào đó, sự phát triển của khả năng suy luận đã đưa các cơ chế hồi quy trở lại vị trí hàng đầu, bởi vì các mô hình lớn về cơ bản đang lặp lại cùng một tập hợp trọng số mỗi khi một token mới được tạo ra . Tuy nhiên, trong các ứng dụng thực tế, phương pháp học tăng cường này, đi kèm với hàm mất mát thưa, có thể xử lý rất nhiều phép tính và cuối cùng đạt được thành công. Điều đó thực sự đáng kinh ngạc.

Mỗi khi chúng ta cố gắng đưa các cơ chế lặp vào bằng những cách khác, dường như chúng ta luôn thất bại ở bước cuối cùng. Nhưng điều này đặt ra một câu hỏi cũ: chúng ta thực sự đã nỗ lực đến mức nào để thử? Có thể bạn hoặc khán giả của bạn chưa biết đến các mô hình lặp như TRM và HRM. Mặc dù kích thước cực kỳ nhỏ, chúng đã chứng minh hiệu suất đáng kể trong các bài kiểm tra đầy thách thức như Sudoku và thậm chí cả ARC-AGI. Mặc dù hiện tại chúng đang trong giai đoạn thử nghiệm đơn giản, hiệu suất của chúng thực sự ấn tượng. Tôi tin rằng nhiều kiến trúc "hậu Transformer " tiên tiến về cơ bản đang cố gắng tích hợp cơ chế lặp này với các mô hình ngôn ngữ lớn. Điều này thực sự rất thú vị.

Kiến trúc Transformer thuần túy không hoạt động lý tưởng khi xử lý các loại thách thức logic này, nhưng bằng cách thêm một số cơ chế vòng lặp, thực hiện một số điều chỉnh kiến trúc hoặc thay đổi nhẹ hàm mất mát, hiệu suất của nó có thể được cải thiện đáng kể. Ngay cả ở quy mô rất nhỏ, bạn cũng có thể đạt được những đột phá đáng kinh ngạc. Liệu phương pháp này cuối cùng có thể được khái quát hóa đến cấp độ ngôn ngữ và mang lại cho chúng ta những khả năng mà chúng ta luôn mơ ước? Đó là điều đáng để mong chờ. May mắn thay, một số phòng thí nghiệm hiện đang nghiên cứu theo hướng này.

Ngoài ra, năm nay chúng ta đã chứng kiến sự bùng nổ của các tác nhân thông minh . Đối với tôi, đây có lẽ là sự thay đổi lớn nhất trong phong cách làm việc hàng ngày mà tôi từng trải qua trong suốt hai mươi năm nghiên cứu về máy học.

Điều này tương đương với việc rút ngắn một ngày làm việc trong tuần xuống còn một ngày.

Người dẫn chương trình: Tôi tự hỏi liệu anh/chị đã thử định lượng xem trí tuệ nhân tạo (AI) đã cải thiện hiệu quả công việc của anh/chị đến mức nào chưa?

Lukasz : Thực ra tôi có thể đưa ra một số liệu định lượng tương đối chính xác cho việc này. Gần đây tôi đã thử tái tạo một số bài báo cũ mà tôi luôn quan tâm trên máy tính cá nhân, bao gồm một số bài do chính tôi viết nhưng mã nguồn đã bị mất. Trước đó, tôi đã thử tái tạo ít nhất một trong số chúng bằng tay, và tôi biết rằng chỉ riêng việc chạy được mã nguồn cũng mất khoảng ba tuần. Nhưng với sự trợ giúp của Cursor, tôi đã hoàn thành nó chỉ trong hai ngày.

Điều này tương đương với việc rút ngắn công việc một tuần xuống còn một ngày – một bước nhảy vọt về hiệu quả gấp 5 đến 10 lần. Có lẽ tôi đã có thể làm nhanh hơn nữa nếu chăm chỉ hơn một chút hồi đó, nhưng sự thay đổi này chắc chắn đã định hình lại nhịp điệu nghiên cứu của tôi, cho phép tôi thử nghiệm những ý tưởng mới mà không chút e ngại. Giờ đây, tôi thậm chí có thể chạy ba thí nghiệm song song cùng lúc và để chúng tự động chạy, trong khi trước đây, khi viết mã bằng tay, tôi chỉ có thể tập trung vào một việc tại một thời điểm. Nó không chỉ cải thiện đáng kể tốc độ mà còn mang lại khả năng xử lý song song đa luồng.

Khi làm việc trên các dự án cá nhân bên ngoài môi trường sản xuất, tôi hầu như đã ngừng xem xét kỹ lưỡng từng dòng mã. Một người bạn từng hỏi tôi liệu điều này có làm giảm khả năng tư duy của tôi hay không. Tôi đã suy nghĩ kỹ về điều này, và câu trả lời hoàn toàn ngược lại. Mặc dù tôi không còn cần phải quản lý chi tiết từng tên lớp hay từng hàm nhỏ nhặt nữa, nhưng tôi nhận thức rõ rằng tác nhân có thể dễ dàng đi chệch hướng. Ví dụ, trong một lần chạy thử nghiệm, nó đã gặp phải một số tổn thất phụ trợ và không hiểu sao lại tự thêm vào một tổn thất phụ trợ hoàn toàn không liên quan và hoàn toàn sai.

Do đó, bộ não của bạn phải duy trì sự kiểm soát hoàn toàn và tuyệt đối đối với chính xác những gì hệ thống đang làm. Hàm mất mát của nó là gì? Kiến trúc cơ bản của nó ra sao? Bạn phải biết những điều này. Bạn không cần phải lo lắng về tên lớp hay các chi tiết chính tả cụ thể của một hàm. Cảm giác tin tưởng cho phép tác nhân thực hiện chính xác các ý tưởng trong tâm trí bạn thật đáng kinh ngạc. Hầu hết thời gian, khi chúng ta kiểm tra, chúng ta thấy rằng nó đã được thực thi một cách hoàn hảo.

Vì bộ não của bạn phải tập trung cao độ vào chính logic của máy học—cách thiết kế hàm mất mát, cách điều chỉnh kích thước lô—nên tôi thực sự cảm thấy mình hiểu rõ hơn các khía cạnh cốt lõi của các dự án nghiên cứu so với khi tôi tự làm mọi thứ. Trước đây, khi triển khai một ý tưởng, trước khi mã thực sự chạy, tôi phải dành năng lượng cho vô số chi tiết gỡ lỗi nhỏ nhặt, và sau đó tôi phải quay lại với cái nhìn tổng thể. Trong quá trình đó, tôi thường bỏ lỡ một số thiết kế tài tình.

Giờ đây, bạn hoàn toàn đắm chìm trong dòng chảy tư duy. Bạn chỉ cần bắt đầu từ bản chất của máy học, suy nghĩ về những gì nên xảy ra , truyền hướng dẫn cho tác nhân, xác minh đầu ra của nó, và mọi thứ sẽ tự nhiên đi vào đúng vị trí. Điều này không chỉ tiết kiệm thời gian mà còn biến chính quá trình nghiên cứu thành một niềm vui tuyệt vời. Tôi nghĩ đây có thể là một kiểu ám ảnh nhẹ đang trở nên phổ biến trong giới nghiên cứu gần đây - chúng ta không thể dừng lại được.

Người dẫn chương trình: OpenAI đã công khai tuyên bố mục tiêu của họ là đưa trí tuệ nhân tạo lên ngang tầm trợ lý nghiên cứu (thực tập sinh) vào tháng 11 năm nay. Là một học giả thường xuyên sử dụng Cursor trong nghiên cứu hàng ngày, theo anh/chị, chúng ta đã tiến gần đến mục tiêu này đến mức nào? Anh/chị nghĩ gì về cột mốc này?

Lukasz : Hiệu năng của nó quả thực rất gần với một thực tập sinh, nhưng bạn vẫn phải theo dõi sát sao kết quả đầu ra. Như tôi đã đề cập trước đó, nó có thể tự ý thêm một số hàm mất mát mà bạn thậm chí không yêu cầu, chỉ vì logic của nó cho rằng điều đó hợp lý. Tôi không biết liệu các thực tập sinh thực sự có làm vậy không, có lẽ chỉ khi họ rất sáng tạo thì có.

Đôi khi tôi thử để nó tự chạy qua đêm, đặt ra một mục tiêu vĩ mô, chẳng hạn như "cải thiện mô hình để giảm độ phức tạp". Nhưng điều này không bao giờ hiệu quả. Nó chỉ bắt đầu thực hiện những điều chỉnh nhỏ, không đáng kể và không có giá trị nghiên cứu. Vì vậy, chắc chắn nó vẫn chưa đạt đến trình độ của một nhà nghiên cứu độc lập.

Người dẫn chương trình: Những hướng đi khả thi nào có thể dẫn đến bước đột phá trong lĩnh vực này?

Lukasz : Điều này đưa chúng ta trở lại cuộc thảo luận ban đầu. Thực ra, từ rất lâu trước khi Transformer ra đời, tôi đã dành tâm huyết nghiên cứu về "ngữ cảnh dài" và "cơ chế bộ nhớ" trong máy học. Sau đó, chúng tôi đã đưa ngữ cảnh dài vào kỷ nguyên Transformer, đạt được độ dài token lên đến hàng triệu, một quy mô cực kỳ ấn tượng trong khuôn khổ cơ chế chú ý.

Tuy nhiên, trong kỷ nguyên của các tác nhân thông minh hiện nay, tôi nhận thấy rằng các công cụ như grep và thậm chí cả ripgrep mới là giải pháp thực sự cho các ngữ cảnh dài. Chúng ta chỉ cần ghi một lượng lớn nội dung vào các tập tin, cung cấp cho tác nhân khả năng sử dụng grep để truy xuất, cho phép nó xây dựng các tập tin chỉ mục và hoạt động như một thư viện nhỏ.

Với tư cách là một nhà nghiên cứu, nếu cách đây 5 năm ai đó nói với tôi rằng đây là một cách để xử lý các ngữ cảnh dài, tôi sẽ chế giễu, nghĩ rằng đó chỉ là một biện pháp tạm thời. Nhưng trong lĩnh vực máy học, nhiều phát minh vĩ đại ban đầu cũng có vẻ như chỉ là những giải pháp tạm thời, chẳng hạn như Dropout. Chúng ta không nên đánh giá công nghệ dựa trên nguồn gốc của nó; nếu nó thực sự hiệu quả, chúng ta nên đón nhận nó. Và phương pháp này thực sự đã chứng minh được hiệu quả đáng kể.

Bạn chỉ cần thêm một lượng nhỏ học tăng cường (RL), chẳng hạn như cơ chế nén dữ liệu. Nếu có điều gì khiến tôi kiên quyết chọn Cursor thay vì phiên bản web của Claude, đó chính là khả năng nén ngữ cảnh tuyệt vời của Cursor.

Bạn có thể kéo dài cuộc trò chuyện rất lâu vì nó rất giỏi trong việc trích xuất thông tin cốt lõi. Tại sao nó lại làm tốt như vậy? Tôi không nghĩ có bí mật nào đặc biệt; đơn giản là nhóm phát triển đã thiết kế các từ khóa gợi ý thông minh và áp dụng một số kỹ thuật học tăng cường vào chúng. Nếu vài năm trước bạn nói với tôi rằng giải pháp tối ưu cho các đoạn hội thoại dài chỉ đơn giản là sử dụng học tăng cường để dạy nó sử dụng các công cụ, tìm kiếm trong các tập tin, và sau đó trích xuất nội dung đủ ngắn gọn để duy trì ngữ cảnh, tôi sẽ nói rằng đó chỉ là một giải pháp tạm thời và không có chiều sâu khoa học nào. Nhưng chúng ta không đánh giá một giải pháp dựa trên vẻ bề ngoài hào nhoáng; chúng ta chỉ nhìn vào hiệu quả của nó, và giải pháp này thực sự cực kỳ hiệu quả.

Do đó, về việc liệu nó có thể thực sự phát triển thành một nhà nghiên cứu độc lập hay không: một số người tỏ ra bi quan, tin rằng điều đó là không thể trừ khi chúng ta phát triển một kiến trúc "hậu Transformer" hoàn toàn mới có khả năng hiểu các khái niệm vĩ mô lớn hơn và có định hướng mục tiêu dài hạn. Đây quả thực là một lập luận hợp lý. Hiện tại, phương pháp hiện có dường như có khả năng giải quyết nhiều vấn đề.

Một số người khác lập luận rằng sau một tháng liên tục trò chuyện với Cursor, bạn có thể hướng dẫn nó xem xét lại các cuộc trò chuyện này, xác định các mô hình tổng quát, lưu trữ chúng, và sau đó xem xét cách sử dụng chúng. Có lẽ, nếu chúng ta thu thập dữ liệu tương tác tương tự từ hàng nghìn người và huấn luyện học tăng cường trên đó, AI sẽ bắt đầu hành xử như một học giả thực thụ. Ở một mức độ nào đó, các học giả con người học hỏi theo cách này: chúng ta quan sát nghiên cứu của những người đi trước, tiến hành các thí nghiệm lặp đi lặp lại và tóm tắt một tập hợp các phương pháp hiệu quả nhất.

Người dẫn chương trình: Tại sao phương pháp này lại không hiệu quả? Tôi chắc chắn đã có người thử rồi.

Lukasz : Tôi không nghĩ mọi người đã đầu tư đủ nỗ lực vào hướng này. Một số người đã viết một vài gợi ý, và chúng đã có tác dụng phần nào, nhưng chỉ có vậy thôi. Theo tôi, "kỷ nguyên Cursor" thực sự bắt đầu vào khoảng Giáng sinh năm ngoái. Mặc dù Cursor đã tồn tại trước đó, và chúng ta đã sử dụng nó, và Claude cũng đã tồn tại, nhưng mọi người thực sự cảm nhận được một sự chuyển đổi nào đó trong dịp Giáng sinh.

Việc này dường như không chỉ đơn thuần là nâng cấp mô hình; nó còn bao gồm việc tinh chỉnh tỉ mỉ toàn bộ hệ thống Harness và một loạt các quy trình hậu huấn luyện. Và quá trình này mới chỉ diễn ra khoảng sáu tháng. Nếu bạn bước ra khỏi giới công nghiệp AI ở San Francisco, bạn sẽ thấy nhiều người chưa hoàn toàn nắm bắt được sự thay đổi này, và thậm chí họ có thể nghĩ rằng những người trong chúng ta phụ thuộc nhiều vào nó đang quá lạc quan.

Hệ thống này chỉ mới gần đây thực sự bắt đầu phát huy sức mạnh của mình. Chúng ta thậm chí còn chưa thể giải thích đầy đủ bước nhảy vọt này về mặt lý thuyết. Nó không phải là kết quả của một bước tiến lớn trong các tham số được huấn luyện trước, mặc dù các mô hình cơ sở mạnh mẽ hơn đã xuất hiện trong thời gian đó. Quay trở lại thời điểm chúng ta chuyển đổi từ RNN sang Transformer, thật dễ dàng để quy kết sự chuyển đổi đó cho một cuộc đại tu hoàn toàn kiến trúc cơ bản. Giờ đây, trong khi tầm quan trọng của khả năng suy luận là không thể phủ nhận, sự chuyển đổi vào khoảng Giáng sinh năm ngoái vẫn còn khá bí ẩn. Nâng cấp khung phần mềm, tối ưu hóa sau huấn luyện và sự xuất hiện kịp thời của các mô hình được huấn luyện trước mới - nhiều yếu tố đan xen nhau đã tạo nên bước nhảy vọt đáng kinh ngạc này, khiến khó có thể chỉ đơn giản quy kết nó cho một động lực duy nhất.

Điều này tiềm ẩn nhiều ảnh hưởng lẫn nhau, vì chúng ta liên tục tối ưu hóa mọi khía cạnh của hệ thống. Tuy nhiên, chính vì hiệu quả của nó rất đáng kể và quan trọng, trước sự cạnh tranh khốc liệt của thị trường, mọi người đang chạy đua với thời gian để thương mại hóa và quảng bá nó trong nhiều kịch bản ứng dụng khác nhau. Điều này dẫn đến việc không đủ thời gian cho việc phân tích lý thuyết chuyên sâu ở "cấp độ siêu cấp". Mặc dù một số nghiên cứu đã được bắt đầu, nhưng việc tiến hành nghiên cứu ở cấp độ siêu cấp có nghĩa là dành cả tuần để nắm bắt một mô hình và sau đó cố gắng triển khai nó, đòi hỏi nhiều tuần lặp lại hệ thống.

Theo các cơ chế học tăng cường hiện có, mỗi lần lặp lại của giải pháp đều yêu cầu thử nghiệm triển khai quy mô lớn. Nếu một chu kỳ thử nghiệm kéo dài vài tuần, thời gian huấn luyện cho một phiên sẽ kéo dài đến vài tháng, điều này hoàn toàn không thực tế trong thực tiễn kỹ thuật.

Điều này minh họa hoàn hảo ý tưởng rằng các phương pháp học tập và nghiên cứu của con người có thể mang lại những hiểu biết sâu sắc cho máy học. Con người có thể dành nhiều năm để nghiên cứu một dự án duy nhất, với rất ít lần thử nghiệm trong suốt thời gian đó. Một số nhà toán học dành đến hai mươi năm để giải quyết một vấn đề duy nhất, và đó trở thành thành tựu rực rỡ nhất của họ. Họ không có hai trăm chu kỳ nghiên cứu kéo dài hai mươi năm để liên tục học hỏi và thử nghiệm, nhưng họ vẫn làm được điều đó. Bí mật đằng sau điều này là gì? Đây chắc chắn là một chủ đề vô cùng hấp dẫn, rất phù hợp với sự phát triển hiện tại của trí tuệ nhân tạo. Chúng ta vẫn chưa giải đáp được bí ẩn này. Tuy nhiên, khi ngày càng nhiều người bắt đầu tích hợp các hệ thống này vào công việc hàng ngày của họ, chúng ta sẽ tích lũy được một lượng lớn dữ liệu về quy trình làm việc thực tế của con người, kéo dài hàng tuần hoặc thậm chí hàng tháng. Một khi ai đó áp dụng học tăng cường vào các quy trình làm việc phức tạp này, nó có thể mang lại cho chúng ta những bất ngờ không ngờ tới.

Người dẫn chương trình : Đây là một điểm rất sâu sắc. Trước đây, khi chúng ta mở rộng quy mô huấn luyện trước hoặc phát triển mô hình suy luận thế hệ đầu tiên, lộ trình tối ưu hóa cực kỳ rõ ràng và logic — chúng ta biết rất rõ nên tập trung sức mạnh tính toán vào khía cạnh nào. Tuy nhiên, những tiến bộ nhanh chóng của Cursor và Claude vào Giáng sinh năm ngoái dường như khá bí ẩn. Nếu chúng ta không thể xác định chính xác nguồn gốc thực sự của sự thay đổi này, sẽ rất khó để biết nên tập trung nỗ lực vào hướng nào để liên tục cải thiện các khả năng cốt lõi của hệ thống.

Lukasz : Đúng vậy, điều đó thực sự hơi khó hiểu. Việc tôi không biết các thủ thuật cụ thể không có nghĩa là không ai trong ngành biết. Có lẽ một số đồng nghiệp rất tự tin vào bước đột phá thực sự, nhưng tôi nghĩ, ít nhất là hiện tại, đó không phải là sự đồng thuận rõ ràng. Sức mạnh kỹ thuật thực ra đã được tích lũy âm thầm trong một thời gian dài, nhưng sau sự chuyển đổi đó, nhiều ý tưởng tưởng chừng như viển vông đã trở thành hiện thực chỉ sau một đêm. Đây rõ ràng là một lợi ích mang lại bởi sự mở rộng quy mô thông minh trong lĩnh vực học tăng cường.

Vị giác rất khó định nghĩa và phân tích bằng ngôn ngữ cụ thể.

Người dẫn chương trình: Một câu hỏi hiện đang nhận được rất nhiều sự quan tâm là: chúng ta đã chứng kiến những thay đổi mang tính cách mạng trong các lĩnh vực có tính "kiểm chứng" cao như lập trình và toán học. Nhưng đối với học tăng cường, hai câu hỏi cốt lõi vẫn còn bỏ ngỏ: Thứ nhất, nó có thể tiến xa đến đâu trong các lĩnh vực chủ quan "không thể kiểm chứng"? Thứ hai, liệu chúng ta có thể đạt được khả năng khái quát hóa hiệu quả trong các lĩnh vực hoàn toàn mới mà không cần dựa vào lượng lớn dữ liệu độc quyền? Theo ý kiến của bạn, làm thế nào chúng ta có thể vượt qua những thách thức cốt lõi trong các "lĩnh vực không thể kiểm chứng"? Ngoài lập trình và toán học, bạn nghĩ lĩnh vực nào sẽ chứng kiến bước đột phá tiếp theo?

Lukasz : Thực ra, chúng tôi đã đạt được tiến bộ đáng kể trong những lĩnh vực "không thể kiểm chứng" đó. Lấy ví dụ như Harvey trong lĩnh vực pháp lý hoặc một số ứng dụng chuyên ngành y tế. Mặc dù những nhiệm vụ này thiếu các tiêu chuẩn kiểm chứng tuyệt đối nghiêm ngặt, nhưng chúng vẫn chứa một số lượng lớn các bước có thể kiểm chứng và đối chiếu chéo. Kết quả trong những lĩnh vực này khá đáng khích lệ. Hơn nữa, các bài kiểm tra chuẩn như GPQA cũng đánh giá phần nào những khả năng toàn diện này. Có một động lực nội tại mạnh mẽ trong ngành để mở rộng sang những lĩnh vực này.

Thực tế, việc đơn giản gán cho chúng nhãn "không thể kiểm chứng" có thể không hoàn toàn khách quan. Chúng chắc chắn không có những quy tắc rõ ràng của lập trình hay toán học thuần túy, nhưng tôi nghĩ mọi người đã phóng đại cái gọi là "khả năng kiểm chứng" của toán học.

Trong bối cảnh các cuộc thi lập trình, mã nguồn thực sự rất dễ kiểm chứng. Tuy nhiên, khi bạn đi sâu vào các tương tác giao diện người dùng phức tạp của hệ thống, việc định nghĩa nó bằng các tiêu chuẩn trắng đen trở nên khó khăn không kém. Trong toán học, các chứng minh học thuật đích thực hiếm khi hoàn toàn thuần túy hoặc dễ dàng tự động kiểm chứng. Bạn chắc chắn có thể sử dụng các công cụ hình thức như Lean, nhưng hầu hết các phép tính toán học được tạo ra bởi các mô hình ngôn ngữ lớn chưa trải qua quá trình hình thức hóa nghiêm ngặt và do đó không thể hoàn toàn kiểm chứng được. Đó là một phổ từ dễ đến khó, với khả năng kiểm chứng giảm dần.

Tôi từng có một dự án cá nhân – cố gắng dịch thơ tiếng Anh sang tiếng Ba Lan, nghe có vẻ là một nghệ thuật vô cùng chủ quan. Nhưng khi bạn để những mô hình lớn này đóng vai trò người đánh giá, bạn sẽ thấy rằng chúng thực sự có thể nắm bắt được những chi tiết rất tinh tế. Chúng kiểm tra tỉ mỉ vần điệu, nhịp điệu, và thậm chí cả sự phù hợp về văn hóa. Hóa ra, nếu chúng ta tham khảo các cơ chế đánh giá của con người trong quá khứ, thì nghệ thuật chủ quan cũng có thể được định lượng và kiểm chứng ở một mức độ nào đó.

Tuy nhiên, dự án dịch thơ này cũng hé lộ cho tôi một sự thật khác: bạn có thể hoàn toàn kiểm chứng tất cả các tiêu chuẩn khách quan (vần điệu, nghĩa đen, nhịp điệu), nhưng toàn bộ bài thơ vẫn cảm thấy thiếu hồn và thiếu "gu thẩm mỹ". Điều này là bởi vì gu thẩm mỹ rất khó định nghĩa và phân tích bằng ngôn ngữ cụ thể. Nếu nó có thể dễ dàng diễn đạt, nó đã được công thức hóa từ lâu rồi. Tuy nhiên, việc không thể diễn đạt nó không có nghĩa là chúng ta không thể cảm nhận được nó. Khi bạn đọc nó, một trực giác nào đó trong não bạn vẫn kiên quyết nhắc nhở bạn rằng vẫn còn thiếu một điều gì đó - một tia sáng nào đó.

Ở một mức độ nào đó, điều này chính xác là do mô hình học tăng cường hiện tại mà chúng ta đã tự nguyện rơi vào cái bẫy do chính mình tạo ra. Logic hoạt động của nó rất đơn giản: miễn là có người đánh giá có thể cho bạn biết điều gì là tốt và điều gì là xấu, mô hình có thể lặp lại và trở nên mạnh mẽ hơn theo một cách có mục tiêu. Đây là cơ chế phát triển hiện tại của các mô hình lớn. Bất cứ khi nào tôi phàn nàn, "Tôi nghĩ dòng văn bản này được dịch kém," thì luôn có người nói với tôi, "Vậy thì bạn hãy dạy nó thế nào là gu thẩm mỹ tốt," và sau rất nhiều lần sửa chữa, mô hình cuối cùng thực sự có thể bù đắp được thiếu sót cụ thể này. Giống như việc tạo ra hình ảnh, rất khó để định nghĩa "đẹp" hay "xấu," nhưng bạn có thể cải thiện đáng kể chất lượng thẩm mỹ tổng thể của tác phẩm nghệ thuật do hệ thống tạo ra bằng cách cho hàng nghìn người liên tục nhấp vào những hình ảnh có tính thẩm mỹ cao hơn trong quá trình huấn luyện.

Do đó, các ranh giới có thể kiểm chứng rất mơ hồ và linh hoạt. Bạn có thể thu thập được các tín hiệu dữ liệu thưa thớt nhưng cực kỳ có giá trị bằng cách thu thập sở thích của con người. Tại sao tôi thấy một số tác phẩm thiếu tính thẩm mỹ? Điều này rõ ràng xuất phát từ kinh nghiệm sống, kiến thức tích lũy và cách tôi cảm nhận thế giới. Và tại sao mô hình không thể tạo ra loại cảm hứng này? Có hai khả năng: thứ nhất, nó chưa trải nghiệm đủ chiều sâu kinh nghiệm; thứ hai, cơ chế logic để xử lý những kinh nghiệm này của nó bị lỗi. Tôi tin rằng cả hai lý do đều có liên quan. Nhưng ngay cả với logic xử lý cơ bản hiện có, miễn là bạn cung cấp cho nó những trải nghiệm thực tế phong phú hơn của con người—ví dụ, bằng cách thu thập phản hồi chủ quan từ hàng nghìn người—thị hiếu của nó sẽ được cải thiện đáng kể.

Mọi lỗ hổng đều có thể được vá bằng cách liên tục vá chúng. Nhưng sẽ tuyệt vời biết bao nếu chúng ta không phải tốn công sức để vá các lỗ hổng. Một khi bạn vá được một lỗ hổng, nó sẽ không còn là trở ngại nữa, và lỗ hổng tiềm ẩn tiếp theo lại bị lộ ra như một điểm nghẽn mới. Chúng ta dường như bị mắc kẹt trong vòng luẩn quẩn không hồi kết này. Sẽ hoàn hảo biết bao nếu chúng ta có một cơ chế học tập cốt lõi giống như bộ não con người, để ngay từ đầu chúng ta không cần phải tỉ mỉ vá từng kẽ hở trong các quy tắc.

Người dẫn chương trình: Điều này có nghĩa là, với kiến trúc nền tảng hiện có, bất kỳ vấn đề cụ thể nào trong ngành mà mọi người tập trung vào cuối cùng đều có thể được giải quyết? Tuy nhiên, như bạn đã nói, điều này có thể đòi hỏi một lượng lớn dữ liệu độc quyền được lựa chọn cẩn thận, và toàn bộ quá trình này kém tự nhiên hơn nhiều so với các cơ chế học tập tinh tế hơn trong tương lai. Theo ý kiến của bạn, liệu có thực sự tồn tại những loại vấn đề hoặc lĩnh vực nào mà các phương pháp học tăng cường hiện tại đơn giản là không thể vượt qua?

Lukasz : Hiện tại, dường như không có trở ngại nào không thể vượt qua, nhưng chúng ta phải tính đến chi phí thương mại và kinh tế. Theo lộ trình công nghệ hiện tại, nếu bạn muốn một mô hình thể hiện hiệu suất cực kỳ ấn tượng trong một lĩnh vực cụ thể, trước tiên bạn phải có một mô hình nền tảng mã nguồn đóng hàng đầu, có quy mô khổng lồ và cực kỳ đắt đỏ. Hơn nữa, nó thường là một "tháp ngà" mã nguồn đóng, và bạn đơn giản là không thể truy cập vào các trọng số cốt lõi bên trong của nó.

Mặc dù OpenAI cung cấp một số API tinh chỉnh học tăng cường mà tôi thực sự thích, và một số công ty lớn khác cũng đang làm theo, mô hình kiểm soát chưa hoàn chỉnh này vẫn còn những hạn chế. Ngay cả với việc tinh chỉnh dựa trên API, quá trình này vẫn vô cùng khó khăn do chi phí làm sạch dữ liệu và tài nguyên tính toán cần thiết rất cao. Điều này thường đòi hỏi một công ty có nguồn lực dồi dào, các hợp đồng dài hạn và một lượng lớn chuyên gia. Nếu bản thân vấn đề có giá trị thương mại đáng kể, thì con đường này chắc chắn đáng giá; nhưng chẳng phải chúng ta sẽ thích hơn nếu chỉ cần trò chuyện với mô hình, và nó tự động giải quyết vấn đề một cách hoàn hảo?

Người dẫn chương trình: Liệu mô hình nền tảng hiện tại có thể hiện bước nhảy vọt về khả năng tổng quát, tiềm ẩn hay không? Hãy tưởng tượng kịch bản này: chúng ta bắt đầu bằng việc viết mã, sau đó chinh phục toán học, và cuối cùng áp dụng cơ chế này vào luật và y học, đạt được những đột phá từng bước một—ngay cả khi không ngay lập tức theo đuổi khả năng khái quát hóa liên lĩnh vực. Lý tưởng nhất, liệu chúng ta có thể kỳ vọng rằng sau một loạt các khám phá về học tăng cường trên các lĩnh vực khác nhau, tương tự như giai đoạn tiền huấn luyện, mô hình lớn sẽ tự phát triển khả năng khái quát hóa liên lĩnh vực trong chiều hướng học tăng cường hay không?

Lukasz : Đúng vậy; những dấu hiệu của sự khái quát hóa tự phát này đã bắt đầu xuất hiện. Ví dụ, trong lĩnh vực pháp luật, vốn không phải là một phần của quy trình học tăng cường tiêu chuẩn, khi bạn nói chuyện với các nhà phát triển ứng dụng chuyên ngành như Harvey, họ nhận thấy rằng một sự hiểu biết nhất định hoặc tự nhiên xuất hiện, hoặc chỉ với sự hướng dẫn cực kỳ yếu ớt ở cấp độ cao nhất, hệ thống ngay lập tức nắm bắt và tích hợp các khái niệm. Sự khái quát hóa có tồn tại, nhưng ranh giới của nó dường như hẹp hơn chúng ta mong đợi. Đôi khi, nó thậm chí không thể chuyển giao một cách trơn tru giữa hai lĩnh vực con của toán học.

Ví dụ, trong Kỳ thi Olympic Toán học Quốc tế (IMO), các bài toán hình học từng là trở ngại lớn đối với các thí sinh trong một thời gian dài. Trong khi các thí sinh có thể dễ dàng giải quyết những bài toán cực khó ở các lĩnh vực khác, thì khi đối mặt với hình học, mọi người luôn thở dài: "Nó thực sự thiếu tư duy không gian." Tuy nhiên, sau khi gặp nhiều bài toán hình học hơn, các thí sinh bắt đầu giải quyết chúng một cách dễ dàng—họ không gặp phải bất kỳ dữ liệu vật lý hay không gian hoàn toàn mới nào, mà chỉ đơn giản là luyện tập nhiều hơn về các phép tính hình học.

Đường cong khái quát hóa của mô hình thể hiện hình dạng "răng cưa" kỳ lạ. Nó có thể đã có một bước tiến đáng kể ở một khía cạnh, nhưng ở một lĩnh vực khác tưởng chừng nằm trong tầm với, đơn giản vì quá trình tư duy nội tại của nó không hoàn toàn phù hợp với hiểu biết của chúng ta, nó lại hoàn toàn bị đình trệ. Nó đang khái quát hóa, nhưng lại sử dụng một cách tư duy độc đáo, "xa lạ" mà chúng ta không thể hoàn toàn hiểu được, điều này phần nào mâu thuẫn với các nguyên tắc khái quát hóa thông thường của con người. Có lẽ khi dữ liệu huấn luyện tiếp tục được tích lũy, những điểm mù mà nó có thể bao phủ sẽ giảm đi. Nhưng tôi cũng hoàn toàn hiểu tại sao nhiều người ra quyết định vẫn cảnh giác với hệ thống như vậy, ngần ngại giao phó những trách nhiệm quan trọng cho nó - bởi vì bạn không bao giờ có thể dự đoán trước được những điểm mù chết người của nó có thể ẩn náu ở đâu, và bạn phải luôn luôn đề phòng những sai sót của nó.

Với tư cách là một học giả về máy học, tôi phải luôn cảnh giác và thận trọng khi sử dụng các hệ thống này, vì bất kỳ sơ suất nhỏ nào cũng có thể dẫn tôi đi sai hướng. Từ góc độ nghiên cứu học thuật, quá trình đào tạo nghiêm ngặt này chắc chắn giúp chúng ta luôn nhạy bén, nhưng từ góc độ kỹ thuật thực tiễn, đó chắc chắn là một thách thức to lớn, vì tất cả chúng ta đều hy vọng nó có thể trở nên toàn diện và dễ sử dụng hơn, thay vì vẫn còn nhiều góc cạnh sắc bén.

Điểm nghẽn về kiến trúc phần cứng tụt hậu so với các ý tưởng nghiên cứu khoa học đang nhanh chóng được khắc phục.

Người dẫn chương trình: Vừa rồi anh/chị đã đề cập đến các công ty định hướng ứng dụng được hưởng lợi từ khả năng mô hình hóa lặp đi lặp lại. Hiện nay, ngành công nghiệp đang đối mặt với một lựa chọn quan trọng: với tư cách là một công ty định hướng ứng dụng, chúng ta nên lựa chọn thiết lập hợp tác sâu rộng với các phòng thí nghiệm hàng đầu, chia sẻ hệ thống đánh giá và hiểu biết ngành của mình với họ, hay nên bảo vệ cẩn thận dữ liệu độc quyền của mình và xây dựng các mô hình riêng dựa trên đó, tránh để mất các tài sản cốt lõi vào tay các công ty lớn? Tôi rất tò mò, anh/chị nghĩ gì về hệ sinh thái lớp ứng dụng hiện tại dựa trên các mô hình nền tảng cốt lõi?

Lukasz : Mô hình nền tảng được huấn luyện trước của bạn càng lớn và mạnh mẽ thì những "cạnh sắc" đó sẽ càng được làm mượt mà hơn. Nhìn chung, điều này sẽ giúp quá trình phát triển ứng dụng của bạn trở nên suôn sẻ hơn nhiều. Cho dù là thực hiện học tăng cường hay tinh chỉnh trên các mô hình lớn, một mô hình nền tảng mạnh mẽ sẽ giúp công việc tiếp theo hiệu quả hơn rất nhiều. Tính đúng đắn lâu dài của nguyên tắc này thực sự đáng ngưỡng mộ.

Một hoặc hai năm trước, một quan điểm phổ biến trong ngành tuyên bố rằng, " Các mô hình lớn đã lỗi thời; các mô hình nhỏ (SLM) là tương lai ." Ngày nay, chúng ta thực sự đã chứng kiến một số mô hình nhỏ xuất sắc, chẳng hạn như chuỗi Gemma chỉ với vài byte (B) tham số. Quay trở lại thời kỳ GPT-3, mọi người đều tin chắc rằng việc học không cần huấn luyện (zero-shot learning) đáng tin cậy là không thể với ít hơn 100 B tham số, nhưng giờ đây ngay cả một mô hình 3 B cũng có thể chứng minh khả năng kinh doanh đáng kinh ngạc. Điều này chắc chắn rất thú vị, nhưng nếu bạn cần giải quyết những thách thức cơ bản cực kỳ phức tạp và muốn một mô hình có thể tích hợp liền mạch vào dữ liệu cụ thể và bối cảnh rộng lớn của bạn, thì không gì có thể thay thế một siêu mô hình thực sự khổng lồ. Tất nhiên, chi phí huấn luyện và suy luận của chúng cực kỳ cao, và rào cản triển khai khiến nhiều người e ngại.

Người dẫn chương trình: Đối với công chúng nói chung, ngoài những lĩnh vực tiên tiến, một thực tế không dễ nhận thấy là mức độ mà phần cứng thế hệ mới đã thực sự giải phóng các thuật toán. Ví dụ, với sự ra mắt của chip Blackwell của NVIDIA, khả năng mô hình hóa cũng đã có một bước tiến vượt bậc. Thật khó để phân biệt liệu điều này là do phần cứng mới mạnh mẽ mang lại cho chúng ta những khả năng tính toán mà trước đây không thể đạt được, hay chỉ đơn giản là sự trùng hợp ngẫu nhiên về mặt thời gian. Bạn có nghĩ rằng kiến trúc nền tảng sẽ tự nhiên tiếp tục trở nên mạnh mẽ hơn với mỗi bước tiến vượt bậc về hiệu năng tính toán phần cứng?

Lukasz : Việc nâng cấp hiệu năng phần cứng về cơ bản được phản ánh ở hai khía cạnh: số phép toán dấu phẩy động mỗi giây (FLOPs) và băng thông truy cập bộ nhớ. Bạn phải có hiệu suất truyền dữ liệu bộ nhớ đủ nhanh để tránh tình trạng công suất tính toán khổng lồ bị lãng phí. Đây là một chỉ số hiệu năng cực kỳ trực tiếp và rõ ràng.

Gần đây tôi đã lắp đặt card đồ họa 5090 vào máy tính cá nhân của mình. Sức mạnh của nó thực sự đáng kinh ngạc. Một card 5090 duy nhất có thể cung cấp khoảng 200 Teraflops sức mạnh tính toán (nó thậm chí có thể đạt tới 400 ở một số mức độ chính xác hỗn hợp nhất định, nhưng một số mức độ này bị vô hiệu hóa). Để dễ hình dung hơn, khi chúng tôi viết bài báo về Transformer, các GPU mà chúng tôi sử dụng chỉ có sức mạnh tính toán của một card duy nhất là 9 Teraflops, và toàn bộ máy tính có 8 card. Tính cả chi phí hệ thống tổng thể, tổng sức mạnh tính toán của máy chủ chỉ khoảng 70 đến 80 Teraflops.

Hiện nay, card đồ họa đơn trong chiếc máy tính để bàn nhỏ thông thường dưới bàn làm việc của tôi có sức mạnh tính toán tương đương với năm máy chủ hiệu năng cao thời đó. Điều này có nghĩa là bạn có thể chạy tất cả các thí nghiệm trong bài báo Transformer gốc ngay tại phòng học hoặc nhà bếp của mình chỉ với một card đồ họa duy nhất. Và điều này đã được thực hiện trong chưa đầy mười năm. Đây quả là một kỳ tích trong lịch sử khoa học và công nghệ. Ngày nay, chúng ta thực hiện các phép tính với độ chính xác BF16, nhưng thực tế chúng ta có thể sử dụng độ chính xác thấp hơn nữa, đặc biệt là sau khi giới thiệu Mô hình Chuyên gia Lai (MoE), cho phép bạn đưa nhiều thông tin hơn vào giai đoạn suy luận.

Yêu cầu phần cứng để chạy các mô hình này đã được giảm đáng kể, từ đó mở rộng phạm vi nghiên cứu học thuật. Bạn có thể dựa vào số lượng lớn card đồ họa tốc độ cao để huấn luyện các siêu dữ liệu. Cả GPU của NVIDIA và TPU của Google đều duy trì tốc độ lặp lại cực kỳ nhanh và liên tục được cải thiện về khả năng xử lý song song.

Nhưng tôi nghĩ điều thú vị hơn nữa là nó giải phóng khả năng sáng tạo của các nhà nghiên cứu đến mức nào. Tôi nhớ khi mới gia nhập Google, cộng đồng khoa học vẫn đang tranh luận gay gắt về số lượng FLOPs cần thiết để mô phỏng toàn bộ não người. Hàng thập kỷ tính toán cuối cùng đã chỉ ra con số nằm trong khoảng từ 1 đến 100 petaflops. Khi đó, tất cả chúng ta đều nghĩ rằng sẽ cần hàng thập kỷ phát triển phần cứng để đạt được con số đó. Giờ đây, bạn có thể dễ dàng đạt được ngưỡng đó chỉ bằng cách mua một GPU hoặc thuê một vài máy chủ trên đám mây. Về mặt lý thuyết, giờ đây bạn chỉ cần chi vài trăm hoặc vài nghìn đô la (thay vì hàng triệu đô la như trước đây) để xử lý lượng dữ liệu tương đương với một năm mà não người xử lý trong một ngày.

Nếu một ý tưởng mới nảy ra trong đầu bạn về cơ chế học tập của não bộ con người, bạn có thể chạy và mô phỏng quá trình học tập kéo dài nhiều năm chỉ trong vài ngày. Theo tôi, sự trao quyền kiểu này mang tính đột phá hơn so với việc chỉ đơn thuần xây dựng một mô hình khổng lồ. Nó có thể giúp bạn loại bỏ mọi trở ngại trong quá trình triển khai. Trước đây, khi nghiên cứu về mạng nơ-ron hồi quy (RNN), tôi thường cảm thấy bị hạn chế vì chúng hoạt động tuần tự và chạy cực kỳ chậm trong PyTorch. Mặc dù bạn có thể giải quyết vấn đề tăng tốc bằng cách tự viết kernel CUDA, nhưng rào cản gia nhập để viết kernel CUDA lại vô cùng cao. Giờ đây, bạn có thể để một tác nhân tự động viết kernel CUDA cho bạn, cho phép nó tự sửa lỗi bằng các bài kiểm tra đơn vị tương đối chậm, ngay lập tức biến rào cản nghiên cứu từng không thể vượt qua thành một con đường thuận lợi. Mặc dù công nghệ viết kernel hiện tại của họ chưa hoàn hảo, nhưng nó đã chứng minh được tính khả thi. Chẳng bao lâu nữa, các mô hình tiên tiến hơn sẽ có thể làm được điều này: bạn chỉ cần đưa ra một chỉ dẫn duy nhất để "tối đa hóa hiệu suất phần cứng", và nó sẽ cung cấp cho bạn mã cấp thấp hoàn hảo.

Điểm nghẽn "kiến trúc phần cứng không theo kịp các ý tưởng nghiên cứu" đang nhanh chóng biến mất. Mặc dù kiến trúc phần cứng vẫn là song song, nhưng phạm vi bạn có thể khám phá giờ đây đã khác biệt rất nhiều vì các tác nhân thông minh liên tục viết các nhân nền tùy chỉnh cho bạn.

Người dẫn chương trình: Có một quan điểm phổ biến trong ngành rằng nếu không có sức mạnh siêu máy tính của các phòng thí nghiệm hàng đầu, các cá nhân hoặc các tổ chức thông thường khó có thể tiến hành nghiên cứu học thuật chuyên sâu, có ý nghĩa thực tiễn. Bạn chắc chắn có thể thực hiện một số khám phá cơ bản, nhưng chân lý cuối cùng cần được kiểm chứng trên các hệ thống tính toán khổng lồ, một nền tảng hiếm khi có sẵn cho người bình thường. Việc nghe thấy sự lạc quan liên tục của bạn về giới học thuật, các nhà nghiên cứu nghiệp dư và các công ty khởi nghiệp sử dụng thẻ đơn thực sự rất đáng khích lệ. Bạn có nghĩ rằng loại nghiên cứu khoa học phổ biến này có thể thực sự tiếp tục trong tương lai không?

Lukasz : Điều đó phụ thuộc vào tâm trạng của tôi ngày hôm đó. Vào những ngày lạc quan hơn, tôi tin chắc điều này. Lịch sử khoa học đã chứng minh vô số lần rằng những ý tưởng thực sự tuyệt vời thường nảy sinh từ nghiên cứu thuần túy, và không có lý do gì để ngừng việc khám phá trong tương lai. Nhưng đồng thời, các công nghệ chủ đạo mà chúng ta hiện đang sở hữu đã thực sự chứng tỏ sức sống mãnh liệt, và sẽ là một sai lầm lớn nếu từ bỏ chúng và không tiếp tục khám phá tiềm năng của chúng. May mắn thay, hệ sinh thái phòng thí nghiệm hiện tại trong ngành công nghiệp đủ đa dạng.

Trước khi chuyển sang làm việc trong phòng thí nghiệm, tôi đã gắn bó sâu sắc với giới học thuật. Khía cạnh hấp dẫn nhất của việc nghiên cứu trong môi trường học thuật là bạn có thể thỏa sức sáng tạo và để cho suy nghĩ của mình được tự do bay bổng. Chắc chắn bạn không thể cạnh tranh trực tiếp với các công ty lớn về quy mô, nhưng ngay cả ở quy mô tương đối nhỏ hơn—và "quy mô nhỏ" ngày nay rất khác so với hiện nay—bạn vẫn có thể tạo ra những nghiên cứu tiên tiến và độc đáo. Bạn nên thử những ý tưởng hoàn toàn thoát ly khỏi các khuôn khổ chính thống hiện tại, những ý tưởng đầy cảm hứng và có tính thẩm mỹ cao. Đó mới là niềm vui thực sự của việc nghiên cứu.

Tất nhiên, không phải mọi nguồn cảm hứng đều mang lại kết quả; một số phương pháp hoạt động cực kỳ tốt trên quy mô nhỏ, nhưng nhanh chóng thất bại khi quy mô tham số được tăng lên. Nhưng nếu bạn có trong tay một máy chủ 8 GPU thông thường, điểm khởi đầu nghiên cứu của bạn đã vượt xa so với năm năm trước. Năm năm trước, người ta chỉ có thể thực hiện những điều chỉnh nhỏ trên các tập dữ liệu đơn giản như MNIST; giờ đây, ngay cả trên một nút vật lý duy nhất, bạn không còn chỉ thực hiện những điều chỉnh nhỏ nữa.

Cá nhân tôi thường xuyên sử dụng nanoGPT của Andrej Karpathy trong thời gian rảnh. Đó là một mô hình cấp độ GPT-2 mà bạn có thể chạy trên một máy tính chỉ với một card đồ họa trong vài giờ. Mặc dù phần cứng hiện tại khá đắt đỏ, nhưng các card đồ họa cũ cuối cùng sẽ trở nên phổ biến hơn khi các thế hệ GPU mới hơn được ra mắt. Khả năng thử nghiệm độc lập là vô cùng rộng lớn, và ngay cả khi không phải tất cả các phương pháp đều hoạt động với sức mạnh siêu máy tính, sự kích thích trí tuệ và niềm hứng khởi của quá trình khám phá này là không gì sánh được.

Người dẫn chương trình: Trước khi đưa ra quyết định cuối cùng, tôi muốn hỏi ông về một lĩnh vực tiên tiến khác – mô hình vận tải đa phương thức. Trong một podcast trước đây, ông đã đề cập rằng chúng ta vẫn chưa đạt được bước tiến đột phá thực sự trong lĩnh vực mô hình vận tải đa phương thức. Ông vẫn giữ quan điểm này chứ? Ông nghĩ gì về bối cảnh phát triển hiện tại của lĩnh vực vận tải đa phương thức?

Lukasz : Rõ ràng là mọi người đang đạt được những bước đột phá. Có lẽ giải pháp đang hướng đến một hướng tương tự như Kiến trúc Dự đoán Nhúng Chung (JEPA). Con đường học tập đa phương thức mà chúng ta hiện đang áp dụng trong Transformer và thậm chí cả các mô hình khuếch tán cuối cùng đều dẫn đến việc dự đoán từng pixel một cách cực kỳ kém hiệu quả.

Nhưng nếu bạn hướng sự chú ý đến con người, bộ não của chúng ta liên tục hấp thụ và xử lý một lượng thông tin khổng lồ. Các tế bào thần kinh của chúng ta phản ứng tương đối chậm—thường cần hàng trăm mili giây—nhưng các giác quan của chúng ta lại tiếp nhận lượng dữ liệu khổng lồ này suốt ngày đêm, từ mọi góc độ. Chúng ta học hỏi thành công từ dòng dữ liệu khổng lồ này mà không cần phải dự đoán tự hồi quy từng pixel như các mô hình lớn. Cơ chế học tập tương tác của con người có tính song song cao và diễn ra trên quy mô vô cùng rộng lớn. Cá nhân tôi tin rằng các mô hình hiện có vẫn chưa thực sự nắm bắt được bản chất cốt lõi này . Điều này có thể đòi hỏi những đột phá mới trong nghiên cứu của chúng ta về các kiến trúc nền tảng.

Những ý tưởng mới đang nổi lên trong ngành, chẳng hạn như Transformer đa luồng. Transformer tiêu chuẩn thực hiện các phép tính chú ý trên các token đã đề cập trước đó. Tuy nhiên, bạn có thể thiết kế nhiều luồng thông tin song song để hoạt động đồng bộ. Mặc dù đây chỉ là một cải tiến kiến trúc nhỏ và tương đối đơn giản, nhưng nó lại sở hữu sức mạnh to lớn.

Khi làm việc với Cursor, tôi có thể vô tình quên điều gì đó, nói với nó bằng lời, rồi phải đợi nó chạy lệnh Bash trong terminal—một quá trình mất đến ba phút. Nó phải chờ tôi nhập liệu để hiệu chỉnh hướng; trạng thái bán tự động này khó có thể được coi là tương tác hai chiều, thời gian thực cao. Chúng tôi đã giới thiệu nhiều kỹ thuật vá lỗi tạm thời để cải thiện trải nghiệm, nhưng trong một thế giới lý tưởng, mọi thứ nên hoạt động phối hợp với nhau mọi lúc. Thị giác, thính giác và khả năng diễn đạt của con người là hai chiều và tích hợp, và các mô hình của chúng ta cũng nên có đặc tính thông lượng thời gian thực tương tự. Khi các phòng thí nghiệm lớn bắt đầu tập trung vào khía cạnh này, tầm nhìn đó có thể sẽ trở thành hiện thực.

Tuy nhiên, ấn tượng hiện tại là trong khi chúng ta đang nghiên cứu các công nghệ "đa phương thức", chúng ta vẫn thiếu một sự nâng cấp kiến trúc mang tính cách mạng thực sự có thể hỗ trợ "hấp thụ song song" ở cấp độ cơ bản. Với cơ chế hoạt động hiện tại, Transformer đơn giản là không thể xử lý dễ dàng một hình ảnh độ phân giải cao trong mỗi mili giây vì ở đầu vào, nó phải chia hình ảnh thành các mảnh nhỏ rời rạc và sau đó ghép chúng lại với nhau một cách kém hiệu quả. Điều này luôn tạo cảm giác khó chịu; chúng ta không nên cắt hình ảnh thành những mảnh nhỏ như vậy. Thông tin cảm giác nên được truyền vào một cách liền mạch như thác nước và được xử lý ngay lập tức như một tổng thể. Tôi tin rằng chúng ta vẫn chưa đạt được một bước đột phá thực sự cơ bản trong lĩnh vực này, nhưng tôi rất vui khi thấy nhiều đồng nghiệp đang miệt mài nghiên cứu theo hướng này.

Bạn phải luôn đặt cược vào những xu hướng phản ánh tương lai.

Người dẫn chương trình: Tôi rất muốn trò chuyện với anh về thời gian làm việc tại OpenAI và hành trình cá nhân của anh, bởi vì những năm đó thực sự rất nhiều biến động, và công ty luôn là tâm điểm chú ý. Trong suốt nhiệm kỳ của mình, những quyết định khó khăn nhưng quan trọng nào đã định hình lại và thiết lập nên bản sắc của công ty?

Lukasz : Tôi không tham gia vào các quyết định ban đầu của công ty, nhưng trong thời gian tôi làm việc, toàn bộ công ty đã phải đối mặt với một lựa chọn lớn: liệu có nên chuyển đổi hoàn toàn và tập trung toàn lực vào "Lý luận" hay không. Vào thời điểm đó, ban quản lý công ty và toàn bộ nhân viên R&D đã thể hiện sự can đảm tuyệt vời, quyết định theo đuổi con đường này bằng mọi giá, nâng "Lý luận" lên tầm chiến lược ngang bằng với "Huấn luyện trước", và cống hiến hết mình để tạo ra một thế hệ mô hình mới với lõi suy luận thực sự và đưa chúng ra thị trường.

Trong giai đoạn phát triển ban đầu, các mô hình này, tập trung vào suy luận logic, có vẻ hơi thiếu tính cá nhân trong các cuộc hội thoại hàng ngày, khó có thể truyền tải được những đặc điểm sống động của con người; tốc độ phản hồi của chúng cũng khá chậm, một điểm nghẽn vẫn còn tồn tại cho đến ngày nay. Nhiều người bắt đầu do dự: Liệu chúng ta có thực sự phải đi theo con đường này? Liệu người dùng có thực sự thích các mô hình hội thoại thông thường, trôi chảy hơn không? Nhưng OpenAI lại xuất sắc trong việc đưa ra các quyết định cấp cao tại những thời điểm quan trọng, kiên quyết tiến về phía trước trên con đường đầy chông gai này, và trong quá trình đó, phát triển một cơ chế quản lý hiệu quả.

Vào thời điểm đó, chúng tôi có hai dòng sản phẩm hoàn toàn khác nhau đang hoạt động song song, và việc hợp nhất chúng thành một thể thống nhất là một dự án vô cùng thách thức. Chúng tôi mất rất nhiều thời gian để hoàn thành việc tích hợp này vì tất cả các công nghệ nền tảng đều đang phát triển nhanh chóng. Đó là một quyết định rất khó khăn, nhưng nếu chúng tôi không dốc toàn lực và tiến lên phía trước, nhiều khả năng mạnh mẽ mà chúng ta đang có ngày nay có thể sẽ không bao giờ tồn tại. Ngay cả một số công ty hàng đầu hiện nay vẫn phải đối mặt với áp lực rất lớn để bắt kịp về chất lượng đồng bộ hóa tinh tế của học tăng cường, điều này minh họa hoàn hảo lợi thế dẫn đầu tuyệt đối mà "sự tập trung không lay chuyển" có thể mang lại.

Kể từ đó, OpenAI và một số phòng thí nghiệm hàng đầu khác trong ngành đã trải qua sự tăng trưởng theo cấp số nhân, cũng như Anthropic. Từng làm việc tại Google trong một thời gian dài, tôi biết việc một tập đoàn khổng lồ đưa ra một quyết định táo bạo như vậy khó khăn đến mức nào, với vô số tài sản không thể tránh khỏi và quy trình báo cáo rườm rà. Tôi chân thành hy vọng rằng OpenAI và các phòng thí nghiệm mới nổi khác có thể tiếp tục tinh thần tiên phong này. Mặc dù các công nghệ hiện có chắc chắn rất xuất sắc và vẫn có thể giúp chúng ta mở rộng phạm vi hoạt động, nhưng nếu một ngày nào đó một tia sáng khoa học thực sự xuất hiện trong "kỷ nguyên hậu Transformer", liệu các phòng thí nghiệm siêu việt này có đủ can đảm để hy sinh mạnh mẽ để tồn tại và đón nhận tương lai, hay họ sẽ ngày càng trở nên bảo thủ và do dự?

Khi chúng tôi bắt đầu giai đoạn "suy luận", chúng tôi chỉ thấy một tia hy vọng le lói ban đầu. Chúng tôi thiếu một lượng lớn dữ liệu toàn diện để xác thực các phát hiện của mình; mọi người chỉ đơn giản là dốc hết sức mình với niềm tin không lay chuyển. Giờ đây, mặc dù chúng ta vẫn chưa thấy một kiến trúc đa năng thế hệ tiếp theo với những ưu điểm vượt trội, nhưng một khi nó bắt đầu xuất hiện, liệu chúng ta có cần một phòng thí nghiệm hoàn toàn mới để khơi lại ngọn lửa này, hay chúng ta có thể kỳ vọng các công ty hàng đầu hiện tại sẽ tiếp tục chấp nhận rủi ro chưa biết này? Ít nhất, tôi tin rằng OpenAI vẫn sở hữu khả năng đưa ra những quyết định mạo hiểm.

Người dẫn chương trình: Đó chính xác là lý do tại sao rất nhiều thế lực mới, được gọi là "Neolabs", đang nổi lên trong ngành công nghiệp hiện nay. Như Jerry Tworek đã nói khi ông quyết định tự mình khởi nghiệp, việc thoát khỏi những ràng buộc của các công ty lớn truyền thống cho phép họ tập trung và quyết tâm hơn vào hướng đi đúng đắn mà họ tin tưởng.

Lukasz : Điều đó chắc chắn có những ưu điểm riêng. Tuy nhiên, một khi bạn rời khỏi sự bảo hộ của các phòng thí nghiệm nghiên cứu chính và thấy được những con số khổng lồ cần thiết để mua card đồ họa và sự khan hiếm của chúng, bạn có thể phải đối mặt với một thực tế khắc nghiệt. Tất nhiên, sức mạnh tính toán của card đồ họa không đại diện cho toàn bộ nghiên cứu khoa học. Một hệ sinh thái đa dạng được xây dựng bởi các nhóm nhỏ, tận tâm và các phòng thí nghiệm siêu lớn, toàn diện là rất lành mạnh cho toàn bộ ngành công nghiệp.

Tại San Francisco, trung tâm của trí tuệ nhân tạo (AI), bạn sẽ được đắm chìm trong bầu không khí cạnh tranh và thay đổi mạnh mẽ, bởi vì những lợi thế công nghệ hiện tại vẫn chưa được khai thác hết. Vô số thuật toán phức tạp đang chờ được triển khai, kỹ thuật dữ liệu cần được nâng cấp, các mô hình với tập tham số lớn hơn cần được huấn luyện, và một dòng chảy liên tục các ý tưởng mới đang xuất hiện. Mặc dù những ý tưởng này chưa hoàn thiện, nhưng nhiều thế lực đang không ngừng thúc đẩy chúng tiến lên với nguồn vốn và chuyên môn khổng lồ.

Tuy nhiên, một khi rời khỏi San Francisco, bạn sẽ thấy nhiều người ngoài cuộc nhìn nhận AI như thể nó đã đạt đến đỉnh cao vào năm ngoái và sẽ không bao giờ tiến bộ hơn nữa. Đây chắc chắn là một nhận định sai lầm lớn. Đối với cá nhân tôi, thế hệ các tác nhân mã thông minh hiện nay không khác gì một thảm họa công nghệ. Tôi gọi chúng là nguyên mẫu của Trí tuệ Nhân tạo Tổng quát (AGI) – tất nhiên, mỗi người có thể có định nghĩa riêng về AGI. Chúng ta thậm chí có thể dần quên đi thuật ngữ AGI trong tương lai không xa, giống như cách chúng ta đã nói lời tạm biệt với Bài kiểm tra Turing. Rất ít học giả còn tranh luận nghiêm túc về việc liệu AI đã vượt qua Bài kiểm tra Turing hay chưa, bởi vì công nghệ đã dễ dàng vượt qua vạch đích đó. Các hệ thống mà chúng ta dựa vào để lập trình hàng ngày chắc chắn đã thể hiện trí thông minh đáng kinh ngạc, tự bản thân nó đã là một bước tiến đột phá.

Người dẫn chương trình: Cuộc cạnh tranh trong lĩnh vực tạo mã AI hiện nay vô cùng khốc liệt. Theo ông, đâu là những yếu tố then chốt quyết định sự thành công hay thất bại của các sản phẩm mã nguồn này, và làm thế nào để chúng tạo được sự khác biệt? Ông kỳ vọng gì về tương lai của các công cụ như Cursor và Claude? Tôi tin rằng thị trường mã nguồn này đủ lớn để có thể có nhiều người chơi hàng đầu.

Lukasz : Vấn đề cơ bản hơn nằm ở chỗ làm thế nào những công cụ này có thể chuyển đổi liền mạch sang các lĩnh vực công việc khác. Mã lập trình quả thực rất quan trọng đối với những người làm trong lĩnh vực công nghệ như chúng ta, nhưng logic cơ bản tương tự có thể hỗ trợ vô số ngành công nghiệp khác. Mỗi khi tôi nhiệt tình giới thiệu Cursor cho bạn bè ngoài lĩnh vực công nghệ, họ ngay lập tức yêu cầu phải liên kết đến kho lưu trữ GitHub, điều này ngay lập tức làm nản lòng nhiều người dùng thông thường không có kinh nghiệm trước đó. Mặc dù đường cong học tập của nó đang được giảm dần, nhưng vì nó tập trung vào lĩnh vực "phát triển mã lập trình", nên mọi người hoàn toàn không biết rằng nó cũng có thể là một công cụ mạnh mẽ cho việc kiểm toán tài chính. So với ChatGPT, chỉ cần gõ vài từ, Cursor chắc chắn cần một thời gian làm quen, đặc biệt là khi sử dụng giao diện phát triển chuyên sâu của Claude.

Điểm mấu chốt gây tranh cãi nằm ở chỗ làm thế nào chúng ta có thể mang lại hiệu quả vượt trội này cho các ngành công nghiệp thông thường khác. Rõ ràng là Anthropic đang giao cho Claude nhiệm vụ này, nỗ lực biến những khả năng cốt lõi mạnh mẽ này trở nên dễ tiếp cận và dễ sử dụng hơn.

Người dẫn chương trình : Khả năng liên ngành này hoàn toàn tồn tại. Là một người thực hành máy học, tôi thường thấy các mô hình xử lý dữ liệu Excel cực kỳ phức tạp và nhiều tác vụ văn phòng khác nhau một cách dễ dàng. Nhưng thành thật mà nói, việc thực sự làm chủ và điều khiển chúng vẫn đòi hỏi một trình độ chuyên môn nhất định. Mặc dù đây là một kỹ năng có thể học được, nhưng hầu hết các chuyên gia đang làm việc đều rất bận rộn mỗi ngày và có thể khó tìm được đủ thời gian rảnh để tìm hiểu sâu về nó. Do đó, chúng ta phải giảm thiểu các rào cản tương tác của sản phẩm. Hơn nữa, vì những cân nhắc cơ bản về bảo mật dữ liệu và tính ổn định của hệ thống, bạn không thể để chúng hoạt động tràn lan mà không có sự giám sát. Xây dựng lòng tin cần một quá trình tích lũy lâu dài.

Câu hỏi đặt ra là, làm thế nào để thuyết phục công chúng đầu tư thời gian và công sức ban đầu để xây dựng niềm tin quý giá này? Nhìn lại, theo bạn, tại sao Anthropic lại có thể vươn lên và đạt được thành công đáng kể trong lĩnh vực cốt lõi là lập trình?

Lukasz : Vào thời điểm đó, Anthropic đã đưa ra một lựa chọn chiến lược vô cùng sáng suốt—tập trung toàn bộ nguồn lực vào lĩnh vực "mã lập trình". Trong khi đó, thế mạnh cốt lõi của OpenAI lại bị lu mờ bởi sự thành công vang dội của ChatGPT.

Mặc dù trò chuyện thông thường chắc chắn có tiềm năng vô hạn, nhưng yếu tố cốt lõi mà Anthropic cân nhắc khi đưa ra quyết định này nằm ở việc họ tìm kiếm một khía cạnh cụ thể mà ở đó họ có thể thiết lập lợi thế tuyệt đối và xây dựng một rào cản vững chắc. Đây hoàn toàn là vấn đề về trí tuệ chiến lược cấp cao. Ngành công nghiệp AI thường xuyên trải qua những cơn sóng thần công nghệ; bạn phải luôn đặt cược vào xu hướng đại diện cho "ngày mai", thay vì mù quáng bám víu vào sự thịnh vượng của "ngày hôm nay". ChatGPT đã gây kinh ngạc vào năm 2025, nhưng đến năm 2026, ngưỡng chấp nhận của công chúng sẽ được nâng cao đáng kể, và đến năm 2027, chúng ta chắc chắn sẽ chứng kiến một sự thay đổi mang tính đột phá khác.

Sự thay đổi về động lực diễn ra nhanh hơn bất kỳ ai tưởng tượng. Một khi bạn tung ra một cuộc tấn công dồn dập, phủ sóng toàn diện vào một thị trường ngách nhỏ, bị bỏ qua, bạn có thể gặt hái được những phần thưởng kỹ thuật vô cùng lớn. Không phải OpenAI đã bỏ bê mã nguồn—chúng tôi luôn tham gia sâu vào lĩnh vực này, đó là lý do tại sao chúng tôi có thể bắt kịp nhanh chóng sau này—nhưng nó không phải là trọng tâm cốt lõi tuyệt đối của công ty vào thời điểm đó. Khi một nhóm khởi nghiệp tương đối nhỏ gọn trải qua sự bùng nổ mạnh mẽ về số lượng người dùng trong một thời gian rất ngắn, việc biết cách tinh giản và duy trì sự tập trung tuyệt đối là cách duy nhất để tránh sự sụp đổ của toàn bộ kiến trúc kỹ thuật.

Người dẫn chương trình: Anh vừa nhắc đến một trò chơi kinh điển: một mặt, bạn cần vắt kiệt từng giọt lợi nhuận từ những cơ hội hiện tại, mặt khác, bạn cần duy trì một tầm nhìn cởi mở để khi những lĩnh vực mới, chưa được biết đến xuất hiện, bạn có thể nhanh chóng giải phóng nguồn lực để đầu tư mạnh mẽ. OpenAI gần đây đã trải qua một giai đoạn tập trung nguồn lực khá nổi tiếng. Chúng ta có thể thấy rằng họ đã dồn rất nhiều nỗ lực vào việc cung cấp mã nguồn và các công cụ năng suất, đồng thời chủ động điều chỉnh và giảm bớt chiến lược của mình đối với những lĩnh vực mang tính thăm dò tương đối như Sora. Theo anh, làm thế nào để có thể khéo léo cân bằng sự căng thẳng vốn có giữa việc "hoàn thiện triệt để hoạt động kinh doanh hiện tại" và "nuôi dưỡng những tia lửa nhỏ có thể bùng cháy thành một đám cháy lớn trong tương lai"?

Lukasz : Tất cả phụ thuộc vào bản chất cốt lõi của một nhóm, quy mô tổ chức, nguồn lực tài chính và tầm nhìn chiến lược. Ví dụ, Google nỗ lực duy trì một hệ thống nghiên cứu khổng lồ, đa diện. Điều này thường bị chỉ trích, với lập luận từ bên ngoài rằng mặc dù họ đã phát minh ra vô số công nghệ đột phá (như chính Transformer), nhưng họ chưa thể thương mại hóa chúng một cách khéo léo nhất. Tuy nhiên, nền tảng học thuật cực kỳ vững chắc này cũng mang lại cho họ một lợi thế bất đối xứng đáng kể: một khi bên ngoài vượt qua được nút thắt cổ chai trong một lĩnh vực nhất định, Google, với đội ngũ nghiên cứu sẵn có và cực kỳ mạnh mẽ, có thể thu hẹp khoảng cách và bắt kịp trong thời gian rất ngắn.

Người dẫn chương trình : Anh/chị có nghĩ rằng họ đã thực sự bắt kịp hoàn toàn chưa? Vẫn còn nhiều ý kiến bàn tán bên ngoài cho rằng họ đang tụt hậu một bước.

Lukasz : Về các cuộc trò chuyện thông thường, tôi nghĩ chúng chắc chắn đã bắt kịp hoặc thậm chí vượt qua nhau. Điểm yếu duy nhất của chúng có thể là... Tôi không biết liệu bạn đã tự mình thử nghiệm thế hệ Gemini mới nhất chưa. Tôi đã thử nó sau sự kiện Google I/O và rất ngạc nhiên khi thấy mình khó có thể phân biệt được mình đang dùng Cursor hay đang đối diện với chính Gemini. Cũng có rất nhiều cuộc thảo luận liên quan trên Twitter vào thời điểm đó, đầy những lời bông đùa và lời khen ngợi. Nó thực sự là một bước tiến lớn.

Trong khi đó, gần đây tôi đã thử chạy một số dự án lập trình hàng ngày của mình trên hệ điều hành Gemini 3.5 Flash mới ra mắt, nhưng hiệu năng của nó hơi kém hơn, dường như vẫn chưa thực sự khắc phục được khoảng cách về khả năng mà chúng ta đã gặp phải vào Giáng sinh năm ngoái. Đối với công việc cá nhân cấp cao của tôi, nó thực sự vẫn còn hơi thiếu sót, nhưng tôi tin rằng nó sắp trải qua một sự thay đổi về chất lượng.

Khi bạn lựa chọn một phương pháp nghiên cứu đa chiều, toàn diện, bạn vô tình xây dựng được một mạng lưới an toàn tuyệt vời, đảm bảo bạn sẽ không bị tụt hậu trong các cuộc cạnh tranh tương lai. Tuy nhiên, cái giá phải trả là bạn khó có thể đạt được lợi thế "người tiên phong" tuyệt đối trong một lĩnh vực mới nổi cụ thể, giống như thành công của Anthropic trong lĩnh vực tạo mã. Thật đáng khích lệ khi chứng kiến những phòng thí nghiệm nhỏ, tận tâm và táo bạo tiên phong trong những đột phá này, biến những khả năng riêng lẻ, chưa được biết đến thành những con đường công nghệ vững chắc. Đây chính là cách mà tiến bộ khoa học nên diễn ra.

OpenAI từng tự hào về một nền văn hóa "chấp nhận rủi ro" vô cùng nhiệt huyết và thuần khiết, nhưng giờ đây đã trưởng thành thành một gã khổng lồ. Khi các mô hình của bạn hỗ trợ năng suất hàng ngày của hàng trăm triệu người dùng, hoặc, như Google Search, bảo vệ các truy vấn cho hàng tỷ người, bất kỳ sự gián đoạn hoặc mất cân bằng nào trong hệ thống đều có những hậu quả nghiêm trọng. Chúng ta chắc chắn muốn tốc độ càng cao càng tốt, nhưng nếu toàn bộ con đường bị phá hủy trong quá trình tiến bộ nhanh chóng, chi phí phát sinh sẽ là không thể tính toán được. Do đó, việc cho phép các công ty hàng đầu này duy trì sự thận trọng và ổn định đối với cơ sở hạ tầng trong khi vẫn tăng tốc có thể là sự sắp xếp tốt nhất cho toàn bộ hệ sinh thái.

Hãy dũng cảm và thử nghiệm những ý tưởng táo bạo nhất trong đầu bạn.

Người dẫn chương trình: Nhiều người đang suy ngẫm về khoảng cách giữa các mô hình lớn mã nguồn mở và mã nguồn đóng. Chúng ta dường như cảm nhận được hai lực lượng cơ bản hoàn toàn trái ngược nhau đang kéo nhau: một mặt, rào cản đối với việc tinh chỉnh mô hình dường như ngày càng giảm, với một số lượng lớn các nhà phát triển sử dụng đầu ra mạnh mẽ của các mô hình mã nguồn đóng để đưa trở lại và tinh chỉnh các mô hình mã nguồn mở; mặt khác, các siêu mô hình tiên tiến và đồ sộ nhất lại có chi phí vận hành cao đến mức ngay cả những gã khổng lồ cũng không thể trực tiếp cung cấp dịch vụ cho công chúng, buộc họ phải thực hiện nhiều lần tinh chỉnh nội bộ trên các mô hình lớn.

Theo trực giác của bạn, liệu khoảng cách công nghệ giữa mã nguồn mở và mã nguồn đóng sẽ được thu hẹp trong vài năm tới, hay sẽ trở thành một rào cản ngày càng khó vượt qua?

Lukasz : Thật khó để khái quát hóa. Ở giai đoạn hiện tại, kích thước model vẫn chủ yếu quyết định giới hạn khả năng của nó. Bạn thực sự có thể thu nhỏ một model thông qua việc tinh chỉnh, nhưng các phiên bản tinh chỉnh hiếm khi thể hiện được khả năng tương tự như phiên bản gốc đầy đủ trong các tác vụ thực sự khắc nghiệt. Ví dụ, tôi luôn cảm nhận được sự khác biệt rõ rệt về hiệu năng giữa các phiên bản Flash được quảng cáo là nhẹ và tiết kiệm chi phí và các phiên bản Pro hoặc Sonnet truyền thống—chúng thường là các sản phẩm tinh chỉnh được tạo ra sau khi đã thỏa hiệp về các hạn chế, trong khi những người dùng chuyên nghiệp thường phải kiên nhẫn chờ đợi phiên bản cao cấp nhất, không bị ràng buộc. Ngay cả trong cùng một dòng sản phẩm, tôi không nhớ lần cuối cùng mình phải dựa vào dòng "Mini" là khi nào. Mặc dù chúng rẻ và dễ sử dụng, nhưng trong quá trình phát triển hàng ngày của tôi, sớm muộn gì chúng cũng sẽ mắc phải một lỗi cực kỳ cơ bản, buộc tôi phải dành nhiều thời gian để khắc phục sự cố và gỡ lỗi, và cuối cùng tôi luôn quay lại phiên bản hàng đầu lớn nhất và đắt nhất.

Bạn hoàn toàn có thể học hỏi và chắt lọc kinh nghiệm từ các mô hình mã nguồn đóng, mặc dù các phòng thí nghiệm mã nguồn đóng lớn thường phản đối việc chắt lọc trực tiếp này, nhưng họ thường sẽ không chọn cách loại bỏ chúng hoàn toàn. Nếu các mô hình mã nguồn mở sụp đổ và tụt hậu trong tương lai, đó sẽ là thảm họa cho toàn ngành. Tuy nhiên, tôi tin rằng kịch bản tồi tệ nhất này khó có thể xảy ra vì hiện nay có đủ các nhóm thương mại mạnh mẽ và các tổ chức công nghệ ủng hộ hết lòng hệ sinh thái mã nguồn mở. Tôi cũng hiểu những lo ngại của các quốc gia trên thế giới: nếu bạn cho phép các dịch vụ đô thị và hệ thống quản lý bệnh viện cốt lõi của một quốc gia phụ thuộc quá nhiều vào giao diện mã nguồn đóng của một công ty thương mại ở bên kia đại dương, hậu quả sẽ không thể tưởng tượng nổi nếu công ty đó đột nhiên sụp đổ hoặc hạn chế quyền truy cập. Điều này đã tạo ra nhu cầu cấp thiết đối với "các mô hình độc lập".

Ngay cả khi các mô hình tự chủ này có phần tụt hậu về sức mạnh tuyệt đối, chúng cũng không cần sử dụng sức mạnh tính toán cao nhất cho các tác vụ quản trị thường nhật. Do đó, động lực cơ bản cho một hệ sinh thái mã nguồn mở phát triển mạnh mẽ là tầm nhìn dài hạn. Trong khi đó, các phòng thí nghiệm mã nguồn đóng, để đảm bảo người dùng sẵn sàng trả tiền cho những "đặc quyền vàng" độc quyền nhất, sẽ không ngừng tiên phong. Sự năng động hấp dẫn của các cơ chế kiểm soát và cân bằng lẫn nhau, cùng với sự phát triển vượt bậc, sẽ là chủ đề nổi bật của ngành công nghiệp này trong thời gian dài sắp tới. Tất nhiên, dự đoán tương lai của AI luôn là một việc làm đầy rủi ro.

Người dẫn chương trình: Đó chắc chắn là một nhận xét rất sâu sắc. Trong năm qua, khía cạnh nào của lĩnh vực trí tuệ nhân tạo đã hoàn toàn thay đổi quan điểm của bạn?

Lukasz : Thành thật mà nói, tôi chưa bao giờ tưởng tượng rằng chúng ta có thể phát triển khả năng tạo mã mạnh mẽ đến vậy, sánh ngang với trợ lý con người, trong một thời gian ngắn như thế. Điều này đã hoàn toàn đảo ngược những định kiến trước đây của tôi. Trước đây, tôi hiếm khi dựa nhiều vào trợ lý AI trong công việc hàng ngày. Mọi người thường hỏi tôi cách sử dụng ChatGPT, và tôi thường trả lời rằng đó chỉ đơn giản là việc hỏi nó một câu hỏi đơn giản vài ngày một lần.

Tôi chưa bao giờ tưởng tượng mình sẽ dành mỗi ngày trước máy tính, nhưng giờ đây nó đã trở thành người bạn đồng hành không thể thiếu trong công việc của tôi. Tôi cũng chưa bao giờ nghĩ mình sẽ hoàn toàn từ bỏ các trình soạn thảo mã truyền thống; giờ đây tôi hầu như không còn tự gõ mã nữa. Thay vào đó, tôi giống như một người chỉ huy ngồi sau màn hình, ra lệnh cho các trợ lý thực hiện các chỉnh sửa mã khác nhau. Đây là một sự thay đổi triệt để trong phương pháp nghiên cứu cá nhân của tôi.

Người dẫn chương trình: Sau khi tham gia sâu vào quá trình phát triển các mô hình lớn này trong vài năm qua, liệu những lo ngại của ông/bà về vấn đề an toàn và cái gọi là "rủi ro hiện hữu" đã tăng lên hay giảm đi theo từng năm?

Lukasz : Quan điểm cốt lõi của tôi luôn khá ổn định. Tôi tin chắc rằng chúng ta không cần phải sống trong lo lắng thường trực, vô căn cứ, cũng như không có quyền lạc quan một cách mù quáng. Với trình độ phát triển lập trình hiện nay, điều chúng ta thực sự nên tập trung vào là những mối đe dọa an ninh rất thực tế và cấp bách đang hiện hữu – ví dụ, khả năng các hệ thống có thể bị các tác nhân độc hại lợi dụng để thực hiện các cuộc tấn công mạng hoặc gây thiệt hại nghiêm trọng cho cơ sở hạ tầng quan trọng.

Tôi vẫn tin rằng đây là chiến trường chính thực sự mà chúng ta cần khẩn trương cùng nhau giải quyết. Điều này không có nghĩa là chúng ta có thể bỏ qua "những rủi ro hiện hữu"; ngược lại, một số lượng lớn các học giả chuyên ngành đang nghiên cứu vấn đề này và xây dựng một khuôn khổ vững chắc cho sự phát triển của khoa học và công nghệ.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan

Bitcoin Sistemi

Giao dịch mua lớn của "cá voi khổng lồ", giá altcoin niêm yết trên các sàn giao dịch lớn lao lao dốc - thiệt hại hơn 70%.

SIREN

42.77%

ChainCatcher

Anthropic bác bỏ lệnh cấm của chính phủ Mỹ đối với việc người nước ngoài sử dụng Fable 5.

OPUS

1.87%

Decrypt

Chính phủ Mỹ yêu cầu Anthropic gỡ bỏ các mô hình AI Claude Fable và Mythos.