Đầu năm nay, OpenAI lại trải qua một biến động nhân sự khác: chuyên gia hàng đầu về mô hình suy luận đã rời công ty!
Jerry Tworek —một nhân vật chủ chốt trong việc xây dựng o3, o1, GPT-4, ChatGPT và mô hình lập trình AI đầu tiên của OpenAI, Codex, đồng thời là Phó Chủ tịch Nghiên cứu tại OpenAI— đã công bố quyết định khó khăn của mình :
Hãy rời khỏi OpenAI và thử khám phá một số lĩnh vực nghiên cứu khó thực hiện tại OpenAI.
Tôi tò mò, những khía cạnh nào trong "nghiên cứu khó thực hiện tại OpenAI" mà ông ấy đề cập đến?
Ông ấy nói rằng trong gần bảy năm làm việc tại OpenAI , ông đã trải qua nhiều khoảnh khắc tuyệt vời và điên rồ, nhưng phần lớn trong số đó là những khoảnh khắc tuyệt vời.
(Ngay cả những nhân vật quan trọng tại OpenAI cũng đang trải qua "cơn ngứa ngáy bảy năm"?)
Nhiều nhân viên của OpenAI đã chia sẻ những trải nghiệm thú vị khi làm việc với Jerry trong bài đăng trên Twitter này.
Tôi cũng chúc anh ấy một tương lai tươi sáng.
Các từ khóa xuất hiện nhiều nhất trong phần bình luận của cư dân mạng và người xem chủ yếu là "cảm ơn" và "ngưỡng mộ" .
Vẫn còn một số người bạn cảm thấy thất vọng vì sự ra đi của những nhân tài chủ chốt từ OpenAI .
Nhưng phần bình luận của người bạn này còn hài hước hơn nữa.
Nhiều người có thể biết đến Jerry qua những cuộc phỏng vấn và bài phát biểu không thường xuyên của ông, nhưng sự hiểu biết của họ về ông chưa toàn diện.
Giờ thì, hãy cùng tìm hiểu kỹ hơn về bậc thầy mô hình suy luận này , như một cách để nói lời tạm biệt và chúc ông ấy một hành trình mới phía trước.
Người đầu tiên phát triển các mô hình suy luận OpenAI
Jerry Tworek sinh ra và lớn lên ở Ba Lan. Ông nhận bằng thạc sĩ toán học từ Đại học Warsaw và có nền tảng lý thuyết và toán học vững chắc.
Anh ấy không bước chân vào lĩnh vực trí tuệ nhân tạo ngay sau khi tốt nghiệp .
Trong năm năm đầu tiên sau khi rời trường, ông làm việc tại Amsterdam, thực hiện nghiên cứu định lượng, chủ yếu nghiên cứu các chiến lược giao dịch định lượng trên thị trường hợp đồng tương lai.
Trong giai đoạn này, Jerry đã sử dụng lý thuyết và kỹ thuật tối ưu hóa rút tín hiệu từ dữ liệu nhiễu nhằm nghiên cứu và phát triển các chiến lược giao dịch định lượng cho thị trường tương lai, điều này cuối cùng đã dẫn ông đến việc bắt đầu nghiên cứu về học tăng cường .
Năm 2019, Jerry gia nhập OpenAI với tư cách là nhà khoa học nghiên cứu, tập trung vào tổng hợp chương trình thần kinh và học tăng cường.
Vào thời điểm đó, GPT-2 vừa mới được phát hành, và OpenAI vẫn chủ yếu là một phòng thí nghiệm nghiên cứu phi lợi nhuận, quy mô nhỏ và chưa được nhiều người biết đến.
Ngay từ đầu sự nghiệp, anh đã tham gia dự án robot “Giải khối Rubik bằng tay robot” và trình bày dự án này tại Hội thảo Học tăng cường độ sâu NeurIPS 2019.
Jerry cũng là một trong những nhà nghiên cứu đầu tiên tham gia vào phương pháp "huấn luyện trước quy mô lớn + mở rộng tỷ lệ băm " , và ông đã thể hiện sự quan tâm lớn đến suy luận mô hình trong giai đoạn trước ChatGPT.
Sau khi GPT-3 được ra mắt vào năm 2020, ông bắt đầu nghiên cứu đánh giá và huấn luyện GPT-3 để giải quyết các vấn đề suy luận và logic.
Tính đến nay, trong nhiều bài phát biểu và cuộc phỏng vấn trước công chúng, Jerry đã lần nhấn mạnh tầm quan trọng của "lý luận" hơn là chỉ "tạo ra sự trùng khớp mẫu", và có xu hướng coi các mô hình lớn như những hệ thống có thể được huấn luyện để "học quá trình tư duy", chứ không chỉ là một hộp đen dự đoán văn bản.
Từ năm 2019 đến năm 2022, ông đã tiến hành nghiên cứu về tổng hợp chương trình thần kinh và suy luận mô hình lớn tại OpenAI, liên quan đến các mô hình mã lớn như Codex và Copilot, đồng thời sử dụng học tăng cường để cải thiện khả năng suy luận và ra quyết định trong nhiệm vụ phức tạp.
Từ năm 2022, Jerry giữ vai trò Trưởng nhóm nghiên cứu tại OpenAI, dẫn dắt đội ngũ nghiên cứu "làm thế nào để cho phép các mô hình ngôn ngữ quy mô lớn sử dụng các công cụ để giải quyết các vấn đề khó khăn trong các lĩnh vực STEM", bao gồm cả plug-in và trình thông dịch mã.
Sau khi ChatGPT xuất hiện, ông dần được nhiều người biết đến hơn - với tư cách là một trong những người đóng góp chính cho ChatGPT và sê-ri mô hình GPT.
Jerry là nhà nghiên cứu chính của GPT-4 và dẫn đầu nghiên cứu và phát triển mô hình suy luận đầu tiên, o1. Ông được giới thiệu là người chủ chốt phụ trách cơ chế suy luận và khả năng tư duy dài hạn của GPT-5.
Trong nhiều cuộc phỏng vấn và podcast, họ đã giải thích một cách có hệ thống các phương pháp tư duy và sự phát triển của mô hình lập luận GPT-5.
Vào năm 2025, Jerry được thăng chức lên Phó Chủ tịch Nghiên cứu tại OpenAI.
Vào ngày 6 tháng 1 năm 2026, Jerry tuyên bố rời khỏi OpenAI mà không tiết lộ kế hoạch tương lai của mình.
Dưới đây là bản dịch gốc bài luận từ chức của Jerry.
Jerry đã viết gì trong đơn từ chức của mình?
Chào mọi người, tôi đã đưa ra một quyết định khó khăn - đó là rời khỏi OpenAI.
Tôi đã làm việc ở đây gần bảy năm và trải qua nhiều khoảnh khắc tuyệt vời và điên rồ, nhưng chủ yếu là những khoảng thời gian tuyệt vời.
Tôi thực sự rất thích khoảng thời gian làm việc ở đây. Tôi đã tham gia vào giai đoạn phát triển ban đầu của học tăng cường trong robot và huấn luyện các mô hình lập trình đầu tiên trên thế giới, mở ra cuộc cách mạng lập trình mô hình ngôn ngữ quy mô lớn.
Trước khi DeepMind phát hành mô hình Chinchilla, tôi đã phát hiện ra một hiện tượng mà sau này được biết đến với tên gọi "Định luật tỷ lệ Chinchilla".
Tôi đã tham gia vào quá trình phát triển GPT-4 và ChatGPT, và gần đây tôi cũng đã thành lập một đội ngũ để thiết lập một mô hình mới nhằm mở rộng quy mô tính toán huấn luyện và suy luận—hiện nay thường được gọi là mô hình suy luận.
Tôi đã kết bạn với nhiều người, trải qua nhiều đêm ở văn phòng, tham gia và chứng kiến rất nhiều đột phá công nghệ, và chia sẻ tiếng cười cũng như nỗi lo với nhiều người mà tôi coi là cộng sự thân thiết.
Tôi đã may mắn xây dựng và lớn mạnh đội ngũ chuyên gia về máy học mà tôi cho rằng mạnh nhất thế giới.
Đó là một trải nghiệm rất thú vị. Mặc dù tôi rời OpenAL để khám phá một số lĩnh vực nghiên cứu khó thực hiện tại OpenAL, nhưng đây là một công ty đặc biệt và một thực thể đặc biệt trên thế giới, đã chiếm một vị trí vĩnh cửu trong dòng chảy dài của lịch sử nhân loại.
Tôi vô cùng biết ơn sự tin tưởng mà OpenAI và các bạn đã dành cho tôi trong suốt những năm qua. Những khoảnh khắc như thế này luôn có cảm giác hơi lạ lẫm, nhưng ứng xử từ góc độ tích cực, chúng có thể là chất xúc tác cho những điều tuyệt vời.
Cùng nhau, chúng ta làm cho trí tuệ máy móc trở nên hữu ích và đáng tin cậy hơn. Tôi là một người dùng trung thành của mô hình suy luận ChatGPT.
Cảm ơn bạn một lần nữa, cảm ơn bạn ngàn lần.
Hãy giữ gìn sức khỏe nhé, những quả dâu tây thân yêu.
Jerry
Thêm một điều nữa
Ban đầu, bài đăng này đáng lẽ nên kết thúc sau khi bao gồm bài luận ngắn của Jerry.
Nhưng tôi tình cờ đọc được một bình luận thoạt nhìn có vẻ buồn cười, nhưng khi xem xét kỹ hơn, nó lại có lý:
Suy nghĩ kỹ thì đúng là nhiều người rời OpenAI đều viết một bài luận ngắn khi ra đi. Phải chăng đây là một quy tắc bất thành văn? Hay đó là một phần của văn hóa công ty?
Tò mò.jpg
Liên kết tham khảo:
[1]https://x.com/MillionInt/status/2008237251751534622?s=20
[2]https://www.linkedin.com/in/jerry-tworek-b5b9aa56/
[3]https://warsaw.ai/speaker/jerry-tworek/
Bài viết này được đăng tải từ tài khoản WeChat công cộng "Quantum Bit" , tác giả: chuyên về công nghệ tiên tiến, được xuất bản với sự cho phép của 36Kr.






