Đột nhiên, Alec Radford, tác giả đầu tiên của bài báo GPT, từ chức và tất cả hai thế hệ tác giả GPT trước đó đều rời OpenAI.

12-20

Bài viết này được dịch máy

Xem bản gốc

Sau đây là bản dịch tiếng Việt: OpenAI lại mất thêm một nhà khoa học giỏi! Theo thông tin từ The Information, Alec Radford, tác giả chính của bài báo về mô hình GPT đầu tiên, cũng sẽ rời khỏi OpenAI để theo đuổi nghiên cứu độc lập. Được biết, Alec gia nhập OpenAI vào năm 2016 và có tên trong các bài báo từ GPT thế hệ đầu tiên đến GPT-4, trong đó ông là tác giả chính của hai thế hệ đầu tiên. Ngoài ra, Alec cũng là tác giả chính của các mô hình đa phương tiện CLIP và mô hình nhận dạng giọng nói Whisper của OpenAI. Về việc Alec rời khỏi OpenAI, Mark Chen, người phụ trách nghiên cứu tại OpenAI, cho biết: "Chúng tôi rất trân trọng và đánh giá cao đóng góp của Alec, và mong muốn tiếp tục hợp tác với ông trong quá trình ông khám phá nghiên cứu độc lập." Trước đó, Jeff Clune, cựu trưởng nhóm nghiên cứu tại OpenAI (đã rời khỏi OpenAI vào năm 2022, hiện là phó giáo sư tại Đại học British Columbia và cố vấn cho DeepMind), đã đánh giá rất cao Alec, cho rằng ông là một trong những nhà khoa học AI có ảnh hưởng lớn nhưng lại ít được biết đến. Thậm chí, Jeff còn cho rằng Alec nên được ghi vào lịch sử như "cha đẻ của trí tuệ nhân tạo sinh ra hiện đại". Cử nhân kiên định với mô hình lớn, tác giả chính của hai thế hệ GPT đầu tiên Năm 2016, Alec Radford tốt nghiệp cử nhân tại Học viện Kỹ thuật Franklin W. Olin, sau đó gia nhập OpenAI và gắn bó với công ty này trong 8 năm. Mặc dù chỉ có bằng cử nhân, nhưng Alec là một tài năng hàng đầu trong lĩnh vực mô hình lớn, với tổng số lượt trích dẫn bài báo của ông đã vượt 190.000. Ba bài báo được trích dẫn nhiều nhất liên quan đến GPT-3, CLIP và GPT-2. Những bài báo này đã đặt nền móng quan trọng cho ChatGPT ngày nay, thực tế Alec gần như tham gia vào tất cả các bước đột phá quan trọng của OpenAI. Ngoài ba bài báo được trích dẫn nhiều nhất, tên Alec cũng xuất hiện trong danh sách tác giả từ thế hệ GPT đầu tiên đến GPT-4, và ông là tác giả chính của hai thế hệ đầu tiên. Alec cũng là tác giả chính của CLIP, một thành quả quan trọng của OpenAI trong lĩnh vực đa phương tiện, thậm chí ảnh hưởng lớn đến cả ngành công nghiệp; đồng thời, ông cũng tham gia vào mô hình vẽ ảnh DALL·E đời đầu của OpenAI. Trong lĩnh vực khác, Alec cũng là tác giả chính của hệ thống nhận dạng giọng nói Whisper do OpenAI phát hành mã nguồn mở. Tuy nhiên, trong danh sách các tác giả của mô hình o1 mới nhất, tên Alec đã không còn xuất hiện, nhưng Ilya, người cùng tham gia tất cả các công trình GPT từ thế hệ đầu tiên, vẫn nằm trong danh sách này. Tuy nhiên, nhìn chung, trong toàn bộ OpenAI, những người khác đã chuyển sang các lĩnh vực khác như robot hoặc trí tuệ nhân tạo trong game, chỉ có Alec kiên định với hướng nghiên cứu mô hình ngôn ngữ lớn. Chính con đường mà Alec kiên định theo đuổi đã thay đổi định hướng phát triển của OpenAI, cũng như cả ngành công nghiệp trí tuệ nhân tạo. Về vấn đề này, Elon Musk từng nửa đùa nửa thật nói rằng: "Khi tuyển dụng, hãy chú ý đến những người 'trông không giống sẽ gia nhập công ty'. OpenAI ban đầu chưa xác định rõ hướng nghiên cứu mô hình lớn, nhưng chúng tôi vẫn tuyển dụng các nhà nghiên cứu AI, và sau khi đạt được bước đột phá, chúng tôi đã thu hút thêm nhiều người tham gia, cuối cùng dẫn đến sự ra đời của ChatGPT." Trước khi gia nhập OpenAI, Alec đã nghiên cứu về mạng nơ-ron tích chập, chuẩn hóa theo batch và GAN, và là tác giả chính của DC-GAN. Hai tác giả khác của DC-GAN là bạn cùng lớp của Alec, Luke Metz và Soumith Chintala, cha đẻ của PyTorch. Thời điểm đó, Alec vẫn đang học đại học nhưng đã tham gia thành lập công ty indico.io (nay là Indico Data), còn Luke cũng gia nhập công ty này. (Sau này, khi mô hình lớn trở nên phổ biến, Indico cũng đã mở rộng sang lĩnh vực mô hình lớn doanh nghiệp, là một trong những công ty tiên phong giới thiệu mô hình tùy chỉnh dựa trên GPT). Năm 2016, cùng năm Alec gia nhập OpenAI, Luke cũng đến Google Brain, nhưng sau đó vào năm 2022 lại gia nhập OpenAI, tham gia một phần công việc phát triển GPT-4, tuy nhiên tháng 10 năm nay ông cũng đã rời khỏi công ty. Tất cả các tác giả của hai thế hệ GPT đầu tiên đều rời khỏi OpenAI Sau khi Alec rời khỏi OpenAI, điều này cũng đánh dấu sự ra đi của tất cả các tác giả của hai thế hệ GPT đầu tiên. Trong số này, người nổi tiếng nhất là Ilya Sutskever, giám đốc khoa học trưởng của OpenAI, ông cũng tham gia vào các công trình GPT, cùng với Alec. Ilya tuyên bố rời khỏi OpenAI vào tháng 5 năm nay, gây chấn động trong giới trí tuệ nhân tạo, sau đó ông thành lập một công ty mới, tập trung vào việc xây dựng "trí tuệ siêu việt an toàn". Hai tác giả khác của GPT thế hệ đầu tiên là Karthik Narasimhan và Tim Salimans. Trong đó, Karthik Narasimhan đến OpenAI với tư cách là nhà nghiên cứu khách mời, sau khi kết thúc thời gian nghiên cứu vào năm 2018, ông đến Đại học Princeton làm giảng viên, hiện là Phó Giám đốc Liên ngành Xử lý Ngôn ngữ Tự nhiên tại Princeton, cùng với Chen Danqi. Karthik cũng là một trong những tác giả của Devin, phiên bản mã nguồn mở - ông là người hướng dẫn của Yao Shunyu, một học giả xuất sắc từ Trường Ưu tú Yao tại Đại học Tsinghua, trong thời gian Yao Shunyu theo học tiến sĩ tại Princeton (tháng 8 năm nay, Yao Shunyu gia nhập OpenAI). Tác giả thứ ba Tim Salimans thì vào tháng 7 năm 2018 đến Google Brain với vai trò Nhà khoa học Quản lý Cấp cao. Cùng với việc gia nhập Google, những tác giả khác của GPT-2 như Rewon Child và David Luan cũng đã chọn con đường này. Rewon sau đó tham gia vào công việc GPT-3, rời OpenAI vào năm 2021 để gia nhập Google, và vào năm 2022 ông chuyển sang công ty khởi nghiệp Inflection AI, nhưng tháng 3 năm nay lại gia nhập Microsoft. David thì đến Google vào năm 2020, sau đó cùng với các tác giả của bài báo Transformer như Ashish Vaswani, Niki Parmar, thành lập một công ty khởi nghiệp có tên Adept, David giữ chức CEO. Tuy nhiên, theo thông tin trên trang LinkedIn, tháng này David đã không còn giữ vị trí tại Adept mà gia nhập Amazon, cùng làm việc với chuyên gia học tăng cường Pieter Abbeel, học trò tiến sĩ đầu tiên của Andrew Ng. Ngoài những người chuyển sang Google, trong số các tác giả của GPT-2 cũng có Dario Amodei, người sáng lập Anthropic - công ty đứng sau trợ lý AI Claude. Dario tham gia vào các công trình GPT-2 và GPT-3 tại OpenAI, rời khỏi công ty vào cuối năm 2020 cùng với em gái Daniela để thành lập Anthropic, hai người lần lượt giữ vai trò Giám đốc Điều hành và Chủ tịch.

Những người đến với Anthropic, ngoài người sáng lập Dario, còn có Jeffrey Wu, tác giả thứ hai của GPT-2, rời khỏi vào tháng 7 năm nay, trở thành người tham gia GPT thế hệ đầu và thứ hai rời khỏi OpenAI gần đây nhất.

Và hôm nay, với tin về việc Alec rời đi, 8 nhà nghiên cứu tạo ra GPT thế hệ đầu và thứ hai đã phải mỗi người một ngả.

Tham khảo liên kết:

[1]https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs

[2]https://scholar.google.com/citations?user=dOad5HoAAAAJ&hl=en

[3]https://x.com/iScienceLuvr/status/1869852854728700166

Bài viết này được chia sẻ từ trang công khai WeChat "Lượng tử", tác giả: Keleisi, được 36Kr ủy quyền đăng tải.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan