갑자기 GPT 논문의 첫 번째 저자인 알렉 래드포드(Alec Radford)가 사임했고, 이전 2세대 GPT 저자들은 모두 OpenAI를 떠났습니다.

avatar
36氪
12-20
이 기사는 기계로 번역되었습니다
원문 표시
다음과 같이 번역합니다:

OpenAI에서 또 다른 대가가 떠났습니다!

The Information에 따르면, 초대 GPT 논문의 제1저자인 Alec Radford도 OpenAI를 떠나 독립 연구를 하게 되었습니다.

Alec는 2016년에 OpenAI에 합류했으며, 초대 GPT부터 GPT-4o 논문까지 모두 그의 이름이 있었고, 전두 세대에서는 제1저자였습니다.

또한 OpenAI의 멀티모달 모델 CLIP과 음성 인식 모델 Whisper의 논문 제1저자도 Alec였습니다.

Alec의 퇴사에 대해 OpenAI 연구 책임자 Mark Chen은 "우리는 Alec와 그의 공헌에 깊은 존경과 감사를 표하며, 그가 독립 연구를 탐구하는 과정에서 계속 협력하기를 기대한다"고 말했습니다.

이전에 전임 연구팀 책임자 Jeff Clune(2022년 OpenAI를 떠나 브리티시컬럼비아대학 부교수이자 DeepMind 자문위원)도 Alec에 대해 매우 높은 평가를 내린 바 있으며, Alec는 영향력은 가장 크지만 명성은 가장 낮은 AI 과학자 중 한 명이라고 생각했습니다.

심지어 Jeff의 견해로는 Alec는 "현대 생성 인공지능의 아버지"로 역사에 기록되어야 한다고 했습니다.

대규모 모델 연구에 매진한 학부생, 전두 세대 GPT 제1저자

2016년, Alec Radford는 Franklin W. Olin 공과대학에서 학사 학위를 취득하고 OpenAI에 합류했으며, 8년간 근무했습니다.

Alec는 학부 학력에 불과하지만 대규모 모델 분야의 진정한 선도자입니다. 현재까지 논문 인용 횟수가 19만 회를 넘었습니다.

인용 횟수 상위 3편의 논문은 각각 GPT-3, CLIP, GPT-2와 관련되어 있습니다.

이 세 편의 논문은 오늘날 ChatGPT의 중요한 기반을 마련했으며, 실제로 Alec는 OpenAI의 모든 주요 혁신에 참여했습니다.

가장 많이 인용된 이 세 편 외에도, 초대 GPT부터 GPT-4o까지 저자 명단에 Alec의 이름이 빠짐없이 등장하며, 전두 세대에서는 제1저자였습니다.

Alec는 또한 CLIP의 제1저자로, OpenAI의 중요한 멀티모달 성과이자 업계 전반에 큰 영향을 미쳤습니다. 그는 또한 OpenAI의 초기 그래픽 모델 DALL·E에도 참여했습니다.

다른 모달리티 측면에서는 OpenAI가 공개한 음성 인식 시스템 Whisper의 제1저자도 Alec입니다.

그러나 최신 o1 모델 기여자 목록에는 Alec의 이름이 없지만, 그와 함께 초대부터 모든 GPT 작업에 참여했던 Ilya는 여전히 o1 명단에 있습니다.

그러나 어떻든 OpenAI 전체를 보면 다른 사람들은 로봇이나 게임 AI 등 다른 분야로 "논문을 쓰러" 갔지만, Alec만이 대규모 모델 연구에 매진했습니다.

바로 그의 고집스러운 대규모 언어 모델 노선이 OpenAI 회사와 AI 업계 전반의 발전 방향을 바꿨습니다.

이에 대해 Anthropic의 창립자 Dario Amodei는 다음과 같이 반반 농담 반 진담으로 말했습니다:

채용 시 "회사에 합류하지 않을 것 같은 사람"에 주목하세요.

OpenAI는 처음에 대규모 모델 연구 방향을 확정하지 않았지만, 우리는 AI 연구원을 채용했고 돌파구를 찾은 후 더 많은 사람들이 참여하면서 ChatGPT를 만들어냈습니다.

OpenAI에 합류하기 전, Alec는 합성곱 신경망, 배치 정규화, GAN 등을 연구했으며, DC-GAN의 제1저자였습니다.

DC-GAN의 다른 두 저자는 Alec의 동료 Luke Metz와 PyTorch의 아버지 Soumith Chintala입니다.

당시 학생이었던 Alec는 이미 indico.io(현 Indico Data)를 공동 설립했고, Luke도 그 회사에 합류했습니다.

(이후 대규모 모델이 부상하면서 Indico도 기업용 대규모 모델 사업을 늘렸고, GPT 기반 맞춤형 모델을 최초로 출시했습니다.)

2016년, 즉 Alec가 OpenAI에 합류한 동년에 Luke는 구글 브레인으로 갔지만, 2022년에 다시 OpenAI에 합류해 GPT-4 개발 일부에 참여했다가 올해 10월에 다시 퇴사했습니다.

전두 세대 GPT 논문 저자 모두 OpenAI를 떠났다

Alec의 퇴사로 전두 세대 GPT 논문의 모든 저자가 OpenAI를 떠났음을 의미합니다.

그중 가장 유명한 인물은 전 최고 과학 책임자 Ilya Sutskever로, Alec와 마찬가지로 전두 세대 GPT 작업에 참여했습니다.

Ilya는 올해 5월 OpenAI를 떠나겠다고 발표했을 때 AI 업계를 강타했고, 이후 그는 새로운 회사를 설립해 "안전한 초지능" 구축에 주력하고 있습니다.

초대 GPT의 다른 두 저자는 Karthik Narasimhan과 Tim Salimans입니다.

Karthik Narasimhan은 OpenAI에 방문 학자로 왔다가 2018년 방문 기간 종료 후 프린스턴 대학에 교수로 임용되었고, 현재 프린스턴 NLP 공동 책임자로 있으며 Chen Danqi와 동료입니다.

또한 Karthik은 오픈소스 버전 Devin의 저자 중 한 명으로, 청화대 요순우 박사과정생의 지도교수입니다(올해 8월 요순우가 OpenAI에 합류했습니다).

세 번째 저자 Tim Salimans는 2018년 7월에 구글 브레인으로 옮겨 선임 관리 과학자로 근무하고 있습니다.

구글에 합류한 다른 인물로는 GPT-2의 세 번째 저자 Rewon Child와 네 번째 저자 David Luan이 있습니다.

Rewon은 이후 GPT-3 작업에도 참여했고, 2021년 OpenAI를 떠나 구글에 갔다가 2022년 Inflection AI라는 스타트업에 합류했고, 올해 3월에는 마이크로소프트로 옮겼습니다.

David는 2020년에 구글에 합류했고, 이후 Transformer 논문 저자 Ashish Vaswani, Niki Parmar과 함께 Adept라는 회사를 설립했는데, 이번 달 그의 LinkedIn 프로필에 따르면 Adept에서 더 이상 근무하지 않고 Amazon에 합류했습니다.

구글로 간 사람들 외에도 GPT-2 저자 중에는 후에 OpenAI의 최강 경쟁자인 Claude의 배후 기업 Anthropic의 공동 창립자 Dario Amodei가 포함되어 있습니다.

Dario는 OpenAI에서 GPT-2와 3 작업에 참여했다가 2020년 말 여동생 Daniela와 함께 Anthropic을 설립했고, 각각 CEO와 대표로 취임했습니다.

而今天,随着Alec的离职消息,打造最早两代GPT的八位研究者,已经要全部各奔东西了。

参考链接:

[1]https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs

[2]https://scholar.google.com/citations?user=dOad5HoAAAAJ&hl=en

[3]https://x.com/iScienceLuvr/status/1869852854728700166

本文来自微信公众号"量子位",作者:克雷西,36氪经授权发布。

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트