OpenAI의 최고 추론 전문가가 회사를 떠났습니다. 그는 7년 동안 o3/o1/GPT-4/Codex 개발에 참여해 왔습니다.

01-06

이 기사는 기계로 번역되었습니다

원문 표시

새해 초, 오픈AI는 또 다른 인사 변동을 겪고 있습니다. 최고의 추론 모델 전문가가 회사를 떠난 것입니다!

o3, o1, GPT-4, ChatGPT 및 OpenAI의 첫 번째 AI 프로그래밍 모델인 Codex 개발에 핵심적인 역할을 했으며 OpenAI의 연구 부사장을 맡고 있는 제리 트워렉이 어려운 결정을 발표했습니다 .

OpenAI를 떠나 OpenAI에서 수행하기 어려운 연구 분야를 탐색해 보세요.

그가 언급한 "OpenAI에서 수행하기 어려운 연구"에는 구체적으로 어떤 측면들이 포함되는지 궁금합니다.

그는 오픈AI에서 일한 거의 7년 동안 멋지고도 황당한 순간들을 많이 경험했지만, 멋진 순간들이 더 많았다고 말했다.

(심지어 OpenAI의 고위 관계자들조차 7년 차 권태기를 겪고 있는 건가?)

이 트윗에서 많은 OpenAI 직원들이 제리와 함께 일했던 즐거운 경험을 공유했습니다.

저 또한 그의 밝은 미래를 기원합니다.

네티즌과 구경꾼들의 댓글에서 가장 많이 언급된 단어는 "감사합니다"와 "감탄"이었다 .

오픈AI에서 핵심 인재가 빠져나간 것에 대해 여전히 아쉬워하는 친구들이 있습니다.

하지만 이 친구의 댓글란은 훨씬 더 재밌어요.

많은 사람들이 간헐적인 인터뷰와 연설을 통해 제리를 알게 되었지만, 그에 대한 이해는 포괄적이지 못할 것입니다.

이제 추론 모델의 대가인 그를 제대로 알아보고, 작별 인사를 나누며 그의 새로운 여정을 응원해 봅시다 .

오픈아이얼 추론 모델을 개발한 최초의 인물

제리 트워렉은 폴란드에서 태어나고 자랐습니다. 그는 바르샤바 대학교에서 수학 석사 학위를 받았으며, 탄탄한 이론 및 수학적 배경을 가지고 있습니다.

그는 학교 졸업 후 바로 인공지능 분야에 뛰어들지 않았다 .

그는 학교를 졸업한 후 처음 5년 동안 암스테르담에서 양적 연구를 수행했으며, 주로 선물 시장의 양적 거래 전략을 연구했습니다.

이 기간 동안 제리는 최적화 이론과 잡음이 섞인 데이터 세트에서 신호를 클레임 기술을 사용하여 선물 시장을 위한 정량적 거래 전략을 연구하고 개발했으며, 이는 궁극적으로 그가 강화 학습을 연구하게 된 계기가 되었습니다 .

2019년, 제리는 OpenAI에 연구원으로 합류하여 신경 프로그램 합성 및 강화 학습을 전문으로 연구하고 있습니다.

당시 GPT-2는 막 출시되었고, OpenAI는 규모가 작고 잘 알려지지 않은 비영리 연구소에 불과했습니다.

그는 경력 초기에 "로봇 손으로 루빅 큐브 풀기"라는 로봇 공학 프로젝트에 참여했으며 , 2019년 NeurIPS 심층 강화 학습 워크숍에서 해당 프로젝트를 발표했습니다.

제리는 또한 "대규모 사전 학습 + 해시레이트 확장" 접근 방식에 참여한 초기 연구자 중 한 명이었으며 , ChatGPT 이전 시기부터 모델 추론에 큰 관심을 보였습니다.

2020년 GPT-3 출시 이후, 그는 GPT-3를 평가하고 훈련시켜 추론 및 논리 문제를 해결하는 방법을 연구하기 시작했습니다.

지금까지 제리는 여러 공개 연설과 인터뷰에서 단순히 "패턴 매칭 생성"이 아닌 "추론"의 중요성을 거듭 강조해 왔으며, 대규모 모델을 단순한 블랙박스 텍스트 예측기가 아닌 "사고 과정을 학습하도록 훈련시킬 수 있는 시스템"으로 보는 경향이 있습니다.

2019년부터 2022년까지 그는 OpenAI에서 Codex 및 Copilot과 같은 대규모 코드 모델을 활용하여 신경 프로그램 합성 및 대규모 모델 추론에 대한 연구를 수행했으며, 강화 학습을 사용하여 복잡한 작업에 대한 추론 및 의사 결정 능력을 향상시켰습니다.

제리는 2022년부터 OpenAI의 연구 책임자로 재직하며 플러그인 및 코드 인터프리터를 포함한 "대규모 언어 모델이 STEM 분야의 어려운 문제를 해결하는 데 필요한 도구를 활용할 수 있도록 하는 방법"을 연구하는 팀을 이끌고 있습니다.

ChatGPT가 등장한 후, 그는 ChatGPT와 GPT 시리즈 모델의 주요 기여자 중 한 명으로 점차 더 많은 사람들에게 알려지게 되었습니다.

제리는 GPT-4의 책임 연구원이자 최초의 추론 모델인 o1의 연구 개발을 주도했습니다. 그는 GPT-5의 추론 메커니즘과 장기 사고 능력 개발을 담당한 핵심 인물로 소개되었습니다.

그들은 다양한 인터뷰와 팟캐스트를 통해 GPT-5의 사고 방식과 추론 모델의 진화를 체계적으로 설명했습니다.

2025년, 제리는 OpenAI의 연구 부사장으로 승진했습니다.

제리는 2026년 1월 6일, 향후 계획에 대한 언급 없이 오픈AI를 떠난다고 발표했습니다.

아래는 제리의 사직서 원문 번역입니다.

제리는 사직서에 뭐라고 썼나요?

안녕하세요 여러분, 어려운 결정을 내렸습니다. 오픈AI를 떠나기로 했습니다.

저는 이곳에서 거의 7년 동안 일하면서 멋지고 정신없는 순간들을 많이 경험했지만, 대부분은 멋진 시간들이었습니다.

저는 이곳에서 일하는 동안 정말 즐거웠습니다. 로봇 공학 분야의 강화 학습 초기 개발에 참여했고, 세계 최초의 프로그래밍 모델을 훈련시켜 대규모 언어 모델 프로그래밍 혁명을 이끌었습니다.

딥마인드가 친칠라 모델을 출시하기 전에 저는 나중에 "친칠라 확장 법칙"으로 알려지게 된 현상을 발견했습니다.

저는 GPT-4와 ChatGPT 개발에 참여했으며, 최근에는 학습 및 추론 연산 확장을 위한 새로운 패러다임을 구축하는 팀을 구성했습니다. 이는 현재 일반적으로 추론 모델이라고 불립니다.

나는 많은 친구를 사귀었고, 사무실에서 밤을 새웠으며, 수많은 기술적 혁신에 참여하고 목격했으며, 가까운 동료라고 생각하는 많은 사람들과 웃음과 고민을 나누었습니다.

저는 운 좋게도 세계 최고라고 자부하는 머신러닝(ML) 팀을 구축하고 성장시킬 수 있었습니다.

정말 즐거운 경험이었습니다. OpenAL에서 진행하기 어려운 연구 분야를 탐구하기 위해 떠나지만, OpenAL은 인류 역사의 긴 흐름 속에 영원히 자리매김한 특별한 회사이자 특별한 존재입니다.

저는 지난 몇 년간 OpenAI와 여러분께서 저에게 보여주신 신뢰에 진심으로 감사드립니다. 이러한 순간들은 언제나 조금 어색하게 느껴지지만, 긍정적인 관점에서 보면 위대한 일을 위한 촉매제가 될 수 있습니다.

우리는 함께 머신 인텔리전스를 더욱 유용하고 신뢰할 수 있게 만들어 갑니다. 저는 ChatGPT 추론 모델의 열렬한 사용자입니다.

다시 한번 감사드립니다. 천 번이고 만 번이고 감사드립니다.

사랑하는 딸기들아, 몸조심하렴.

실내 변기

한 가지 더

원래 이 글은 제리의 짧은 에세이를 포함한 후 끝났어야 했습니다.

그런데 처음엔 우스꽝스러워 보였지만 자세히 보니 일리가 있는 댓글을 하나 발견했습니다.

곰곰이 생각해 보면, 오픈아이언을 떠나는 많은 사람들이 퇴사할 때 짧은 에세이를 남기는 것이 사실입니다. 이것은 일종의 불문율일까요? 아니면 회사 문화의 일부일까요?

호기심.jpg

참고 링크:

[1]https://x.com/MillionInt/status/2008237251751534622?s=20

[2]https://www.linkedin.com/in/jerry-tworek-b5b9aa56/

[3]https://warsaw.ai/speaker/jerry-tworek/

이 글은 위챗 공식 계정 "퀀텀 비트" 에서 가져온 것으로, 저자는 최첨단 기술에 중점을 두고 있으며, 36Kr의 허가를 받아 게시되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트