그는 최근 27억 위안을 모금했고, 리페이페이도 투자에 참여했다.

이 기사는 기계로 번역되었습니다
원문 표시

오늘날 벤처 캐피털 시장에서 "월드 모델"은 의심할 여지 없이 가장 뜨거운 유행어입니다. 거의 매일 새로운 "월드 모델" 기업들이 융자 완료하고, 기업 가치가 급등하며 인상적인 주주 명단을 자랑하는 것을 볼 수 있습니다. 그리고 이러한 융자 발표에서 반복적으로 강조되는 한 가지 사실은, 자격을 갖춘 초지능 에이전트는 단순히 데이터 입력만으로 능력을 습득해서는 안 되며, 인간처럼 물리적 세계를 능동적으로 이해해야 한다는 것입니다.

하지만 피트 플로렌스는 회사를 설립한 후 "우리 회사를 세계적인 모델이라고 부르지 마십시오"라는 말로 시작하는 장문의 공개 서한을 썼습니다.

이는 그야말로 역할의 역전입니다. 피트 플로렌스는 단순한 "기업가" 이상의 인물이기 때문입니다. 사업을 시작하기 전, 그는 구글 딥마인드 팀에서 연구원부터 선임 연구원까지 승진을 거듭했습니다. 그는 딥마인드가 2025년에 발표한 로봇 제어 모델인 제미니 로보틱스의 핵심 개발자 중 한 명이었습니다. 하지만 이 시기에 그의 가장 영향력 있는 업적은 2023년에 동료들과 함께 완전히 새로운 로봇 모델 아키텍처 인 "비전-언어-행동 모델(Vision-Language-Action Models)"을 세상에 소개한 것이었습니다.

범용 AI

(피터 플로렌스, 출처: 소셜 미디어)

네, 맞습니다. 만약 "세계 모델"이나 "VLA"가 현재 가장 최첨단이고 널리 받아들여지는 방향이라면, 피터 플로렌스는 의심할 여지 없이 이 길의 선구자입니다. 그와 같은 인물이 "세계 모델"이라는 명칭을 버리는 데 앞장서고 있다는 사실은 정말 놀랍습니다.

이제 그 영향력은 두 배로 커졌습니다. 최근 피터 플로렌스가 설립한 인공지능 기업 제너럴리스트 AI(Generalist AI)가 새로운 융자 라운드를 성공적으로 마무리하며 총 4억 달러(약 27억 위안)를 확보했고, 기업 가치는 20억 달러(약 135억 5천만 위안)로 평가받았습니다. 이번 투자에는 엔비디아의 NVentures, 유명 엔젤 투자자인 냇 프리드먼과 다니엘 그로스가 운영하는 NFDG, 베조스 패밀리 오피스인 베조스 익스페디션, 샤오미 공동 창업자 린빈, 줌 창업자 에릭 위안, 그리고 세계적인 인공지능 모델링 과학자 리페이페이 등이 참여했습니다.

'목표'가 '칭호'보다 더 중요합니다.

세계 모델의 주요 창시자 중 한 명인 피터 플로렌스는 왜 자신을 "세계 모델"이라고 부르는 것을 그토록 거부했을까요? 세계 모델 분야에서 가장 대표적인 학자 중 한 명인 리페이페이는 왜 그토록 공개적으로 "이단"적인 주장을 펼치는 인물을 실질적인 자금으로 지원했을까요? 이 이야기는 2019년부터 시작될지도 모릅니다.

당시 피트 플로렌스는 MIT에서 컴퓨터 과학 박사 과정을 밟고 있었으며, 로봇 조작, 컴퓨터 비전, 자연어 처리 등의 분야에 집중하고 있었습니다. 이러한 관점에서 볼 때, 피트 플로렌스는 전통적인 연구 방향과 학문적 배경을 가진 "잘 훈련된" 인물이었고, 자원을 얻기 위해 "비전통적인" 방식에 의존할 필요가 없는 사람이었습니다. 그러나 문제는 MIT가 그에게 러셀 테드레이크라는 멘토를 배정했다는 점입니다.

라르스 테드렉은 누구일까요? 무엇보다도 그는 학계의 거물임에 틀림없습니다. 2019년에는 MIT 전기공학 및 컴퓨터과학과 교수로 재직했으며, CSAIL(컴퓨터과학 및 인공지능 연구소) 로봇센터 소장을 역임했습니다. 그는 매년 권위 있는 DARPA 로봇 챌린지에서 MIT 팀을 이끌고 있습니다. 학계 외적으로는 도요타 연구소 로봇연구센터 부사장으로도 활동하고 있습니다. 라르스 테드렉은 로봇공학 분야에서 가장 뛰어난 학자 중 한 명으로, 젊은 피트 플로렌스가 학문적 꿈을 실현할 수 있도록 아낌없이 지원할 수 있는 풍부한 자원을 보유하고 있다고 해도 과언이 아닙니다.

하지만 라스 테드렉 본인의 생각으로는 그를 매료시킨 것은 프로그래밍 코드가 아니라 "물리학"이었다. 자기소개에서 라스 테드렉은 자신의 컴퓨터 과학 분야 학문적 여정이 "이족 보행 로봇" 연구에서 시작되었다고 회상하며, 그 연구에서 "풍부한 동적 특성"을 관찰했고, 이것이 "복잡한 유체 역학 제어"에 대한 강한 관심을 불러일으켰다고 밝혔다. 따라서 다른 연구자들이 처음 이 분야에 발을 들였을 때 로봇이 사과를 집거나 담요를 접는 방법을 연구했던 것과는 달리, 그의 초기 연구는 "실속 후 항공기 또는 플랩익 항공기를 제어하는 ​​방법"과 "고속으로 밀집된 장애물을 통과하는 방법"에 집중되었다.

이러한 배경 때문에 라스 테드렉은 "물리 세계를 이해하는 것"에 큰 비중을 둡니다. MIT 웹사이트는 라스 테드렉의 학문적 특징을 다음과 같이 설명합니다. "테드렉 교수의 연구는 흥미로운 (구동력이 부족하거나, 확률적이거나, 모델링하기 어려운) 동적 시스템에 대한 효율적인 제어 솔루션을 찾고, 이러한 시스템을 구축하여 실험적으로 검증하는 데 중점을 두고 있습니다. 특히 복잡한 기계 시스템을 위한 견고한 제어 설계를 달성하기 위해 역학(특히 비평활 역학)과 머신러닝(ML)/최적화 이론 간의 연관성에 관심을 가지고 있습니다."

컴퓨터 과학에 둘러싸여 성장한 피터 플로렌스는 자연스럽게 이 분야에서 "물리공학 지향적"인 인물이 되었습니다. 예를 들어, 그의 박사 학위 연구 중 가장 대표적인 학문적 성과는 "시각적 동작 정책 학습에서의 자기 지도 대응(Self-Supervised Correspondence in Visual Motion Policy Learning)"이라는 논문입니다. 이 논문은 모방 학습을 통해 로봇이 단 50번의 시뮬레이션만으로 까다로운 조작 작업을 완료할 수 있도록 하고, 다양한 범주의 물체에 일반화하고 변형 가능한 물체의 형태에 적응할 수 있도록 하는 방법을 제안했습니다. 이 논문은 2020년 IEEE(전기전자공학회) 로봇 및 자동화 분야 최우수 논문상을 수상했습니다.

물론 그가 어떤 "학파"에 속했는지는 중요하지 않습니다. 중요한 것은 피트 플로렌스가 이러한 환경의 영향을 받아 완전히 새로운 사고방식을 발전시켰다는 점입니다. 대량 연구자들은 기존 기술을 활용하고, 기술의 실현 가능성을 검증하기 위한 실험을 수행한 후, 적용 시나리오를 결정하는 데 익숙합니다. 그러나 피트 플로렌스는 "먼저 구체적인 목표를 설정하고" 나서 기술 개발 경로를 설계해야 한다고 믿었습니다.

피트 플로렌스는 구글 딥마인드 팀에 합류한 후 이 방향으로 연구를 시작했으며, 그의 첫 번째 주요 성과는 2021년에 출시된 구글의 1세대 로봇 모델 아키텍처인 트랜스포터 네트워크(Transporter Network)였습니다. 모델을 발표한 논문에서 플로렌스는 물건을 정리하는 것은 매우 기본적인 기술이지만, 로봇이 이 동작을 수행하려면 "고차원적 및 저차원적 지각 추론"이 필요하다고 밝혔습니다. 즉, 책을 어디에 어떤 순서로 놓아야 하는지, 그리고 책의 가장자리가 가지런히 쌓여 깔끔한 형태를 이루도록 정렬해야 한다는 것입니다.

트랜스포터 네트워크는 "간단한 동작을 단순화"하도록 설계된 모델 아키텍처로, 로봇이 시각 정보를 기반으로 다양한 작업을 일반적인 방식으로 수행할 수 있도록 합니다. 학습 속도가 빠르고 학습 환경에 대한 의존도가 낮습니다.

2023년 딥마인드 팀과의 협업을 통해 공개된 VLA 아키텍처는 이러한 아이디어를 바탕으로 한 자연스러운 발전 과정이었습니다. 현재 모델링의 황금기를 열었던 해당 논문에서 저자들은 VLA 아키텍처가 "새로운 객체에 대한 일반화 능력을 크게 향상시키고, 로봇의 훈련 데이터에 없는 지시(예: 특정 숫자나 아이콘 위에 객체 배치)를 해석하며, 사용자 지시(예: 가장 작거나 큰 객체 집기, 또는 다른 객체에 가장 가까운 객체 집기)에 기반한 기본적인 추론을 수행할 수 있기를 기대한다"고 밝혔습니다.

처음 질문으로 돌아가서, 세계 모델의 주요 창시자 중 한 명인 피터 플로렌스는 왜 자신을 "세계 모델"이라고 부르는 것을 그토록 거부했을까요? 답은 같습니다. 피터 플로렌스는 "이름"보다 "목표"가 더 중요하다고 믿었기 때문입니다.

그의 견해로는 현재 세계 모델에 대한 열광은 사실상 "아이디어 주도적"입니다. 예를 들어, 이러한 열광의 상당 부분은 유망한 분야에서 자본 시장이 비합의적 의견을 발견하는 데서 오는 흥분에 기인한다고 볼 수 있습니다. 더욱이, 우리가 진정으로 로봇을 업무와 삶에 도입하여 생산성을 향상시키고자 한다면, "세계 모델"을 구축하는 것은 분명 목표가 아닙니다. 진정한 목표는 로봇이 특정 작업 데이터 없이도 매우 높은 성공률과 속도로 전례 없는 작업을 완료하는 것이어야 합니다.

바로 이러한 이유로 피트 플로렌스는 구글 딥마인드를 떠나 자신의 사업을 시작하기로 결정했습니다. 2025년 NVIDIA GTC 컨퍼런스에서 피트 플로렌스는 제너럴리스트 AI의 공동 창립자 겸 CEO로서 처음으로 대중 앞에 모습을 드러냈습니다. 그는 "우리는 무엇이든 할 수 있는 로봇을 만들기로 결심했습니다... 수작업의 한계 비용이 0으로 떨어진다면 어떤 세상이 될지 상상해 보세요."라고 말했습니다.

성공률 99%

피트 플로렌스는 독창적인 기술적 아이디어 외에도 창업 과정 자체가 상당히 이례적인 것으로 보인다.

이론적으로, 이러한 이력을 가진 기업가라면 오늘날 벤처캐피탈(VC)로부터 높은 인기를 누릴 것이 분명합니다. 양리쿤, 일리야 수츠케비치, 밀라 물라티가 그 예입니다. 이들은 모두 회사 설립 직후(혹은 그 이전에도) 10억 달러가 넘는 시드 투자를 유치했습니다. 그러나 피트 플로렌스의 제너럴리스트 AI는 초기 단계에서 엔비디아, 제프 베조스 사무실, NFDG 등 소수의 기관으로부터만 투자를 받았습니다. 엔비디아의 벤처캐피탈 부문인 NVentures가 2025 GTC 컨퍼런스에서 "투자 기업 라운드테이블"을 개최하지 않았다면, 그가 이미 엔비디아를 떠나 사업을 시작했다는 사실조차 아무도 몰랐을 것입니다.

왜 그럴까요? 가장 유력한 이유는 피트 플로렌스가 의도적으로 선택한 결과라는 것입니다. 앞서 언급했듯이, 피트 플로렌스는 졸업 직후 구글 딥마인드 팀에 합류하여 2019년부터 2025년까지 다른 직장 경력 없이 그곳에서만 근무했습니다. 다시 말해, 제너럴리스트 AI는 그의 첫 창업 경험이며, 따라서 극도로 신중을 기할 수밖에 없었을 것입니다.

실제로, 피트 플로렌스는 2025년 엔비디아의 GTC 컨퍼런스에서 기업가로서 첫 공식 석상에 모습을 드러냈을 때, 그의 "신중함"을 분명히 보여주었습니다. 그는 "로봇"을 개발하고 있다고만 밝혔을 뿐, 구체적인 업무 방향에 대해서는 언급하지 않고 "아직 비밀리에 진행하고 있습니다"라고 직접적으로 말했습니다.

제너럴리스트 AI의 업무 내용이 구체적으로 드러난 것은 2025년 11월이 되어서였습니다. 2025년 11월, 제너럴리스트 AI는 1세대 인공지능 모델인 GEN-0을 공개했습니다. 공식 발표에서 제너럴리스트 AI는 GEN-0이 시각 모델과 언어 모델의 장점을 결합하는 동시에 이를 뛰어넘는다고 밝혔습니다 . GEN-0은 인간 수준의 반사 신경과 물리적 상식을 구현할 수 있다는 것입니다.

요컨대, GEN-0은 모델 크기와 훈련 데이터가 증가함에 따라 지속적으로 성능을 향상시켜 기존 소형 모델의 한계를 뛰어넘을 수 있습니다. 인간처럼 생각하고 행동하는 것을 동시에 수행하여 실제 물리적 환경에서 빠르고 자연스러운 반응을 보일 수 있으며, 추가적인 수정 없이 다양한 유형의 로봇에 자연스럽게 적응할 수 있습니다. 더욱 중요한 것은, 방대한 양의 실제 운영 데이터를 기반으로 하므로 데이터 부족의 제약을 받지 않고 훈련 데이터 구성을 유연하게 조정할 수 있다는 점입니다. 대량 기술 매체에서 GEN-0은 ChatGPT와 같은 대규모 언어 모델을 구동하는 수학적 "확장 법칙"이 물리적 움직임에도 적용될 수 있음을 입증했다고 지적했습니다.

하지만 GEN-0은 완벽하지 않습니다. 예를 들어, GEN-0은 체화된 지능 분야를 괴롭히는 데이터셋 문제를 해결하지 못했습니다. 따라서 제너럴리스트 AI는 2026년 4월, 새로운 버전인 GEN-1으로 빠르게 업그레이드했습니다.

범용 AI

("로봇 팔", 출처: Generalist AI 소셜 미디어)

데이터셋 문제를 해결하기 위해 제너럴리스트 AI는 수동 작업을 수행하는 사람의 미세한 움직임과 시각 정보를 포착하는 웨어러블 장치를 개발했습니다. 제너럴리스트 AI는 GEN-1 개발 과정에서 이러한 로봇 팔을 사용하여 50만 시간 이상의 "페타플롭급 물리적 상호작용 데이터"를 수집하고 이를 바탕으로 물리 모델을 학습시켰다고 밝혔습니다. 철저한 학습을 ​​거친 GEN-1은 골판지 상자 접기, 휴대폰 포장, 로봇 청소기 관리와 같은 반복적이지만 섬세한 기계적 작업에서 99%의 성공률을 달성하며, 이전 모델인 GEN-0보다 약 3배 빠른 속도로 약 1시간 만에 작업을 완료할 수 있다고 제너럴리스트 AI는 주장합니다.

따라서 제너럴리스트 AI는 GEN-1의 물리적 모델이 GPT-3와 유사한 변곡점에 접근하고 있으며, 일부 작업의 성능이 "상업적으로 실행 가능한 환경에 배포하는 데 필요한 수준에 도달하기 시작했다"고 자랑스럽게 발표합니다. 또한 "새로운 세대의 모델이 출시될 때마다 점점 더 복잡해지는 새로운 작업들을 처리할 수 있을 것으로 기대합니다."

피터 플로렌스는 자신의 공식 블로그 게시물에서 GEN-1의 개발 과정이 자신의 개인적인 기술 철학을 가장 잘 보여주는 사례라고 설명했습니다. 그는 먼저 합리적인 목표를 설정했습니다. 바로 로봇이 작업별 데이터 없이도 이전에는 볼 수 없었던 다양한 작업을 매우 높은 성공률과 속도로 완료하는 것이었습니다. 다음으로, 이 목표를 바탕으로 특정 작업에 필요한 소량의 로봇 데이터(X)만을 사용하여 해당 작업에서 높은 수준의 실행 능력을 달성하고, 동시에 X의 양을 지속적으로 줄여나가는 해결 방안을 마련했습니다.

이 시점에서 앞서 제기했던 질문에 대한 답이 나왔습니다. 제너럴리스트 AI의 제품이 실제로 "월드 모델"이라고 불리는지는 더 이상 중요하지 않습니다. 인공지능 산업의 잠재력을 보고 로봇이 실제 생산 현장에 널리 도입될 수 있다고 믿는다면, 제너럴리스트 AI는 분명 투자할 가치가 있습니다. 그리고 제너럴리스트 AI의 이번 융자 는 GEN-1 출시 후 두 달 만에 신속하게 마무리되었습니다.

보도에 따르면 기존 주주인 엔비디아, 베조스 익스페디션, NDFG는 모두 재투자를 결정했으며, 투자액을 두 배로 늘리기도 했습니다. 또한 샤오미 공동 창업자 린빈, 줌 창업자 에릭 위안, 중국 과학자 리페이페이를 비롯해 래디컬 벤처스, 8VC, 유니온 스퀘어 벤처스, 하나비 캐피털, 노웨스트 등의 기관 투자자들이 신규 투자자로 참여했습니다.

다시 말해, 2026년 6월이 되면 피트 플로렌스는 더 이상 자신의 능력을 증명할 필요가 없습니다. 적어도 그가 수년간 해왔던 자랑들, 예를 들어 2025년에 사업을 시작했을 당시 팟캐스트에서 "범용 로봇은 모든 것을 조금씩 하는 것이 아니라, 실제 업무에서 유용하게 쓰일 만큼 전문적인 수준을 갖춰야 한다"라고 했던 말들은 이미 "약속을 이행하는 길"에 들어서고 있습니다.

이 글은 위챗 공식 계정 "Touzhong.com"에서 가져온 것으로, 작성자는 푸판입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트