AI의 대모는 모든 사람이 세계 건설자가 되기를 원한다

avatar
WIRED
09-13
이 기사는 기계로 번역되었습니다
원문 표시

시장에 집착하는 기술 전문가와 전문적인 회의론자에 따르면, 인공지능 버블은 터졌고 겨울이 돌아왔다고 합니다. 페이페이 리는 이를 믿지 않습니다. 사실, "AI의 대모"라는 별명을 얻은 리는 그 반대로 베팅하고 있습니다. 그녀는 스탠포드 대학에서 파트타임 휴가를 받아 World Labs 라는 회사를 공동 창립했습니다. 현재의 생성 AI 는 언어 기반이지만 , 그녀는 시스템이 우리의 물리적 현실의 물리, 논리 및 풍부한 세부 정보로 완전한 세계를 구성하는 경계를 보고 있습니다. 그것은 야심 찬 목표이며, AI의 진전이 암울한 고원에 도달했다고 말하는 지루한 나밥에도 불구하고 World Labs는 자금 조달을 빠르게 진행하고 있습니다. 이 스타트업은 제품을 출시하기까지 아마 1년 남았고, 출시될 때 얼마나 잘 작동할지는 전혀 불분명하지만, 투자자들은 2억 3천만 달러를 투자했고 신생 스타트업의 가치를 10억 ​​달러로 평가하고 있다고 합니다.

약 10년 전, 리는 신경망이 상당히 더 똑똑해질 수 있도록 하는 디지털 이미지의 맞춤형 데이터베이스인 ImageNet을 만들어 AI가 전환점을 맞이하도록 도왔습니다 . 그녀는 오늘날의 딥 러닝 모델이 AI가 현실적인 시뮬레이션이든 완전히 상상의 우주이든 실제 세계를 창조하려면 비슷한 추진력이 필요하다고 생각합니다. 미래의 조지 RR 마틴은 산문 대신 프롬프트로 꿈꾸던 세계를 구성하여 렌더링하고 돌아다닐 수 있습니다. 리는 "컴퓨터의 물리적 세계는 카메라를 통해 보이고, 카메라 뒤에 있는 컴퓨터 두뇌는"이라고 말합니다. "이 비전을 추론, 생성 및 궁극적인 상호 작용으로 전환하려면 물리적 세계의 물리적 구조, 물리적 역학을 이해해야 합니다. 그리고 그 기술을 공간 지능이라고 합니다." World Labs는 자신을 공간 지능 회사라고 부르며, 그 용어가 혁명이 될지 아니면 펀치라인이 될지는 그 운명에 따라 결정될 것입니다.

리는 수년 동안 공간 지능에 집착해 왔습니다. 모두가 ChatGPT에 열광하는 동안 그녀와 전 학생인 저스틴 존슨은 전화 통화에서 AI의 다음 반복에 대해 흥분해서 중얼거렸습니다. 현재 미시간 대학교 조교수인 존슨은 "다음 10년은 컴퓨터 비전, 딥 러닝, AI를 인터넷 세계에서 꺼내 공간과 시간에 내장하는 새로운 콘텐츠를 만드는 것에 관한 것입니다."라고 말합니다.

리는 현재 안데르센 호로위츠(Andreessen Horowitz 의 파트너인 가상 네트워킹의 선구자인 Martin Casado와 저녁 식사를 한 후 2023년 초에 회사를 시작하기로 결정했습니다.그것은 AI에 대한 거의 메시아적인 수용으로 악명 높은 VC 회사입니다.Casado는 AI가 텍스트로 시작하여 2D 그래픽으로 이동한 후 현재 눈부신 3D 이미지를 갖춘 컴퓨터 게임과 비슷한 경로에 있다고 봅니다.공간 지능이 변화를 주도할 것입니다.그는 결국 "좋아하는 책을 가져다가 모델에 넣은 다음 문자 그대로 그 안으로 들어가서 몰입감 있게 실시간으로 재생되는 것을 볼 수 있습니다."라고 말합니다.Casado와 Li는 그것을 실현하기 위한 첫 번째 단계는 대규모 언어 모델에서 대규모 세계 모델로 이동하는 것이라고 동의했습니다.

Li는 Johnson을 공동 창립자로 하여 팀을 구성하기 시작했습니다. Casado는 두 명을 더 제안했는데, 한 명은 Amazon, Meta의 Reality Labs, Epic Games에서 근무했던 Christoph Lassner였습니다. 그는 3D Gaussian Splatting 이라는 유명한 기술로 이어진 렌더링 방식인 Pulsar 의 발명가입니다. MIT 토가 파티에서 인디 밴드가 하는 말처럼 들리지만, 실제로는 일회성 객체가 아닌 장면을 합성하는 방법입니다. Casado의 또 다른 제안은 2D 픽셀 이미지를 3D 그래픽으로 변환하는 NeRF(신경 광도장)라는 강력한 기술을 만든 Ben Mildenhall이었습니다. 그는 "우리는 실제 세계의 객체를 VR로 가져와 완벽하게 실제처럼 보이게 만들었습니다."라고 말합니다. 그는 Google의 수석 연구 과학자로서의 자리를 떠나 Li의 팀에 합류했습니다.

대규모 세계 모델의 분명한 목표 중 하나는 로봇에 세계 감각을 주입하는 것입니다. 이는 실제로 World Labs의 계획에 있지만 잠시 후가 될 것입니다. 첫 번째 단계는 3차원성, 물리성, 공간과 시간의 개념에 대한 깊은 이해를 바탕으로 모델을 구축하는 것입니다. 그 다음에는 모델이 증강 현실을 지원하는 단계가 올 것입니다. 그 후에 회사는 로봇 공학을 맡을 수 있습니다. 이 비전이 실현된다면 대규모 세계 모델은 자율 주행 자동차, 자동화된 공장, 심지어 휴머노이드 로봇을 개선할 것입니다.

그것은 먼 미래이며, 확실한 것은 아닙니다. World Labs는 2025년에 제품을 출시하겠다고 약속했습니다. 제가 창립자들에게 ​​제품이 정확히 무엇이고, 예상 고객이 누구인지, World Labs가 어떻게 수익을 낼 것인지와 같은 것에 대해 압박했을 때, 그들은 단지 시작에 불과하다고 강조했습니다. "넘어야 할 경계가 많고, 알려지지 않은 것도 많습니다."라고 리는 말합니다. "물론, 우리는 이러한 알려지지 않은 것을 파악하는 데 있어 세계 최고의 팀입니다."

Casado는 조금 더 구체적입니다. 그는 ChatGPT나 Anthropic의 Claude와 마찬가지로, 모델은 제품 이 될 수 있다고 말합니다. 다른 사람들이 직접 사용하거나 다른 앱을 호스팅하는 플랫폼입니다. 고객에는 게임 회사나 영화 스튜디오가 포함될 수 있습니다. Pixar가 괴물 털이나 물의 움직임과 같은 것에 무한한 리소스를 사용했던 방법에 대해 글을 쓴 적이 있습니다. 한 문장짜리 프롬프트로 그렇게 한다고 상상해보세요.

World Labs는 일부에서 물리적 AI라고 부르는 문제를 다루는 유일한 회사가 아닙니다.Nvidia CEO Jensen Huang은 올해 초에 "일반 휴머노이드 로봇을 위한 기초 모델을 구축하는 것은 오늘날 AI에서 해결해야 할 가장 흥미로운 문제 중 하나입니다."라고 말했습니다 . 저는 최근에 그 노선을 추구하고 있던 Archetype이라는 회사에 대해 글을 썼습니다 .하지만 Casado는 World Labs의 야망, 재능, 비전이 독특하다고 주장합니다.그는 "저는 거의 10년 동안 투자를 해왔고, 이 팀은 제가 지금까지 본 팀 중 가장 훌륭합니다."라고 말합니다.VC가 자신의 투자를 늘리는 것은 흔한 일이지만, 그는 이 팀에 돈 이상을 투자하고 있습니다.VC가 된 이후 처음으로 그는 파트타임 팀원이 되어 일주일에 하루를 회사에서 보냅니다.

Radical Ventures, NEA, (놀랍게도) Nvidia의 벤처 자본 부문을 포함한 다른 VC 회사도 참여하고 있으며, Marc Benioff, Reid Hoffman, Jeff Dean, Eric Schmidt, Ronin(RON) Conway, Geoff Hinton을 포함한 올스타 엔젤 목록도 참여하고 있습니다. (따라서 AI의 대부가 이 분야의 대모를 지원하는 셈입니다.) 고인이 된 Susan Wojcicki도 지난달에 불시에 세상을 떠나기 전에 투자했습니다.

그 모든 똑똑한 사람들이 틀릴 수 있을까? 물론입니다. World Lab의 약속이 얼마 전 극적으로 화제를 모았던 유행어인 메타버스와 어떻게 겹치는지 보기 위해 눈을 가늘게 뜨지 않아도 됩니다. World Lab 창립자들은 단명한 열풍이 시기상조였으며, 적절한 대화형 콘텐츠가 없는 유망한 하드웨어에 기반한 일시적인 현상이라고 주장합니다. 그들은 큰 세계 모델이 그 문제를 해결할 수 있다고 암시합니다. 아마도 그 세계 중 어느 것도 AI가 고원에 갇힌 것으로 시각화하지 않을 것입니다.

작년에 페이페이 리는 회고록과 AI 러브스토리를 합친 The Worlds I See를 출간했습니다. 당시 저는 그 책을 칭찬했고, "페이페이 리는 알고리즘처럼 보면서 AI 혁명을 시작했다"는 제목의 Plaintext에서 그녀와 이야기를 나누었습니다. 이제 그녀는 아무도 본 적이 없는 세상을 만들고 싶어합니다.

리는 자신에 대해 말하는 것을 불편해하는 사적인 사람입니다. 하지만 그녀는 16살 때 미국으로 온 이민자로서의 경험을 언어에 대한 지식이 전혀 없는 상태에서 통합하는 방법을 용감하게 알아냈고, 이 중요한 기술의 핵심 인물이 되기 위해 장애물을 극복했습니다. 그녀는 현재 직위에 오르기까지 스탠포드 AI 연구소의 소장과 Google Cloud의 AI 및 머신 러닝 수석 과학자를 역임했습니다. 리는 그녀의 책이 이중나선 구조로 구성되어 있으며, 그녀의 개인적 탐구와 AI의 궤적이 나선형으로 얽혀 있다고 말합니다. 리는 "우리는 계속해서 우리가 누구인지에 대한 반영을 통해 우리 자신을 봅니다."라고 말합니다. "반영의 일부는 기술 자체입니다. 보기 가장 어려운 세상은 우리 자신입니다."

이러한 요소들은 ImageNet의 생성과 구현에 대한 그녀의 서사에서 가장 극적으로 결합됩니다. Li는 수백만 개의 이미지에 레이블을 붙이고 분류하는 것이 가능하다고 의심하는 동료들을 포함한 사람들에게 도전하기로 결심한 것을 이야기합니다. 쿠션에서 바이올린에 이르기까지 방대한 범주의 각 이미지에 대해 최소 1,000개의 예가 있습니다. 이러한 노력에는 기술적 인내심뿐만 아니라 문자 그대로 수천 명의 사람들의 땀이 필요했습니다(스포일러: Amazon의 Mechanical Turk가 이 기술을 바꾸는 데 도움이 되었습니다). 이 프로젝트는 그녀의 개인적 여정을 이해할 때에만 이해할 수 있습니다. 이처럼 위험한 프로젝트를 수행하는 데 두려움이 없었던 것은 재정적 어려움에도 불구하고 과학자가 되겠다는 꿈을 좇기 위해 사업계의 수익성 있는 직장을 거절한 부모의 지원에서 비롯되었습니다. 이 달나라 여행을 실행하는 것은 그들의 희생에 대한 궁극적인 검증이 될 것입니다.

톰은 "스마트폰이 처음 나왔을 때 사람들은 스마트폰 사용에 대한 공공 예절에 대해 이야기하곤 했습니다. 지금은 공공장소에 사람들이 가득 차서 휴대전화를 응시하는 것을 흔히 볼 수 있습니다. 알위브(AR) 헤드기어의 예절은 어떨 것 같나요?"라고 묻습니다.

안녕하세요, 톰, 질문 감사합니다. 알위브(AR) 에 대한 에티켓은 휴대폰에서처럼 간단하지 않을 겁니다. 휴대폰에서는 우리의 관심이 손바닥에 집중되어 있을 때 너무나 분명하게 드러납니다. 증강 현실의 정점은 회사에서 가벼운 안경에 어떻게 구현할지 알아낼 때 올 것입니다. 아직 알위브(AR) 구현하지 않았지만 언젠가는 구현할 Meta의 히트작 Ray-Ban 안경과 비슷합니다. 지금 휴대폰에서 보는 것의 대부분은 헤드업 디스플레이에서 읽을 수 있을 것입니다.

그 시점에, 선글라스 뒤에서 저녁 식사 동반자보다 TikTok, 문자 메시지, 캔디 크러시 에 더 많이 관여하고 있다는 것이 그렇게 눈에 띄지 않을 것입니다. 공공장소에서 모든 사람이 실제로 다른 곳에 있는 것처럼 보이지 는 않지만, 실제로는 그럴 것입니다. 저는 촉각이 사람들에게 기차가 출발하거나, 문을 막거나, 강도를 당했을 때 경고하는 데 필수적일 것이라고 예측합니다. 그리고 전형적인 저녁 식사 대화는 다음과 같을 것입니다. "방금 제가 한 말 들었어?" [침묵.] "방금 제가 한 말 들었어? [잠시 멈춤, 안경 옆면을 만짐.] "물론이죠. 잘 듣고 있어요." 이런 일이 레스토랑의 모든 테이블에서 일어날 것입니다!

제 에티켓 예측? 사람들은 서로 옆에 서 있어도 문자로 소통하게 될 겁니다. 그들이 하는 말은 당신의 눈과 이어폰에 전송하면 더 설득력이 있을 테니까요. 그러니 사람들이 휴대전화를 응시한다고 불평하는 건 그만하세요. 더 나쁜 날이 올 테니까요.

질문은 mail@wired.com으로 보내주세요 . 제목란에 ASK LEVY 라고 적어주세요.

어떻게 더 뜨거워질 수 있을까? 그냥 기다려.

Apple 9월 행사에서 발표된 모든 내용은 다음과 같습니다.

iPhone 16이 주목을 받았지만, 보청기처럼 작동하는 AirPods가 Apple의 가장 중요한 움직임이었을 수도 있습니다.

텍사스의 한 석유 마을에 비트코인 ​​광산이 들어서자 주민들은 그다지 친절하지 않았습니다.

마크 큐반에 따르면, 마크 큐반은 중년의 위기를 겪고 있지 않습니다 .

이 칼럼의 향후 구독자 전용 에디션을 놓치지 마세요. 오늘 WIRED(Plaintext 독자는 50% 할인)를 구독하세요 .

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
1
코멘트