저자: Su Zihua

상장사 CEO인 상장 보이(Mobvoi)의 창립자이자 CEO인 리즈페이(Li Zhifei)는 최근 신제품 출시 컨퍼런스에서 직접 제품을 설명하지 않았습니다. 대신, 그는 개인적인 "퍼포먼스 아트", 즉 "1인 기업"에서의 실험을 공유했습니다.
그는 비현실적으로 보이는 목표를 세웠습니다. AI 도구를 사용하여 며칠 안에 AI 조직을 위해 특별히 설계된 "페이슈"를 개발한다는 것입니다.
AI의 마지막 물결을 주도했던 그는 항상 선두에 섰습니다. 2012년, 그는 구글의 과학자 자리를 떠나 중국으로 돌아와 Mobvoi를 설립했습니다. 그는 음성 비서, 스마트 하드웨어, AIGC에 이르기까지 "AI+음성으로 인간과 컴퓨터의 상호작용을 재정의"하겠다는 목표를 세웠습니다. 이 AGI 물결이 시작되었을 때, 그도 처음에는 적극적으로 참여하는 데 매우 기대했지만, 곧 이것이 거대 기업 간의 경쟁처럼 보이며 중소기업이 큰 가치를 창출하기 어렵다는 것을 깨달았습니다. 그는 혼란스러웠고, 심지어 한동안 좌절하기도 했습니다.
하지만 그는 AI 프로그래밍 도구를 활용하여 스스로를 "1인 기업"으로 변모시켜 실습하고 경험했습니다. 실습 과정에서 많은 현실적인 문제에 부딪혔지만, 이러한 세부적인 사항과 경험을 통해 AGI에 대한 믿음을 되찾을 수 있었습니다.
그는 갑자기 과거 세계의 모든 "마찰"과 복잡한 것을 만드는 데 방해가 되던 모든 장애물이 사라진 것 같다는 것을 깨달았습니다.
AI와 함께 달려가는 것에서 오는 자유감과 희망을 보는 설렘이 그의 라이브 연설에서 표현되었습니다.
다음은 이지페이의 기자회견 연설 전문이며, Geek Park가 읽기 쉽도록 편집했습니다.
최근 AI 분야에 대량 시간을 투자하고 여러 구체적인 프로젝트를 직접 수행해 왔습니다. 그 결과, 빅 모델과 AGI에 대한 새로운 이해와 통찰력을 얻게 되었습니다. 오늘은 그동안 제가 생각해 온 질문들과 제가 느낀 점들을 여러분과 나누고 싶습니다.
우선, AI를 어떻게 해야 할까?
저는 여기에 모토를 가지고 있습니다: "AI의 AI를 이용해 AI를 하라."
좀 헷갈리시죠? 간단히 말해서, 첫 번째 "AI"는 큰 모델을 의미하고, 두 번째 "AI"는 코딩 에이전트를 의미하는데, 이 역시 AI가 만들었거나 주요 기능이 AI에서 비롯된 것일 수 있습니다. 마지막 "AI"는 우리가 직접 만들고 싶은 애플리케이션입니다.
저는 이것이 소프트웨어 개발의 새로운 패러다임이 될 수 있다고 생각합니다. 나중에 자세히 설명하겠습니다.

새로운 소프트웨어 개발 패러다임 | 이미지 출처: Mobvoi
한 사람이 이틀 만에 AI 시대를 위한 페이슈를 창조했다
얼마 전, 저는 대담한 아이디어를 떠올렸습니다. AI 기반 조직을 위한 새로운 "페이슈" 스타일 협업 플랫폼을 만드는 것이었습니다.
미국 실리콘 밸리에는 단 한두 명으로 구성된 팀조차 수억 달러의 가치를 지닌 유니콘 기업들이 많습니다. AI가 대량 일자리를 대체할 것이라는 보도도 많습니다.
그래서 저는 기업 조직으로서 중국에서 자주 사용하는 Feishu, DingTalk, Enterprise WeChat과 같은 도구 없이는 업무를 수행하기 어려울 것이라고 생각하기 시작했습니다.
사람 중심의 전통적인 기업에서는 Feishu, DingTalk, WeChat for Work와 같은 도구를 크게 활용했는데, 이러한 도구를 통해 정보의 빠른 흐름과 효율적인 협업이 가능했습니다.
전통적인 기업에서는 생산성이나 업무 유형이 거의 100% 사람에 의해 결정되었습니다. 따라서 과거의 정보 흐름과 협업은 사람을 중심으로 이루어졌습니다.
하지만 조직 내 10개 업무 중 8개를 AI가 수행하고 인간의 역할은 2개만 남게 되면 기존 협업 도구는 적응할 수 없습니다.
그렇다면 새로운 조직은 어떤 도구를 사용할까?
따라서 저는 AI 에이전트, AI, 그리고 인간이 그룹 채팅, 개인 채팅, 지식 기반 질의응답, 그리고 업무 협업을 원활하게 수행할 수 있는 제품을 개발하고 싶습니다. 또한 이 프로젝트를 통해 제가 진정한 "슈퍼 개인" 또는 "개인 유니콘"이 될 수 있는지 검증할 수 있기를 기대합니다.
다음은 이를 실행하는 방법입니다.
일반적으로 Feishu나 DingTalk과 같은 소프트웨어 개발은 매우 복잡합니다. 과거에는 이러한 제품을 만들기 위해 제품 관리자, 디자이너, 프런트엔드, 백엔드, 테스터, 알고리즘 엔지니어 등 여러 직종의 인력이 필요했습니다. 각 직종에는 프런트엔드 담당자, 알고리즘 담당자, 제품 담당자 등 담당자가 있을 수 있습니다. 일반적으로 한 팀은 곧 20명으로 구성됩니다. 이 20명 모두가 전담하는 것은 아니지만, 프로토타입을 제작하는 데 한 달이 걸릴 수도 있습니다.
AI 시대에 이런 일은 너무 느립니다.
제가 끝낼 때쯤이면, 관련 스타트업 팀은 이미 AI 유니콘이 되어 있을지도 모릅니다.
그래서 저는 기존 모델을 버리고 직접 작업하기로 했습니다. 그리고 전적으로 AI에 의존하여 작업을 완료하기로 했습니다. 마침 용선절 전날이기도 해서 이 작업에 몰두하기로 했습니다. 마침 3일간의 휴가가 있었는데, 이 3일을 이 작업에 쓸 수 있을지 고민했습니다. 그래야 아무도 저를 방해하지 않을 테니까요.
그래서 저는 이 일을 시작했습니다.
저는 매일 새벽 1시쯤까지 이틀 연속으로 혼자 작업했고, 마침내 6월 1일 오후 11시 30분에 이 제품의 프로토타입을 완성했습니다. 이 제품에는 로그인, 개인 채팅, 그룹 채팅, 파일 업로드, 메시지 전달, 답장 등의 핵심 기능이 들어 있습니다.
로그인 후 비공개 채팅을 하거나 메시지를 보낼 수 있습니다. 예를 들어, 제품 관리자에게 이 캐릭터가 토크쇼에 출연할 수 있는지 물어볼 수 있습니다. 만약 불가능하다면, 캐릭터를 동적으로 조정하고 스킬을 추가할 수 있으며, AI가 자동으로 메시지를 다시 생성합니다.
나중에 물어봤더니 이제야 알겠더군요. 파일 업로드도 가능하고 (물론 파일 내용은 실제로 읽히지 않지만), 특정 메시지를 전달하고 답장할 수도 있습니다. 이 기능은 실제 사람이 아니라 AI가 작동한다는 점을 기억하세요. AI는 사용자가 보내는 메시지를 기반으로 답장하고 전달할 수 있습니다.
전달 시, 위챗처럼 다른 정보가 전달에 포함되어 있어 표시 효과가 매우 복잡하다는 것을 알 수 있습니다. 그룹 채팅이므로 특정 사람에게 @를 보낼 수도 있습니다. 마찬가지로 전달, 답장, 첨부 파일 추가, 심지어 중국어로 전환할 수도 있습니다.
이틀 동안 박수를 보내주세요!
이틀 만에 데이터베이스, 프런트엔드, 백엔드, 그리고 AI 알고리즘을 갖춘 시스템을 완성했습니다. AI는 질문에 자동으로 답변할 수 있으며, 캐릭터 설정 페이지를 수정하면 프롬프트가 자동으로 재생성되고 스킬이 즉시 표시됩니다.
솔직히 말해서, 처음에 반나절 정도 작업하다가 거의 포기할 뻔했습니다. 데이터베이스 문제를 파악하지 못하고 여러 가지 핵심 오류가 계속 발생했거든요. AI 프로그래밍도 현재 그런 문제가 있는 게 사실입니다. 하지만 결국 이틀 만에 끝냈습니다.
그러다가 이 제품을 어떻게 홍보할지 고민하게 됐어요.
예전에는 저희 회사에 전담 엔지니어가 웹사이트를 구축하고, 마케팅 부서에는 제품 특징을 정의하는 팀이 있었습니다. 웹사이트를 구축하는 데 일주일에 대여섯 명이 필요했을 수도 있습니다.
하지만 이번에는 AI 네이티브 방식을 택하기로 했습니다. AI가 모든 코드를 알고 있기 때문에 제 아이디어와 제품 기능도 모두 알고 있었기에, AI에게 웹사이트 제작을 맡겼습니다.

AI로 구축된 이 제품의 공식 웹사이트 | 출처: Mobvoi
그래서 AI를 통해 단 5분 만에 제품 하이라이트와 고유 기능을 담은 웹사이트를 구축하고, 마케팅 캠페인을 위한 설정 가능한 광고 배치를 5분 만에 생성했습니다. 예전 같았으면 여러 마케팅 및 엔지니어링 팀이 일주일씩 걸렸을 작업이죠.
예전에는 회사 웹사이트에 마케팅 공간을 만든 후, 크리스마스 이후에 이를 삭제하거나 새로운 콘텐츠로 교체하려면 엔지니어를 직접 찾아야 했습니다. 마케팅 공간을 구성할 수 있는 웹사이트를 만들 수 있을지 고민했습니다.
AI가 마케팅 포지션을 설정할 수 있는 웹사이트를 만드는 데 5분이 더 걸렸습니다. 즉, 마케터는 이 웹사이트에 로그인하여 사진이나 기타 콘텐츠를 업로드한 후, 메인 웹사이트의 해당 부분을 직접 수정할 수 있습니다.
그걸 하고 나서, 이게 새로운 제품이고 몇 가지 새로운 개념이 있거나 일정 수준의 복잡성이 있기 때문에, 마케팅 영상이든, 운영 가이드든, 제품 투어든 이 웹사이트의 기능을 설명하는 영상을 만들 수 있을까 생각했습니다.
하지만 용선절 기간 동안 직원들이 저를 무시해서 제가 직접 해야 했습니다. 그래서 웹사이트 소개, 웹사이트 UI 워크플로우 운영, 화면 녹화 및 더빙 등 전체 스크립트를 자동으로 생성하는 프로그램을 개발했습니다.
사운드 정렬에 아직 약간의 오류가 있지만, 전체 영상은 AI가 100% 완성했습니다. 제가 지시만 내리면 AI가 자동으로 작동하여 완성된 영상을 제 앞에 보여줍니다.
이걸 단 며칠 만에 만들어냈다는 게 정말 성취감이 들었습니다.
그래서 다른 사람들이 어떻게 생각하는지 보고 싶었습니다. 그래서 코드를 GitHub에 업로드하고 동료들에게 다운로드해 달라고 부탁했습니다. 하지만 우리는 서로 다른 사람이고, GitHub은 제가 이 작업을 위해 AI와 어떻게 소통했는지 전혀 알지 못한다는 점을 기억해야 합니다.
그래서 제 동료는 코드를 보고 로컬에서 실행하게 되었습니다.
제가 GitHub에 업로드한 코드를 동료들이 다운로드해서 실행해 보니, 그 복잡성과 완성 속도에 깜짝 놀랐습니다. 수십 명이 몇 달씩 걸릴 줄 알았는데, AI의 도움을 받아 엔지니어 한 명이 이틀 만에 완성했다고 말했더니 "정말 말도 안 돼."라는 반응이었죠.
그들은 그 안에 담긴 4만 줄이 넘는 코드에 놀랐는데, 이는 제가 이전에 구글에서 하루에 작성했던 알고리즘 코드 300줄을 훌쩍 뛰어넘는 숫자였습니다.
구글에 있을 때 저는 하루에 300줄의 알고리즘 코드(단순 코드가 아님)를 작성했는데, 이는 높은 생산성으로 여겨졌습니다. 최근에는 일반 에이전트를 작성했는데, 3시간, 즉 하룻밤 만에 3,000줄의 파이썬 코드를 작성해 주었습니다. 다시 말해, 그 3시간 동안 작성한 코드의 품질은 제가 작성한 코드보다 확실히 좋았고, UI 없이 순수한 백엔드 로직만 담았습니다.
다시 말해, 3시간 만에 코딩할 수 있는 능력은 제가 이전에 10일 동안 작업했던 것과 맞먹는다는 뜻입니다.
그래서 생각해 봤습니다. 한 사람이 구글 번역을 완성할 수 있다고요. 예전에는 구글 번역을 세계 최고의 박사 20명이 코딩했고, 시간이 많이 걸렸습니다. 이제 저는 그 20명이 할 일을 혼자서 할 수 있습니다. 적어도 그 당시 구글 번역은 매우 놀랍고 복잡한 시스템이었습니다. 그래서 이런 관점에서 보면 모든 것이 예전과는 매우 다르다고 생각합니다.
저는 궁극적으로 AI의 핵심은 스스로 진화하는 AI 시스템을 구축하는 것이라고 생각합니다.

이지페이의 실제 경험 | 이미지 출처: Mobvoi
AI 조직 앱 테스트를 용이하게 하기 위해 코드를 자동으로 작성했습니다. 왼쪽은 웹사이트 코드이고 오른쪽은 테스트 프레임 입니다. 그러면 왼발이 오른발을 밟듯이 스스로 위로 날아오릅니다. 마치 영구 운동 기계처럼 보일 수도 있는데, 실제로 가능합니다. 물론 오른발을 왼발로 차서 넘어지는 경우도 있습니다. 즉, 부정적인 순환이 있을 수도 있고, 긍정적인 순환도 있을 것입니다.
이 목표를 달성하기 위해 엔지니어뿐 아니라 모든 비엔지니어도 제 코드를 직접 수정할 수 있도록 했습니다. 또한 다양한 에이전트도 만들었습니다.
물론, 이 중 상당수는 프롬프트입니다. 저는 단지 실현 가능성만 확인했을 뿐, 진정한 배포나 제품화를 달성하지는 못했습니다.
하지만 아이디어를 증명하거나 팀원들에게 제가 원하는 것이 무엇인지 보여주는 데는 예전에는 대량 시간이 걸렸을 것 같습니다. 이제는 데모를 만들어서 보여주면 되니까요. CEO라도 이런 능력이 있다면 결과물이 100배는 더 좋아질 거라고 생각합니다.
함정
위 내용은 제 경험입니다. 이어서 몇 가지 추상적인 이론을 말씀드리겠습니다. 아직은 매우 독특한 내용이니 졸지 않으셨으면 좋겠습니다.
제가 공유하고 싶은 것은 AI 프로그래밍을 하면서 겪었던 몇 가지 문제입니다.
첫 번째 문제는 내가 직접 작성하지 않은 에이전트라 하더라도 모든 에이전트에는 여전히 인간의 개입이 필요하다는 것입니다.
다시 말해, 저는 여전히 "이런 에이전트를 만들고 싶습니다"라고 말해야 합니다. 물론 옆에 있는 일반 에이전트 프레임 를 참고해서 수정한 후 말씀해 주시면 됩니다. 하지만 저는 여전히 이렇게 해야 합니다. 가끔 에이전트가 제 원칙을 잊어버릴 때가 있는데, 그럴 때면 "또 제 원칙을 잊으셨군요" 또는 "지능은 어디에 배치해야 할까요?"라고 물어봐야 합니다. 여전히 이런 문제들이 있습니다.
두 번째, 만약 당신이 그것을 사용했다면, 그것은 항상 지름길을 택한다는 것입니다.
예를 들어, 뭔가를 하라고 하면 당연히 백엔드 데이터베이스를 연동해야 하는데, 걔는 그걸 안 해줘요. 작업이 끝나면 자기가 해냈다고 하면서 공로를 챙길려고 긴 보고서를 써대요. 저는 보통 보고서조차 보지도 않고 "이미 데이터베이스는 당신이 작성했잖아요."라고만 말하죠. 걔는 바로 사과하고 작업을 시작하죠. 예를 들어, AI 작업을 하라고 하면 원격 AI를 호출하지도 않고 스스로 폴백이나 가짜 작업을 하는 경우가 많아요.
그렇게 빨리 돌아가는 걸 보고 뭔가 문제가 있다는 걸 직감했어요. "정말 원격 AI를 불렀어?"라고 물었더니, 다시 사과하더니 문제를 해결하러 갔죠. 매번 그랬어요. 여전히 지름길을 택하는 걸 좋아해요. 반복되는 실수가 너무 많아서 일일이 나열하기는 어렵네요. 자세한 설명은 생략할게요.
게다가, 오늘날의 AGI는 실제로 매우 긴 작업을 완료하는 데 어려움을 겪고 있습니다. 제가 현재 진행 중인 작업 대부분은 30분 이상 걸립니다.
제가 매일 소모하는 토큰은 50달러입니다. 제가 그날 일하고 싶은 한, 아침부터 저녁까지 토큰이 소모됩니다. "아이디어가 몇 가지 있는데, 이게 제 아이디어의 방향입니다. 10일짜리 과제를 완료하고 500만 달러를 벌 수 있도록 도와주세요."라고 말할 수 있을 것 같습니다.
저는 이것이 신화라고 생각하지 않습니다. 그저 제가 그것에 그다지 끌리지 않는 것 같아서 하지 않는 것뿐입니다. 아니, 오히려 그것이 제 정서 과 에너지를 많이 소모할 수 있고, 돈을 벌지 못하면 매우 고통스러울 것이기 때문입니다.
그런데 궁금한 게 있어요. 당신이 개입하거나 가끔씩 방향을 상기시켜 주지 않고도 10일 동안 계속 작동할 수 있을까요? 한 달, 아니 1년 동안 작동할 수 있을까요?
가까운 미래에는 노벨상이나 필즈상 수준의 성과를 거두는 데 문제가 없을 것으로 생각합니다.
제가 그것과 소통할 때, 가끔은 전에 배웠던 아주 복잡한 알고리즘에 대해 이야기하곤 하는데, 그 알고리즘은 세상에서 몇 명밖에 공부하지 못할 수도 있지만, 그것은 많은 사람들보다 훨씬 더 잘 말할 수 있습니다. 따라서 충분한 맥락과 코드를 제공한다면, 실제로 매우 깊이 있는 소통을 할 수 있습니다.
기본으로 돌아가기: 일반 에이전트와 인텔리전스란 무엇인가?
다음으로, 정보와 요원에 대한 저의 생각을 공유하고 싶습니다.
간단히 말해서, AI 에이전트는 계획자와 실행자라는 두 가지 핵심 부분으로 구성됩니다.

AI Agent의 구조 | 이미지 출처: Mobvoi, 아래와 같음
일반적으로 대규모 언어 모델을 기반으로 하는 플래너는 에이전트의 주요 역할을 수행합니다. 플래너는 작업에 따라 세부적인 계획을 수립합니다. 실행자는 코드를 작성하거나 브라우저 작업을 자동화하여 비디오를 제작하는 등 이러한 계획을 실제로 구현할 책임을 맡습니다.
에이전트는 지속적인 피드백 루프로 작동합니다.
계획 : 에이전트는 작업에 따라 구체적인 행동 방안 개발합니다.
실행 : 실행자는 계획대로 운영됩니다.
피드백 받기 : 에이전트는 실행 중에 환경으로부터 즉각적인 피드백을 받습니다. 예를 들어, 에이전트가 "python" 명령을 실행하려고 하는데 로컬 시스템이 실제로 "python 3"인 경우, 시스템은 오류를 보고하고 에이전트는 오류를 식별하여 올바른 명령으로 수정할 수 있습니다.
조정 및 반복 : 에이전트는 피드백을 기반으로 다시 계획을 세우고, 현재 상황( 컨텍스트 )에 대한 이해를 업데이트하고 다시 실행합니다.
목표 달성 : 사전 설정된 성공 기준(예: 프로그램 컴파일 통과 또는 모든 테스트 완료)이 충족되면 루프가 종료됩니다.
지능의 본질에 대해 생각해보면, 지능의 첫 번째 본질은 진화라고 생각합니다.
지능형 에이전트인 인간이 특정 환경(사회적 또는 업무 수행)에서 피드백을 받아 끊임없이 행동을 조정하고 성찰하는 것처럼, AI도 마찬가지입니다. 이러한 진화는 자동적이며 인간의 개입이 필요하지 않습니다. 에이전트는 계획, 환경 실행, 피드백 획득, 계획 조정, 그리고 상황 업데이트를 통해 스스로를 지속적으로 개선하는 순환 구조를 자율적으로 구축합니다.
이러한 진화 과정의 핵심은 자신의 경험에서 배우고 다른 사람에게서 배우는 것인데, 이를 집단적 지혜, 즉 다른 사람의 경험에서 배우는 것입니다.
지능의 두 번째 본질은 재귀라고 저는 믿습니다.
재귀는 "분할 정복"이라는 개념입니다. 복잡한 문제를 같은 유형의 작은 문제로 나누어서 직접 해결할 수 있을 때까지("기본 사례") 진행합니다.
예를 들어, 피보나치 수열에서 99번째 숫자를 계산하려면 98번째 숫자와 97번째 숫자에 의존하며, 이는 초기 F0과 F1로 거슬러 올라갑니다.
에이전트가 진정한 지능을 달성하려면 재귀적 아키텍처도 갖춰야 합니다. 예를 들어, "500만 달러 벌기"와 같은 대규모 작업을 받은 에이전트는 이를 사업 기회 분석, 웹사이트 구축, 동영상 제작, 결제 통합, 소셜 미디어 홍보 등 구체적인 하위 작업으로 점진적으로 세분화합니다. 각 하위 작업은 궁극적으로 실행 가능한 "원자 에이전트"로 추적될 수 있습니다.
이 재귀적 아키텍처의 핵심은 자기 복제를 달성하는 것입니다. 인류 문명의 계승이 세대를 거쳐 이어지는 탐험과 지식 축적에 의존하듯, 에이전트도 마찬가지입니다. 더 중요한 것은 에이전트가 자신의 소스 코드를 수정할 수 있어야 한다는 것입니다.
이는 계획만 조정하는 현재의 에이전트와는 다릅니다. 즉, 에이전트는 자신의 유전자를 수정하는 것처럼 자신의 작동 논리를 근본적으로 바꿀 수 있다는 뜻입니다.
저는 에이전트가 다음과 같은 일을 할 수 있다고 믿습니다.
계획을 지속적으로 실행하고 최적화합니다.
해결할 수 없는 문제가 발생하면 핵심 소스 코드를 독립적으로 수정합니다 .
궁극적으로 이러한 메커니즘을 통해 지식 기반이 형성되고, 대규모 모델 자체도 역으로 수정될 수 있습니다 .
그러면 이는 인공 일반 지능(AGI)을 향한 중요한 단계가 될 것입니다.

이건 공상과학 소설이 아닙니다. 저는 초지능에 대해 이야기하는 걸 싫어했지만, 거대 모형과 심도 있는 논의를 한 후 갑자기 이것이 충분히 가능하다는 생각이 들었습니다.
또한 실제 AI의 소스 코드는 매우 간결할 수 있으며 핵심 코드는 100줄을 넘지 않을 수 있지만 여러 계층의 재귀를 포함하므로 다양한 환경에서 탐색하고, 피드백을 학습하고, 자체 반복이 가능합니다.
한때 믿음이 무너진 적이 있었습니다. 2023년에는 AI에 대한 믿음이 있었지만, 얼마 지나지 않아 재정적 지원이 부족하고 감당할 수 없다고 느껴 포기했습니다. 작년에 다른 사람들이 AI에 대해 이야기했을 때, 저는 듣고 싶지 않았습니다.
하지만 최근 들어 AI, 심지어 AGI(강력 인공지능), 그리고 초지능에 대한 믿음을 되찾았습니다. 정말 놀라운 변화입니다. 이번에는 제 믿음이 조금 더 오래 지속되기를 바랍니다.
개인화된 환경과 맥락의 중요성
그렇다면 큰 모델 외에 가장 중요한 것은 무엇일까요? 가장 중요한 것은 개인화된 환경과 맥락을 갖추는 것입니다.

제 사업을 예로 들어보겠습니다. 예전에 스마트 하드웨어를 만들었는데, 샤오미가 가격을 저희 가격의 10분의 1로 낮췄습니다. 큰 모델을 만들었는데, 대형 제조사들이 다 뛰어들었습니다. 이런 피드백을 받을 때마다 포기하거나 계획을 계속 수정하게 됩니다.
미국에서 큰 모델을 만들었다면 구글에 인수되어 큰돈을 벌 수도 있고, 하드웨어를 만들었다면 애플에 인수되어 큰돈을 벌 수도 있습니다. 따라서 이러한 피드백은 분명 여러분의 행동을 완전히 다르게 만들 것입니다. 같은 IQ를 가진 동일한 기업가라도 중국과 미국의 서로 다른 기업 환경에서는 서로 다른 피드백을 받게 됩니다. 결국 여러분의 행동과 사고방식은 완전히 달라질 것입니다. 제가 말하고 싶은 것은 바로 이것이 개인화된 환경, 즉 개인화된 맥락이 무엇인지에 대한 것입니다.
맥락은 역사적 기록에 가깝습니다 .
다시 전에 말씀드린 걸로 돌아가서, 대형 모델들이 유행하던 시절, 저는 가장 먼저 나서서 대형 모델을 하겠다고 선언했지만, 동시에 제 취향이 아니라는 걸 깨달은 것도 아마 가장 먼저였을 겁니다. 그런데 어떻게 참여해야 할지 몰라서 아예 헌신하지 않았던 거죠.
올해 상반기에는 세계 거대 기업 서너 곳을 제외하고는 다른 기업들이 모델에 대해 이야기할 자격이 없다고 느꼈습니다. 재미에 동참하지 마세요. 인생을 낭비하지 마세요. 정서 낭비하지 마세요. 기회가 전혀 없기 때문에 돈 낭비일 뿐입니다. 사실 빅 모델 자체가 너무 지루해져서 어차피 돈 낭비일 뿐입니다. 돌파구를 찾을 수 없고, 대부분의 AI 기업들이 어떤 가치를 가지고 있는지 이해할 수 없습니다.
하지만 이번에는 연습과 재검토를 통해 설령 하이엔드 AGI라 하더라도 다시 참여할 수 있을 것 같은 느낌이 들었습니다.
이것이 바로 에이전트 플래너와 실행자의 반복적인 순환입니다. 충분한 명확성을 갖추고 정보를 기반으로 정보를 창출할 수 있다면, 전체 AGI 프로세스에 참여할 수 있다고 생각합니다.
큰 모델 자체가 여러분에게는 칩과 같습니다. 퀄컴 칩, 애플 휴대폰, 그리고 위의 틱톡을 상상해 보세요. 이 둘은 완전히 다른 것입니다. 결국 가장 큰 가치를 얻은 것은 틱톡을 만든 회사였습니다.
야심찬 AGI 목표조차도 불가능한 것은 아니라는 것을 알게 되었습니다. 제가 구상했던 재귀 에이전트 시스템을 구축함으로써 필요한 자금은 크지 않을 수 있지만, 혁신적인 지혜에 더 의존하게 될 것입니다. 업계 거물이 아니더라도 심층적인 사고와 기술적 역량만 있다면 AGI 과정에 참여할 수 있다고 생각합니다.
Mobvoi의 역사 또한 제 생각을 뒷받침합니다. 저희는 2012년부터 중국 최초의 AI 기업 중 하나로, 음성 비서부터 시작하여 TicWatch와 TicMirror와 같은 스마트 하드웨어를 연구해 왔습니다. 시장 경쟁과 미숙한 기술로 어려움을 겪었지만, 저희는 항상 선두를 지켜왔습니다.
2019년 이후, 저희는 소프트웨어 분야로 전향하여 중국은 물론 세계 최초의 AIGC 소프트웨어 회사 중 하나가 되었습니다. 예를 들어, Magic Sound Studio는 더우인(Douyin)과 같은 플랫폼에 대량 더빙 콘텐츠를 제공했으며, 치미아오위안(Qimiaoyuan, 디지털 휴먼 비디오 생성)과 같은 제품도 개발했습니다.
중국과 같은 경쟁 환경에서 기술 회사는 끊임없이 반복하고 스스로를 교정하는 에이전트와 같습니다.
Mobvoi의 "소스 코드"가 2012년 처음 설립되었을 당시와 크게 다르듯이, 이는 우리가 계속해서 발전하고 있음을 반영합니다.






