OpenAIChatGPT Atlas는 확실히 브라우저 제품이지만 신호에 가깝습니다.
피차이가 구글의 CEO가 되고, 지금은 알파벳의 CEO가 된 이유를 모두가 기억해야 합니다. 가장 중요한 이유 중 하나는 크롬의 성공이었습니다.
그 시점으로 돌아가 보면, 크롬은 구글과 마이크로소프트 간의 경쟁에 큰 기여를 했다고 할 수 있습니다. 크롬 덕분에 구글은 자체 터미널과 입구를 확보할 수 있었습니다.
AI 빅모델의 맥락에서 보면, 역할이 뒤바뀌었다는 점을 제외하면, 이 이야기는 분명히 반복되고 있습니다. OpenAI는 과거의 구글이 되었고, 오늘날의 구글은 과거의 마이크로소프트가 되었습니다.
이는 분명 과거 소위 진입점 전쟁의 연장선이지만, 또 다른 무언가가 조용히 변화하고 있습니다. 이러한 전체적인 변화, 그리고 미래의 추세를 이해하려면 제가 "지능 척도 효과"라고 부르는 근본적인 논리부터 살펴봐야 합니다. ("지능 척도 효과"라고 번역할 수도 있겠지만, 사실 제가 지어낸 표현입니다.)
이 효과의 기본은 간단한 공식으로 요약할 수 있습니다.
지능의 효과성 = 빅모델의 지능수준 × 현실세계 이해의 깊이
이 공식은 스마트 애플리케이션 분야의 미래 경쟁의 핵심을 보여줄 수 있습니다.
경쟁에서 승리하려면 단순히 "더 똑똑한" 모델(즉, 더 높은 "지능 수준")을 보유하는 것만으로는 충분하지 않습니다. 진정한 승자는 두 번째 요소, 즉 모델이 현실 세계를 얼마나 깊이 이해하는지에 달려 있습니다.
후자는 시간이 지날수록 더욱 중요해지고, 전자의 진화 속도에 영향을 미칠 수도 있습니다.
궁극적인 "효율성"을 극대화하기 위해 AI 붐에 합류하는 모든 회사는 미친 듯이 끝없는 경쟁에 뛰어들 것입니다. 즉, 자사 데이터의 경계를 무한히 확장하기 위한 경쟁입니다.
모델 기업이 이 점을 알아내면 모두 애플리케이션으로 개발하게 되고, 애플리케이션으로 개발하면 거의 대부분이 여기까지 오게 될 겁니다.
여기서는 애플리케이션과 모델이 분리될 수 없습니다.
"스마트 스케일 효과" 해체
이 공식의 두 가지 핵심 구성 요소를 분석해 보겠습니다.
1. 대형 모델의 지능 수준
이것이 AI의 "기본 IQ"입니다.
이는 모델 아키텍처, 학습 데이터 양, 매개변수 규모, 컴퓨팅 리소스에 따라 결정됩니다.
OpenAI의 GPT 시리즈와 Anthropic의 Claude 시리즈로 대표되는 상위 대형 모델은 수조 개의 토큰으로 구성된 공개 데이터에 대한 사전 학습을 통해 언어 이해, 논리적 추론, 지식 저장, 코드 생성과 같은 강력한 일반 역량을 갖추게 되었습니다.
이것이 바로 AI의 '잠재적 에너지'입니다.
이는 모델이 이론적으로 도달할 수 있는 가장 높은 높이를 나타냅니다.
지난 몇 년 동안 우리는 "지능 수준"에서 군비 경쟁을 목격했습니다. 매개변수는 수십억에서 수조로 급증했고, 모델 성능은 상상을 초월했습니다.
하지만 나중에 생각해 보세요. 핵심은 무엇일까요?
실제 상황에 대한 더욱 완벽한 데이터를 얻을 수 있는 사람은 누구입니까?
처음에 우리가 지능이 향상될 수 없다고 생각했던 걸 기억하실 겁니다. 데이터가 부족했을 뿐이었죠.
따라서 큰 모델의 후반부는 데이터로 돌아갈 운명입니다.
과거의 동일한 성격을 반복하는 데이터가 아니라, 과거에 포함되지 않았던 차원을 추가하는 데이터입니다.
(자율주행의 맥락에서 지능형 스케일 효과를 이해하는 것이 더 쉽습니다)
2. 현실에 대한 깊은 이해
이것이 바로 AI의 "상황 지능"입니다.
"지능 수준"이 AI의 CPU라면, "현실 이해의 깊이"는 RAM(메모리)과 I/O(입출력) 시스템입니다. 이는 모델이 특정 작업을 수행할 때 접근하고 이해할 수 있는 특정 실시간, 비공개 또는 독점 데이터의 깊이와 폭을 나타냅니다.
모델이 아무리 지능적이라 하더라도, 자신이 하는 일, 개인의 일정, 회사의 내부 지식 기반에 대해 아무것도 모른다면, 지혜는 있지만 그것을 드러내지 못하는 비밀의 방에 갇힌 천재와 같습니다.
현실에 대한 "이해의 깊이"는 0이며, 궁극적인 "지적 효율성"도 0에 가까워집니다.
"지능적 규모 효과"의 핵심 통찰력은 다음과 같습니다.
"지능 수준"이 특정 임계값에 도달하면 애플리케이션의 성공 또는 실패를 결정하는 핵심 요소는 모델 자체의 IQ에서 활용할 수 있는 "실제 데이터"의 규모로 빠르게 전환됩니다.
데이터 봉쇄 이동
이것은 어디로 이어질까?
이로 인해 새로운 인클로저 운동, 즉 데이터 인클로저 운동이 일어날 것입니다.
ChatGPTAltlas는 Google의 핵심을 직접적으로 겨냥한 공식적인 선언으로 볼 수 있습니다.
하지만 이것은 실제로 여기서 시작된 것이 아닙니다. 오랫동안 이어져 왔습니다.
성과 1: 클라우드에서 데스크톱 및 OS까지 – 개인 컨텍스트 포착
사례: OpenAI의 ChatGPTAltlas와 Anthropic의 데스크톱
실제로 이에 대해 말할 것은 많지 않습니다. 단지 엔드투클라우드 통합 경로일 뿐입니다.
목표는 간단합니다. 경험 병목 현상을 해결하고 더 많은 데이터를 확보하는 것입니다. 그렇지 않으면 웹 AI와 사용자 워크플로우 간의 단절이라는 핵심적인 문제를 해결할 수 없습니다. 웹 AI는 로컬 문서나 애플리케이션을 "볼" 수 없기 때문에 사용자가 잦은 복사 및 붙여넣기를 수행하게 되어 효율성이 저하됩니다.
방향은 이미 정해졌으니, 언젠가 OpenAI가 OS를 출시해도 놀랍지 않을 겁니다. (구글은 안드로이드를 복제했는데, 훨씬 더 효과적이었습니다.)
방법도 통일되어 있습니다.
이 모든 작업은 시스템 수준 권한이 있는 네이티브 애플리케이션을 통해 수행됩니다. 사용자 승인 후 AI는 화면 콘텐츠를 직접 "보고" 로컬 파일을 읽어 전체 맥락을 이해할 수 있습니다. 이는 브라우저 탭으로 제한되는 "블라인드" 웹 버전의 AI와는 극명한 대조를 이룹니다.
일반적인 시나리오는 다음과 같습니다. 디자이너는 Figma에서 데스크톱 AI를 직접 호출하고, 요소를 가리키며 "이 버튼을 네오 스큐어모픽 스타일로 변경하고 CSS 코드를 제공해 주세요."라고 요청할 수 있습니다. AI는 전반적인 디자인을 "인식"하기 때문에 정확한 제안을 제공하여 기존 5~10분 걸리던 애플리케이션 간 작업을 30초 이내로 단축할 수 있습니다.
물론, 이러한 긴밀한 통합은 심각한 개인정보 보호 및 보안 문제를 야기하여 사용자의 높은 신뢰 수준을 요구합니다. 이에 대해서는 나중에 자세히 설명하겠습니다.
이것이 AI가 당신 자신보다 당신을 더 잘 이해하는 시작입니다. 당신은 1년 전 일을 기억하지 못하지만, 이론적으로는 가능합니다.
퍼포먼스 2: 정적에서 실시간으로 - 역동적인 세계를 수용하다
사례: Perplexity AI(AI 검색 엔진)
2022년에 설립되어 2023년에서 2024년 사이에 빠르게 성장한 Perplexity AI는 이를 실현합니다. Perplexity AI는 두 가지 주요 문제점을 해결합니다. 기존 LLM의 "낡은" 지식과 기존 검색 엔진의 "링크만 제공하고 답변은 제공하지 않는다"는 것입니다.
당시 그들은 "실시간 검색 + LLM 요약"(RAG) 아키텍처 전체를 개발하는 데 비교적 일찍 나섰습니다.
사용자가 질문을 하면, 먼저 실시간으로 최신 웹 정보를 크롤링하여 현실 이해의 깊이를 확장한 다음, 이를 GPT-4와 같은 대규모 모델에 입력하여 즉각적인 답변을 생성합니다. 이는 링크 목록을 제공하는 Google이나 오래된 지식을 제공하는 기본 버전의 ChatGPT와는 극명한 대조를 이룹니다.
이제 이건 기본 기능이 되었습니다. 이 기능의 미래는 불확실하고, 어쩌면 사라질지도 모릅니다.
하지만 Perplexity는 성공적인 제품이었고, 2024년 초에는 월간 활성 사용자(MAU)가 1,000만 명을 돌파했습니다. 사용자가 "어젯밤 재무 보고서 데이터"를 검색했을 때 적시성과 재현율이 정적 LLM보다 훨씬 뛰어나 필터링 시간을 크게 절약할 수 있었습니다.
이 방법의 한계는 답변의 질이 출처에 따라 달라지고 비용이 두 배로 많이 든다는 것입니다.
성과 3: 공공에서 민간으로 – 기업 지식 기반 심화
사례 연구: Microsoft 365 Copilot
Microsoft는 대규모 M365 기업 고객을 대상으로 Copilot을 정식 출시했습니다. Copilot은 기업의 주요 고질적인 문제인 데이터 사일로 문제를 해결하는 것을 목표로 합니다. 직원들의 지식은 Outlook, Teams, SharePoint와 같은 애플리케이션에 분산되어 있어 기존 도구와의 통합이 어렵습니다.
Copilot 통합의 핵심은 Microsoft Graph입니다.
우리는 다음과 같은 사진을 게시하곤 했습니다.
이 그래프는 조직의 모든 개인 데이터를 색인화하여 "현실 이해의 심층성"을 형성하고 이를 Copilot의 고급 지능과 결합합니다. 직원이 질문(예: "지난주 프로젝트 A의 진행 상황을 요약하고 주간 보고서 초안을 작성해 주세요")을 하면 Copilot은 이메일, 채팅, 문서를 즉시 검색하여 정확한 보고서를 생성합니다. 이러한 수준의 정확도는 어떤 "공개" AI 비서나 기존의 내부 검색 기술도 따라올 수 없습니다.
이는 끝과 구름을 연결합니다.
사용자는 회의 요약 등의 작업을 거의 4배 더 빠르게 처리할 수 있으며, 주당 평균 1.2시간을 절약할 수 있다고 합니다.
성과 4: 디지털에서 물리적으로 - 사물 인터넷의 종말(전망)
이러한 경계 확장의 종착점은 필연적으로 디지털 세계에서 물리적 세계로 이루어질 것입니다.
웨어러블 기기(스마트 안경, AI 핀 등)와 사물 인터넷(IoT) 기기는 '스마트 스케일 효과'를 확장하는 궁극적인 형태입니다.
이것이 울트라맨이 항상 하드웨어를 만드는 사람들과 어울리는 이유입니다.
안경 카메라를 통해 당신이 보고 있는 것을 "보고", 마이크를 통해 당신의 대화를 "들을" 수 있는 AI 비서를 상상해 보세요. 얼마나 강력할까요? 실시간으로 메뉴를 번역해 주고, 새로운 고객을 인식하도록 알려주고, 심지어 가전제품을 수리할 때 단계별 지침을 제공할 수도 있습니다.
물론 이는 다른 의문을 불러일으키지만, 저는 사람들이 행사에서 마이크를 사용해 일상 활동을 녹음하고 분석하는 것에 대해 논의하는 것을 들어본 적이 있습니다.
적어도 본인은 반대하지 않는데, 주변 사람들이 반대할 수도 있을 것 같아요.
왜 이 경쟁은 그 어느 때보다 더 치열한가요?
"지능적 규모 효과"로 인해 촉발되는 경쟁은 더욱 치열해질 가능성이 높으며, PC 인터넷과 모바일 인터넷 시대를 훨씬 뛰어넘는 "승자 독식" 효과가 나타날 것입니다.
인터넷 시대에 경쟁의 핵심은 '주의'입니다.
플랫폼들은 콘텐츠와 서비스(검색, 소셜 네트워킹, 동영상 등)를 통해 사용자의 화면 시간을 두고 경쟁합니다. 네트워크 효과가 존재하기는 하지만, 사용자의 "전환 비용"은 비교적 감당할 수 있는 수준입니다. 예를 들어, 오늘은 Google을 사용하고 내일은 Bing으로 전환할 수 있고, 위챗에 글을 쓰고 웨이보에서 말할 수도 있습니다.
이 시점에서는 검색, IM 등 전혀 다른 성격의 것들이 병행해서 진행되고 있으며, 각각 고유한 네트워크 효과가 있습니다.
하지만 지능화 시대에 들어서면서 경쟁의 핵심은 '맥락'으로 옮겨갔는데, 이는 우리 공식에서 '현실에 대한 이해의 깊이'를 의미합니다.
이는 본질적인 차이점입니다.
대형 모델의 지능적 다재다능함과 결합하면, 이 본질적인 차이의 영향은 전례 없는 수준으로 확대될 것입니다.
AI 애플리케이션이 개인 또는 회사 워크플로에 성공적으로 깊이 내장되면(예: 모든 로컬 파일(예: XX 데스크톱)을 이해하고, 회사의 모든 비공개 지식 기반(예: Copilot)을 마스터하거나, 실시간 물리적 세계(예: 미래의 스마트 안경)에 연결되면 축적된 "현실 이해의 깊이"는 비교할 수 없는 우위를 차지하게 됩니다.
검색과 IM 간의 경쟁은 약한 경쟁이고, 위의 경쟁은 검색과 검색 간의 경쟁으로 강한 경쟁입니다.
따라서 미래에 AI가 더 많이 적용될수록 더욱 다양해질 것입니다. 부드럽고 단단한 제품이 수천 개의 파도처럼 밀려오고, 전쟁의 연기 속에서 영웅들이 곳곳에서 일어설 것입니다.
과거에는 네트워크 효과가 실제로 높은 접착력을 가졌습니다.
운영체제나 위챗을 바꾸는 건 어렵지만, 다른 것들은 사실 바꾸는 데 문제가 없습니다.
JD.com이나 Tmall에서 물건을 살 때, 구매력이 어떤가요?
하지만 또 다른 것이 있을 수도 있습니다. 끈적끈적하고 눈에 보이지 않는 거미줄입니다.
한 AI 비서에 축적된 개인 습관과 개인정보에 대한 심층적인 이해를 다른 AI 비서로 쉽게 내보내고 가져올 수는 없습니다. AI 비서를 교체하는 데 드는 비용은 신입 직원을 처음부터 장기간 교육하는 것과 맞먹을 수 있습니다.
기업의 핵심은 지식입니다. 위 모델을 구현할 때, 제품을 바꾸는 것은 직원 그룹을 교체하고 모든 지식을 바탕으로 처음부터 다시 시작하는 것과 같습니다.
일반 지능의 무한한 특성을 고려할 때, 주요 디지털 기업 간의 경쟁은 결국 제로섬 게임으로 변할 것입니다. 사용자(개인이든 기업이든)는 결국 하나의 "마스터 AI"를 선택하고 그 데이터 경계를 극대화할 가능성이 높습니다. 이로 인해 경쟁은 전례 없이 심화되었습니다.
사용자의 핵심 데이터 소스를 먼저 차지하는 쪽이 거의 승리를 거머쥘 것입니다.
(그런데 이 주제에 대해 제가 글을 쓴 건 7~8년 전인데, 좀 이른 감이 있습니다)
효율성과 신뢰의 "위대한 게임"
여기에는 사용자의 체중이 얼마나 높은가라는 또 다른 변수가 있습니다.
WeChat이 확장 프로그램을 소개할 때, 사용자 전체가 가장 중요하지만 개인은 실제로 가장 중요하지 않다고 말하는 건 재밌는 얘기입니다.
붉은 봉투와 작업을 예로 들면, 그것은 파를 자르는 것과 거의 같습니다.
"스마트 스케일 효과"로 인한 데이터 경계 확장은 개인정보 보호와 신뢰라는 새로운 과제를 가져옵니다.
AI가 "당신을 더 잘 이해하기 위해" 필사적으로 데이터 경계를 확장할 때, 필연적으로 사용자의 개인정보 보호 한계선을 넘을 것입니다.
● 보고서를 작성할 때 더 나은 제안을 제공하기 위해 AI가 로컬 파일을 모두 읽도록 허용하시겠습니까?
● 귀하의 요구 사항을 보다 정확하게 예측하기 위해 AI가 귀하의 모든 채팅 기록을 분석하도록 허용하시겠습니까?
● 기업들은 운영 효율성 향상만을 위해 핵심적인 사업 비밀을 AI 시스템에 넘겨줄 의향이 있을까요?
이것이 미래의 핵심 모순입니다. 사용자의 "효율성"에 대한 욕구는 무한하지만, "개인정보보호"에 대한 우려도 현실적입니다.
개인정보 보호가 성과에 미치는 영향을 방지할 수 있을까?
따라서 이 경쟁의 후반전은 누가 더 많은 데이터를 수집할 수 있느냐에 관한 것뿐만 아니라, 누가 이 데이터를 보다 신뢰할 수 있고 안전한 방식으로 처리할 수 있느냐에 관한 것이 될 것입니다.
요약
제가 선택해야 한다면, AI 시대의 첫 번째 적용 원칙으로 '지능형 스케일 효과'(지능적 효율성 = 대규모 모델 지능 수준 × 현실 이해 깊이)를 선택할 것입니다.
이 보고서는 AI의 미래가 전지전능한 "디지털 신"을 만드는 데 있는 것이 아니라 현실에 "깊숙이 뿌리내린" 수많은 전문적 비서를 만드는 데 있다고 분명히 밝히고 있습니다.
OpenAI의 ChatGPTAltlas는 이 거대한 경쟁의 시작일 뿐입니다.
진정한 전쟁터는 '현실에 대한 깊은 이해'를 끝없이 추구하는 것입니다.
저는 개인적으로 이 공식의 결과물을 극대화할 뿐만 아니라 그 과정에서 사용자의 궁극적인 신뢰를 얻는 사람이 최종 승자가 되기를 바랍니다.
본 기사는 위챗 공개 계정 "Zhuo Mu Shi" 에서 발췌하였으며, 저자는 Li Zhiyong이고, 36Kr에서 허가를 받아 게시하였습니다.