OpenAI는 구글에 맞서기 위해 GPT-5.2를 사용합니다. 과연 그 칼날은 충분히 날카로울까요?

avatar
36氪
12-12
이 기사는 기계로 번역되었습니다
원문 표시

샘과 피차이가 팔씨름하는 모습; AI가 생성한 이미지.

한 달 전, 구글의 제미니 3는 모든 경쟁자를 제치고 "세계 최고"의 인공지능 모델로 등극했습니다. 그리고 한 달 뒤, 오픈AI 창립 10주년 기념일(미국 시간 12월 11일)에 차세대 인공지능 모델 GPT-5.2가 공식 출시되었습니다.

이번 중요한 제품 출시를 앞두고, 울트라맨은 주요 경쟁사들의 제품 개발 및 인재 빼돌리기 시도에 대응하여 내부적으로 최고위급 "적색 경보"를 발령했습니다.

따라서 GPT-5.2의 공개는 두 기술 거대 기업의 시장 지위에 관한 것일 뿐만 아니라, 글로벌 인공지능 산업의 경쟁 구도를 재정립할 수도 있습니다.

HyperWrite의 공동 창립자 겸 CEO인 맷 슈머는 예정보다 2주 앞서 "내부 테스트"를 진행한 후 다음과 같이 논평했습니다. "특히 추론 기능 면에서 강력한 성능을 보여주지만 속도가 느리고 사용 시나리오가 너무 제한적입니다. ChatGPT를 통해서만 사용할 수 있다는 점도 아쉽습니다."

"이건 세계 최고의 모델입니다. 어려운 문제도 한 시간 안에 해결하고 완벽하게 마무리할 수 있어요. 없으면 못 살겠어요."

실리콘 밸리의 AI 전문가이자 "베타 테스터"인 엘리 밀러는 GPT-5.2를 "전문 연구원"이라고 정의합니다. 그녀는 GPT-5.2가 깊이 생각하고 복잡한 문제를 해결하는 데 있어 "진지하고" "전문적"이지만, 콘텐츠가 구조화되어 있어 빠르고 간결하며 인간과 같은 소통을 선호하는 사용자에게는 그다지 편리하지 않다고 설명합니다.

"복잡한 작업, 브레인스토밍, 전문적인 분석에는 GPT-5.2를 사용할 것 같습니다."

AI 개발자 Dp Singh은 위의 평가에 동의하며, AI가 시연 시나리오뿐만 아니라 프레젠테이션 제작, 스프레드시트 작성, 차트 분석과 같은 일상적인 전문 작업에서도 전문가 수준의 결과물을 처음으로 달성할 수 있게 되었다고 강조했습니다.

GPT-5.2가 인간 연구원과 동등한 수준의 전문적인 능력을 보여준 것은 학계 전문가들의 관심을 끌기도 했습니다.

펜실베이니아 대학교 와튼 스쿨 교수이자 인공지능 전문가인 에단 몰릭은 "인공지능 개발이 오늘 멈춘다고 해도, 인간은 모델의 기능을 활용할 방법을 찾아낼 것이기 때문에 향후 10년 동안 사회와 경제는 여전히 엄청난 변화에 직면할 것이라는 확신을 그 어느 때보다 강하게 갖고 있다"고 말했다.

01 OpenAI는 "훨씬 앞서 나갈" 수 없습니다.

OpenAI는 GPT-5.2에 대해 명확한 비전을 가지고 있습니다. 바로 "현재까지 실제 전문가 업무에 가장 적합한 모델"이라는 것입니다.

그 "능력"을 입증하는 지표는 벤치마크 테스트와 성능 점수입니다.

위 이미지는 OpenAI가 X에 대해 공개한 벤치마크 테스트 차트입니다(이 차트는 공식 보도 자료에도 포함되지 않았습니다).

보시다시피, GPT-5.2는 자체 개발한 GDPval 벤치마크 테스트에서 명시된 작업의 70.9%에서 최고 수준의 인간 전문가 수준에 도달하거나 이를 능가했습니다. 이는 8월에 출시된 GPT-5(38.8%)에 비해 크게 도약한 것이며, Anthropic의 Claude Opus 4.5(59.6%)와 Google의 Gemini 3 Pro(53.5%)보다도 앞선 수치입니다.

하지만 GDPval은 OpenAI 자체 벤치마크 테스트이므로 성능이 좋지 않으면 문제가 됩니다.

더 중요한 것은 업계에 벤치마크가 매우 많다는 점입니다. OpenAI는 이번에 8가지 유형의 벤치마크를 인용했고, Google은 Gemini 3에서 약 20가지 벤치마크를 인용했습니다. 이는 우리에게 유연성을 제공합니다. 즉, 우리가 보유한 벤치마크 데이터 중 가장 적합한 데이터만 포함하고 나머지는 제외할 수 있습니다.

하지만 위 표를 선 그래프로 변환해 보면, 여러 벤치마크 테스트에서 OpenAI가 새로 출시한 GPT-5.2를 사용하는 다양한 회사의 최첨단 모델 간의 차이가 크지 않다는 것을 명확히 알 수 있습니다.

인공지능 경쟁은 오픈AI의 공룡기업 에서 여러 거대 기업들 간의 혼란스러운 싸움으로 진화했다고 할 수 있습니다.

뉴욕 타임스 역시 이러한 견해를 언급하며, 업계 전문가들의 관점 을 인용해 "오픈AI의 소위 AI 기초 모델과 다른 회사들의 모델 간의 기술적 격차가 사실상 사라졌다"고 보도했습니다.

벤치마크 테스트가 직관적이지 않다면 구체적인 예시를 살펴볼 수 있습니다. 아래 왼쪽 이미지는 OpenAI에서 제공하는 "파동 시뮬레이터" 웹페이지이고, 오른쪽 이미지는 동일한 입력값을 사용하여 Gemini에서 생성한 페이지입니다. 일반적으로 각각 장점이 있습니다.

앞서 언급했듯이, 경쟁사들의 끊임없는 압력으로 인해 울트라맨은 회사 내부에 "적색 경보"를 발령했습니다.

GPT 5.2와 동급 제품들 간의 격차를 고려할 때, 제품 및 모델 수준에서의 "적색 경보"가 단기간에 해소되지는 않을 것으로 예상됩니다.

이 문제와 관련하여 알트만이 영입한 애플리케이션 업무 CEO인 피지 시모는 "적색 경보는 회사가 특정 영역에 자원을 집중해야 한다는 신호이며, 우선순위를 정하는 방법입니다."라고 말했습니다.

요점은 적색 경보가 생사를 가르는 상황이 아니라, 경영진이 결의를 보여주고 방향을 제시하는 방식이라는 것입니다. 실제로 GPT-5.2는 몇 달 동안 개발 중이었으며, 단지 이 시점에 공개된 것뿐입니다.

문제는 회사의 존폐가 걸린 상황에서, 그다지 경쟁력 있는 이점을 제공하지 못하는 GPT-5.2 외에 울트라맨에게 그보다 더 빠른 무기가 있느냐는 것입니다.

물론, 내부적으로 경보를 울리는 것에 비하면 울트라맨의 외부적인 행동은 상당히 차분하다.

CNBC와의 인터뷰에서 그는 조심스러운 낙관론을 표명하며 "제미니 3호가 우리 업무 지표에 미치는 영향은 예상보다 작을 것"이라고 말했다. 그는 오픈AI가 2026년 1월에 "매우 견고한 입지"를 확보한 상태에서 "적색 경보" 단계를 해제할 것이라고 예측했다.

02 10년 동안 이어져 온 꿈인가, 아니면 10년 동안 10개의 꿈을 이룬 것인가?

OpenAI가 창립 10주년을 맞아 공식 웹사이트에서 회사의 시작과 미래를 소개하는 영상을 공개했습니다.

10년 전, 머스크가 오픈AI 프로젝트에 활발히 참여하던 시절, 젠슨 황은 오픈AI에 세계 최초의 DGX-1 서버를 기증했습니다. 여러 유명 인사들이 서버에 서명을 남겼고, 배경 벽에는 "핵심 질문은 우리가 무엇을 아느냐가 아니라, 우리가 아는 것을 어떻게 활용하느냐이다... 나는 우리 각자가 마치 온 세상의 운명이 우리 어깨에 달린 것처럼 행동해야 할 책임이 있다고 믿는다"라는 문구가 적혀 있었습니다 .

지난 10년간 OpenAI는 ChatGPT와 Sora 같은 획기적인 제품들을 세상에 선보였습니다. 울트라맨은 전 세계를 누비며 실리콘밸리의 여러 거대 기업들과 협력하여 컴퓨팅 해시레이트 제공해 왔습니다. 그러나 시간이 흐르면서 OpenAI는 초기에 누렸던 상당한 우위를 따라잡거나 심지어 경쟁사들에게 추월당하는 상황에 놓였습니다.

OpenAI는 현재 불확실성의 기로에 서 있습니다.

오픈AI는 초창기에 "재정적 수익 창출의 필요성에 얽매이지 않고 인류 전체에 가장 이익이 될 가능성이 높은 방식으로 디지털 지능을 발전시키는 것"을 목표로 한다고 주장했습니다.

스태퍼드셔 대학교의 AI 윤리학자인 캐서린 플릭은 이러한 창립 원칙이 극적으로 변화했다고 강조했습니다. 그 이유는 오픈AI의 복잡한 아키텍처 뒤에는 복잡하게 얽힌 이해관계를 가진 영리 기업이 존재하기 때문입니다.

플릭은 "현재 우리는 사회적 이익에 대한 모든 책임을 완전히 회피하고 무슨 수를 써서라도 성장을 추구한다는 신념을 받아들인 영리 기업을 갖게 되었습니다."라고 말하며, 오픈AI는 "돈을 벌 수 있는" 생성형 AI 혁명의 최전선에 있다고 설명했습니다.

비상사태 속에서 OpenAI의 최우선 과제는 제품 경험 개선이며, 상용화는 후순위로 밀려났습니다. 이는 생존과 직결되는 문제일 뿐만 아니라, 10년 안에 실현될지도 모르는 울트라맨의 더 큰 이상, 즉 초지능과도 관련이 있기 때문입니다. 하지만 이러한 비전은 OpenAI 내부에서 절대적인 합의를 이루고 있는 것은 아닙니다.

03 상업화와 거버넌스 간의 갈등

기술 경쟁의 이면에는 오픈AI가 상업화하고 수익을 창출해야 한다는 엄청난 압력이 자리 잡고 있습니다.

알트만은 오픈AI의 목표가 2025년 말까지 연간 200억 달러에 해당하는 월 매출을 달성하는 것이라고 밝혔지만, 전반적인 수익성을 달성하기까지는 "아직 갈 길이 멀다"고 인정했습니다.

더욱 주목할 만한 점은 OpenAI가 인공지능 관련 목표를 달성하기 위해 향후 몇 년 동안 컴퓨팅 인프라에 최대 1조 4천억 달러를 투자하겠다고 약속한 것 입니다.

시장조사기관 센서타워의 최신 데이터에 따르면, ChatGPT의 전 세계 월간 활성 사용자 수는 2025년 11월에 8억 1천만 명에 달할 것으로 예상됩니다. 8월부터 11월까지의 성장률은 6%에 그쳐, 2024년 같은 기간의 40% 이상 성장률에 크게 못 미쳤습니다. 또한, 글로벌 점유율 역시 4개월 만에 38%에서 35%로 하락했습니다.

현재 ChatGPT는 OpenAI의 주요 수익원입니다. 주간 활성 사용자 8억 명 이상 중 약 6%가 월 20달러의 프리미엄 서비스 비용을 지불하고 있습니다.

OpenAI는 무료 사용자로부터 더 많은 가치를 창출하기 위해 노력하고 있으며, ChatGPT에 광고를 도입하거나 수익 공유 모델(예: 사용자가 챗봇을 통해 쇼핑할 때 OpenAI가 수수료를 받는 방식)을 개발하는 등의 방향을 모색하고 있습니다 .

시모는 또한 오픈아이얼이 '성인 모드'(성인 콘텐츠를 허용할 수 있는 모드) 출시 전에 청소년 보호를 위해 사용자 연령 예측 기능을 도입할 계획이라고 확인했습니다 . '성인 모드'는 내년 1분기에 출시될 예정입니다.

동시에 오픈AI는 기업용 소프트웨어 시장으로 적극적으로 진출하여 소비자 및 기업 모두를 위한 서비스를 제공하는 기업으로 자리매김하고 있습니다. 코딩, 법률, 금융 등 전문 분야에서 GPT-5.2의 성능 향상은 바로 이러한 고부가가치 기업 고객 유치를 위한 것입니다.

하지만 이 시장에서 OpenAI는 Google Workspace 및 Microsoft 365와 같은 성숙한 오피스 소프트웨어 생태계에 AI 도구를 심층적으로 통합할 수 있는 Google 및 Microsoft와 같은 거대 기업들과 치열한 경쟁 대면 할 것입니다.

수익성은 오픈AI가 인류를 돕는다는 숭고한 이상을 지속하기 위한 자금 조달을 원활하게 하는 데 도움이 될 수 있지만, 이 과정은 일련의 보안 및 윤리적 문제도 야기할 것입니다.

GPT-5.2 출시 직전, 오픈AI는 ChatGPT가 정신적으로 고통받는 사용자와 상호 작용한 것이 코네티컷에서 발생한 살인-자살 비극에 간접적으로 영향을 미쳤다는 주장을 담은 새로운 소송에 직면했습니다. 이러한 소송은 이번이 처음이 아니라는 점에 주목할 필요가 있습니다.

OpenAI는 이번 사건이 "가슴 아픈 일"이라고 밝히며, 심리적 고통의 징후를 식별하고 대응하는 시스템의 기능을 지속적으로 개선하여 사용자들이 실질적인 도움을 받을 수 있도록 안내하겠다고 약속했습니다.

더욱이, 뉴욕 타임스 기소하다 AI 학습 데이터의 합법성이라는 근본적인 업계 과제를 부각시키고 있습니다.

04. 구글과의 패권 경쟁

오픈아이얼과 구글 간의 경쟁은 단순한 기술적 매개변수 비교를 넘어 기술 혁신, 생태계 구축, 비즈니스 모델, 보안 관리, 자본 지속 가능성 등을 아우르는 포괄적인 전쟁으로 발전해 왔습니다.

기술적인 측면에서 벤치마크 테스트 최고 자리를 차지하기 위한 경쟁은 점점 더 치열해지고 있습니다.

오픈AI의 연구 부사장인 에이단 클라크는 GPT-5.2의 구체적인 학습 성과에 대해서는 공개하지 않았지만, 사전 학습과 같은 기본적인 측면에서 지속적인 개선이 이루어지고 있다고 언급하며, 사전 학습의 잠재력이 이미 소진되었는지에 대한 업계의 우려에 대해 해명했습니다.

생태계 차원에서 OpenAI는 구글 크롬에 도전하고 기초 모델부터 상위 애플리케이션에 이르기까지 완전한 폐쇄형 생태계를 구축하기 위해 자체 브라우저를 출시했습니다 . 반면 구글은 방대한 기존 제품 포트폴리오를 활용하여 통합을 통해 시너지 효과를 창출하고자 합니다.

AI 모델 평가 플랫폼인 LMARaena의 웨이린 치앙은 "일반 모델의 사용자 증가가 병목 현상에 도달했으며, 차세대 성장 동력은 필연적으로 특정 분야에서 나올 것"이라고 지적했다.

그는 또한 현재 경쟁의 핵심은 더 이상 단순히 사용자 확보에 있는 것이 아니라, 의료 및 금융과 같은 핵심 산업에서 신뢰할 수 있고 효율적인 솔루션을 구축하는 데 주도권을 잡고 기술 역량을 산업적 가치로 전환하는 것을 진정으로 실현할 수 있는 기업이 누구인지에 달려 있다고 강조했습니다.

마지막으로, 전략적 및 문화적 차원에서 OpenAI가 비영리 연구 기관에서 고가치 상업 기업으로 빠르게 변모하고 수익성을 시급히 추구함에 따라 내부 문화가 재편되고 있습니다. 초기 직원들이 한때 자부심을 느꼈던 부분, 즉 구글과 같은 광고 중심 모델과의 차이점들이 현실의 압력 속에서 점차 모호해지고 있습니다.

"이 경쟁은 여러 전선에서 펼쳐질 것입니다." 최신 AI 기술의 성능을 추적하는 회사인 Vals AI의 CEO 라잔 크리슈난의 이 말은 현재 AI 패권을 둘러싼 경쟁의 복잡성을 적절하게 요약하고 있습니다.

전반적으로 GPT-5.2의 출시는 오픈AI가 해당 분야에서 강력한 기술적 선언을 한 것이지만, 이것으로 끝이 아닙니다. 경쟁사와의 격차를 크게 벌리는 데는 실패했으며, 오픈AI 스스로도 2026년 1월까지는 경종이 꺼지지 않을 것이라고 말하고 있습니다. 더 중요한 것은, 단기적으로 "적색 경보"가 일시적으로 해제될 수 있다 하더라도, AI 산업 전체에서 최고 수준의 경쟁 경보가 이미 울리고 있다는 점입니다.

이 글은 위챗 공식 계정 "텐센트 테크놀로지" 에 게재된 글이며, 작성자는 쑤양무지이고, 36Kr의 허가를 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
75
즐겨찾기에 추가
15
코멘트