바이두의 새로운 AI는 이미 최고의 모델들을 능가하며 개발 비용은 94% 더 저렴합니다.

avatar
Decrypt
05-12
이 기사는 기계로 번역되었습니다
원문 표시

중국판 구글인 바이두는 지난주 말 ERNIE 5.1을 공식 출시했는데 , 가장 주목할 만한 수치는 바로 동일한 규모의 AI 시스템보다 학습 비용이 약 94% 절감되었다는 점입니다.

이를 이해하기 쉽게 설명하자면, 최첨단 AI 모델을 훈련하는 데에는 일반적으로 수백만 달러 (심지어 수십억 달러)에 달하는 컴퓨팅 비용이 소요됩니다. 중국 검색 시장의 76% 이상을 점유하고 나스닥에 BIDU라는 종목 코드로 상장된 바이두는 그 비용의 약 20분의 1만으로 동일한 수준의 성능을 달성했다고 주장합니다.

이 비결은 "다차원 탄력적 사전 학습"이라고 불립니다. 바이두는 ERNIE 5.1을 처음부터 다시 구축하는 대신, 2026년 1월에 출시한 기존 ERNIE 5.0 아키텍처에서 최적화된 하위 네트워크를 추출하여 압축했습니다. 전체 파라미터 수는 원래의 약 3분의 1로 줄었고, 활성 파라미터(실제로 대화 중에 작동하는 파라미터)는 절반으로 줄였습니다. 그 결과, 전체 학습 과정을 반복하지 않고도 더 큰 부모 모델의 지식 기반을 계승하는 더욱 효율적인 모델이 탄생했습니다.

실제 사용자들이 웹 검색 작업에서 AI 모델들을 비교하고 선호도를 바탕으로 점수를 매기는 리더보드인 LMArena Search Arena에서 ERNIE 5.1은 1,223점을 기록하며 전 세계 4위, 중국 모델 중에서는 1위를 차지했습니다. 스프레드시트 작성이나 웹 자율 탐색과 같은 여러 단계를 거치는 작업을 처리하는 에이전트 기능에서 ERNIE 5.1은 이전 중국 벤치마크 모델이었던 DeepSeek-V4-Pro를 능가했습니다.

서구권 사람들에게는 어니(ERNIE)라는 이름이 생소하게 들릴지 모르지만, 사실 중국에서는 아주 유명한 모델입니다. 바이두는 2023년 8월에 어니봇을 출시했고, 그해 12월까지 중국에서 사용자 1억 명을 돌파했습니다 . 이는 대부분의 중국 경쟁사보다 빠른 속도였지만, 전 세계적으로 2개월 만에 같은 기록을 달성한 ChatGPT보다는 느린 속도였습니다.

효율성 측면은 2025년 1월 딥시크(DeepSeek)가 AI 업계에 일으켰던 파장을 떠올리게 합니다. 당시 중국 스타트업 딥시크는 오픈아이얼(OpenAI)의 o1 모델과 동일한 성능을 내면서도 쿼리 비용은 98%나 낮은 R1 모델을 공개했습니다. 이 소식은 엔비디아(Nvidia)의 시가총액을 6천억 달러나 급락시켰고, 모든 주요 AI 연구소들이 단순히 컴퓨팅 자원을 투입하는 것이 문제 해결의 유일한 전략인지 재고하게 만들었습니다. ERNIE 5.1은 추론이 아닌 학습 측면에서의 효율성이라는 점에서 차이가 있지만, 근본적인 메시지는 동일합니다. 중국 연구소들이 적은 자원으로 더 많은 것을 해내는 방법을 끊임없이 찾아내고 있다는 것입니다.

학습 후 파이프라인 또한 주목할 만합니다. 바이두는 MOPD(Multi-Teacher On-Policy Distillation)라고 부르는 4단계 강화 학습 시스템을 구축했습니다. 모든 기술을 한 번에 가르치려고 하면 수학 실력 향상이 창의적 글쓰기 실력 저하로 이어지는 "시소 효과"가 발생하기 쉬운데, 바이두는 코딩, 추론, 에이전트 작업 등 각 분야에 특화된 전문가 모델을 병렬로 학습시킨 후, 이 모든 모델을 하나의 통합 모델로 정제했습니다. 마지막 온라인 강화 학습 단계에서는 자유로운 대화와 창의적 결과물을 처리하여 정제 과정에서 제대로 포착하지 못했던 부분까지 보존했습니다.

이론적으로는 모든 기술이 숙련도 측면에서 동등하게 평가되어야 하며, 어느 한 기술이 다른 기술보다 우선시되어서는 안 된다는 것을 의미합니다.

GPQA(Graduate-Level Google-Proof Q&A, 구글 검색으로 찾을 수 없는 전문가 수준의 과학 질문에 모델이 답할 수 있는지 측정하는 벤치마크)에서 ERNIE 5.1은 서구의 주요 폐쇄형 소스 모델들의 성능에 근접했습니다. 2026년 미국 수학 경시대회(AIME26, 경쟁 환경에서 고급 문제 해결 능력을 평가하는 시험)에서는 도구 지원 추론을 사용했을 때 99.6%의 정확도를 기록하며 제미니(Gemini) 3.1 Pro에 이어 두 번째로 높은 점수를 받았습니다.

바이두는 ERNIE 5.1이 AI 역할극 플랫폼과 숏 드라마 제작 도구를 포함한 중국 내 10개 이상의 창작 및 에이전트 플랫폼에 이미 배포되고 있다고 밝혔습니다. 이 모델은 ernie.baidu.com 에서 접속하거나 바이두 AI 클라우드 플랫폼의 API를 통해 이용할 수 있습니다.

바이두는 오는 5월 13일부터 14일까지 베이징에서 연례 개발자 컨퍼런스인 '크리에이트 2026'을 개최하고, 이 자리에서 ERNIE의 최신 산업용 애플리케이션을 선보일 예정입니다. 이번 행사는 바이두가 ERNIE 모델을 기업 및 글로벌 시장에 얼마나 적극적으로 진출시킬 계획인지를 보여주는 중요한 지표가 될 것입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트