웬신 4.5 터보 출시, 로빈 리, 애플리케이션이 왕이라고 주장

이 기사는 기계로 번역되었습니다
원문 표시
바이두는 개발자들이 MCP를 완벽하게 활용할 수 있도록 두 가지 새로운 모델과 다양한 AI 애플리케이션을 출시했습니다.

헤더 이미지 출처: 바이두

2025년, AI 기술의 반복 속도가 예상보다 훨씬 빨라지면서 개발자와 기업이 직면한 핵심 과제는 다음과 같습니다. 모델 기능이 급격히 발전할 때 기술의 물결에 의해 애플리케이션 가치가 압도되는 것을 어떻게 방지할 수 있을까요?

바이두는 4월 25일 크리에이트 개발자 컨퍼런스에서 이에 대한 해답을 제시했습니다. 이 컨퍼런스에서 웬신 빅 모델 4.5 터보와 X1 터보가 공식 공개되었고, 창저우 OS 콘텐츠 필드 운영체제가 동시에 출시되었으며, 일반 슈퍼 지능 바디 앱 '신샹'도 출시되었습니다. 바이두는 기술 혁신을 보여주는 동시에, 시나리오 기반 애플리케이션과 MCP(모델 컨텍스트 프로토콜) 생태계의 포괄적인 레이아웃을 통해 AI 가치 실현에 대한 업계의 간절한 기대에 부응했습니다.

로빈 리는 이 행사에서 개발자들에게 "적절한 시나리오를 찾고, 올바른 기본 모델을 선택하고, 때로는 모델을 조정하는 방법을 배우면, 이를 기반으로 만드는 애플리케이션은 쓸모없어지지 않을 것입니다."라고 말했습니다. 그는 "애플리케이션이 없다면 칩과 모델은 무용지물입니다. 모델은 많겠지만, 미래에는 애플리케이션이 세상을 지배할 것입니다. 애플리케이션이 바로 왕입니다."라고 강조했습니다.

웬신 빅 모델 4.5 터보: 멀티모달, 저비용, 강력한 추론

현재 대규모 AI 모델에 대한 경쟁은 치열한 단계에 접어들었지만, 단일 모달리티, 추론적 환상, 높은 운영 비용 등의 문제가 여전히 업계를 괴롭히고 있습니다. 이러한 문제점을 해결하기 위해 바이두는 멀티모달 기능, 낮은 비용, 강력한 추론을 핵심 특징으로 하는 웬신 빅 모델 4.5 터보와 X1 터보를 출시하여 기술과 비용 효율성의 균형을 보여주었습니다.

Wenxin 4.5 Turbo는 멀티모달 기능에서 더욱 획기적인 발전을 이루었으며, 속도가 더 빠르고 가격이 훨씬 저렴합니다. 백만 토큰당 입력 가격은 단 0.8위안에 불과하고 출력 가격은 3.2위안으로 DeepSeek-V3보다 40% 저렴합니다. 다양한 벤치마크 테스트에서 4.5 Turbo는 평균 77.68점을 기록하며 GPT-4o의 72.76점을 뛰어넘어 경쟁력을 입증했습니다. X1 터보는 한 단계 더 나아갑니다. 4.5 Turbo의 딥싱크 최적화를 기반으로 토큰 100만개당 1위안을 입력하여 4위안을 출력하는데, 이는 DeepSeek-R1의 25%에 불과합니다. 질문과 답변, 창조, 논리적 추론, 도구 호출과 같은 시나리오를 선도합니다.

리옌훙은 현장에서 이렇게 말했습니다. "모델은 빠르게 반복되지만, 애플리케이션 가치는 충분히 보장되지 않습니다. 적절한 시나리오를 찾고, 적절한 모델을 선택하고, 튜닝을 효과적으로 활용한다면 AI 애플리케이션은 지속적으로 가치를 창출할 수 있습니다." 이러한 관점 개발자들에게 큰 도움이 되었습니다. 대규모 모델의 진정한 가치는 시나리오와의 긴밀한 통합에 있습니다.

웬신(Wenxin) 모델이 바이두 AI의 '심장'이라면, 새로 출시된 창저우 OS는 콘텐츠와 애플리케이션을 연결하는 '신경계'입니다. 창저우 OS는 콘텐츠 운영체제로서 Chatfile Plus를 핵심으로 하여, 퍼블릭 도메인 지식 베이스, 프라이빗 도메인 지식 베이스, 메모리 베이스의 "3개 라이브러리"와 리더, 에디터, 플레이어의 "3개 장치"를 통합하고, 대규모 모델의 동적 호출을 통해 멀티모달 콘텐츠의 분석 및 처리를 실현합니다.

창저우 OS |이미지 출처: 바이두

바이두 웬쿠와 바이두 넷디스크는 창저우 OS를 기반으로 'AI 노트' 기능을 공동 출시했습니다. 사용자가 클라우드 디스크에서 비디오를 시청할 때, 한 번의 클릭으로 비디오 콘텐츠를 기반으로 구조화된 노트, AI 마인드 맵을 생성하고, 심지어 시험 문제도 생성할 수 있어 비디오와 노트를 원활하게 연결할 수 있습니다. 현재 바이두 원쿠 AI 기능의 유료 사용자 수는 4,000만 명을 돌파하였고, 월간 활성 AI 사용자 수는 9,700만 명에 달했습니다. 바이두 넷디스크의 월간 활성 AI 사용자 수가 8,000만 명을 넘어섰습니다. 이 데이터는 창저우 OS의 생산성을 반영할 뿐만 아니라, 콘텐츠 분야에서 AI 응용 프로그램의 엄청난 잠재력을 보여줍니다.

멀티모달 기능을 활용한 또 다른 사례로는 바이두가 출시한 '매우 설득력 있는 디지털 인간'이 있습니다. 전자상거래 라이브 스트리밍 시나리오에서 기존의 디지털 인간은 종종 지루한 카피라이터와 뻣뻣한 움직임을 보이는 반면, 바이두의 설득력 있는 디지털 인간은 멀티모달 대형 모델을 통해 매우 사실적인 음성과 이미지, 전문적인 콘텐츠, 유연한 상호 작용을 구현합니다. "대본 생성" 기능은 대사에 따라 실시간으로 표정, 톤, 동작을 조정할 수 있으며, "AI 두뇌"는 생방송실의 인기도에 따라 보조, 현장 컨트롤러 등의 역할을 동적으로 배치하여 "1인 1팀"이라는 진정한 의미를 실현했습니다. 바이두 후이복싱 플랫폼도 '원클릭 클로닝' 기능을 출시했습니다. 이를 통해 사용자는 2분 분량의 동영상만 업로드하면 자신만의 디지털 인물을 생성할 수 있으며, '누구나 앵커가 될 수 있다'는 말이 현실이 되었습니다.

지능형 에이전트와 MCP: AI 애플리케이션의 생태계 엔진을 활성화하세요

에이전트(지능형 신체)가 업계의 이슈 되고 있는 가운데, 바이두도 '신샹' 앱을 출시해 이 전장에 뛰어들었다.

Xinxiang은 "AI 작업 완료 엔진"을 핵심으로 하는 제품으로, 자연어 상호작용을 통해 복잡한 작업의 분해, 실행 및 결과 제공을 실현합니다. 현재 신샹은 심층 연구, 스마트 차트, 게임 개발 등 10대 주요 시나리오에서 200개 이상의 작업을 수행했으며, 앞으로 10만 개 이상으로 확장할 계획입니다.

Xinxiang은 "다중 에이전트 협업" 메커니즘을 지원합니다. 건강 상담 시나리오에서 시스템은 여러 개의 "의사 AI 클론"을 파견하여 공동 상담을 진행할 수 있습니다. 법률 서비스 분야에서는 "변호사 싱크탱크"가 협력해 대응할 예정이다. 이 메커니즘은 기존 도구 호출의 한계를 돌파하고 전문적인 시나리오에 대해 더욱 효율적인 솔루션을 제공합니다. 신샹의 무료 오픈과 안드로이드 버전 출시(iOS 버전도 곧 출시 예정)를 통해 더 많은 사용자가 AI 지능형 에이전트의 매력을 체험할 수 있게 될 것입니다.

다중 에이전트 협업의 잠재력은 바이두가 작년에 출시한 코드 없는 프로그래밍 도구인 "미아오다"에도 반영되어 있습니다. "MiaoDa"는 단 한 문장으로 애플리케이션을 생성할 수 있습니다. 제품 관리자, 건축가, 디자이너 등 여러 지능형 엔터티와 협업하고 클라우드 스토리지, 데이터베이스, 지도 탐색 등의 도구 구성 요소를 활용합니다. 대학생 팀은 미아오다를 사용하여 몇 분 만에 일주일이 걸리던 마케팅 도구를 개발했고, 모델 호출 수수료는 단 5위안에 불과했습니다.

리옌훙은 "세계 인구는 80억 명입니다. 기술 장벽이 사라지면 누구나 프로그래머의 역량을 갖추게 될 것입니다."라고 말했습니다. "미아오다"가 사회 전반에 개방되면서 AI 응용 프로그램의 발전 문턱이 더욱 낮아졌습니다.

AI 생태계의 새로운 트렌드인 MCP(Model Context Protocol)는 개발자가 대규모 모델과 상호 작용하는 방식을 바꾸고 있습니다. 이 컨퍼런스에서 바이두는 MCP를 전면적으로 수용하고, 세계 최초의 전자상거래 MCP를 출시하고, MCP 및 기타 서비스를 검색하고, MCP 작업 계획 및 스케줄링에서 웬신 모델의 역량을 최적화할 것이라고 발표했습니다.

동시에, 바이두 스마트 클라우드 전판 플랫폼은 MCP와의 호환성을 선도하여 개발자가 MCP 서버를 만들고 게시할 수 있도록 지원합니다. Baidu 검색은 전체 네트워크에서 고품질 서비스를 색인화하기 위해 MCP 서버 검색 플랫폼을 구축했습니다. Wenxin Kuai Code는 MCP 서버를 지원하는 중국 최초의 지능형 코딩 어시스턴트가 되었습니다. 또한, 바이두 웬쿠, 클라우드 디스크, 지도 등의 애플리케이션도 MCP 서버 서비스를 전면 개방했습니다. 바이두 전자상거래가 출시한 MCP 서비스는 상품 검색, 거래, 매개변수 비교 등의 기능을 포함하며, 중국에서 최초로 전자상거래 거래를 지원하는 MCP 서비스가 되었습니다. 이러한 일련의 조치는 개발자의 접근 임계값을 낮추는 것뿐만 아니라 MCP 생태계의 번영에 새로운 활력을 불어넣습니다.

바이두 '원신컵' 창업 경진대회 개최 | 이미지 출처: 바이두

바이두는 기술 및 제품 혁신 외에도 AI 인재 교육과 기업가 지원에 많은 투자를 했습니다. 5년 전 제안된 500만 명의 AI 인재 계획이 예정보다 일찍 완료되었습니다. 로빈 리는 회의에서 바이두가 향후 5년 내에 1,000만 명의 AI 인재를 추가로 양성할 것이라고 발표했습니다. 또한, 제3회 '원신컵' 창업경진대회에서는 단일 프로젝트의 최대 투자금액을 7,000만 위안으로 늘려 창업가들에게 더 강력한 지원을 제공할 예정입니다.

하드웨어 측면에서 바이두는 중국 최초로 완전 자체 개발한 3만 카드 클러스터를 출시했습니다. 이는 수천억 개의 매개변수를 가진 여러 대형 모델의 학습을 동시에 수행할 수 있으며, 1,000명의 고객이 수십억 개의 매개변수를 가진 모델을 미세 조정할 수 있도록 지원합니다. 이 클러스터는 고성능 네트워크와 혁신적인 방열 솔루션을 통해 훈련 과제의 안정성과 에너지 효율성을 보장합니다.

바이두가 이번에 공개한 기술 매트릭스는 AI 발전의 세 가지 주요 추세를 보여준다. 멀티모달리티가 기본 역량으로 자리잡음(원신대형모델), 지능형 바디가 인간과 컴퓨터 협업을 재구성함(신샹앱), MCP 프로토콜이 서비스 인터페이스를 통일함(바이두 MCP 생태계)이다. 모델 성능이 임계값을 초과하고, 도구 호출이 표준화되고, 해시레이트 비용이 계속해서 감소하면 AI 응용 프로그램의 새로운 시대가 다가옵니다. 로빈 리가 말했듯이, "상황에 침투하여 실질적인 가치를 제공할 수 있는 AI 애플리케이션은 개발자에게 진정한 기회입니다."

로빈 리는 이 행사에서 "이 모든 릴리스는 개발자가 모델 기능, 모델 비용, 개발 도구 및 플랫폼에 대해 걱정하지 않고 애플리케이션 작업을 수행하고 최상의 애플리케이션을 만들 수 있도록 설계되었습니다."라고 말했습니다.

국내 AI 산업에 있어서 바이두의 이러한 일련의 행동은 단순히 기술력을 보여주는 것이 아니라 시나리오 기반 응용 프로그램과 생태적 시너지에 대한 심오한 통찰력을 보여주는 것이기도 합니다. 이러한 변화 속에서 바이두는 기술 혁신과 생태계 구축을 통해 개발자를 위한 모델에서 애플리케이션으로 이어지는 "고속도로"를 만들고 있습니다. Wenxin Big Model, Cangzhou OS, Xinxiang의 지속적인 개선을 통해 AI의 "초고생산성"이 모든 사람의 업무와 삶에 더욱 빠르게 통합될 수 있습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트