바이트가 AI 에이전트 가속 키를 누릅니다.

이 기사는 기계로 번역되었습니다
원문 표시
2025년 초 DeepSeek와 Manus의 충격을 겪은 후, 대기업들은 자신들의 다음 전략을 다시 명확히 하고 있습니다.

작성자: 완첸

DeepSeek-R1의 뛰어난 문체, GPT-4o의 지브리 스타일, OpenAI o3의 이미지 기반 지리 위치 추론...

이는 지난 두 달간 계속해서 화제가 된 현상적 AI 제품들로, 강화 학습이 마침내 일반화될 수 있게 되었고 멀티모달 모델도 점점 더 사용 가능해졌음을 분명히 볼 수 있습니다. 이는 2025년이 진정으로 AI 에이전트 애플리케이션의 적용 및 가속화 시점에 진입했음을 의미합니다.

[이하 생략]

현재는 문제를 정의하는 능력을 겨루고 있습니다. 다시 말해, AI는 현실 생활에서 어떤 문제를 해결할 것인가입니다?

2025년, 그 답은 생산성 에이전트입니다. 현재 AI의 응용 시나리오는 에이전틱 AI 시대로 빠르게 진입하고 있으며, AI는 점차 전문성이 높고 시간이 오래 걸리는 완전한 작업을 수행할 수 있게 됩니다. 이러한 상황에서 화산 엔진은 기업을 위해 "자체 범용 에이전트 정의"를 위한 일련의 기반 시설을 구축했습니다.

그중 가장 중요한 것은 모델로, 자율적으로 계획하고 성찰하며 엔드투엔드로 자율적인 의사결정과 실행을 할 수 있어 핵심 생산 단계로 나아갈 수 있습니다. 동시에 다중 모달 추론 능력도 필요하여 실제 세계에서 귀, 입, 눈을 통해 함께 작업을 완료할 수 있습니다.

모델 외에도 인프라 기술 스택도 지속적으로 진화해야 합니다. 예를 들어 MoE 아키텍처가 더 높은 효율성을 보이며 점차 모델의 주류 아키텍처가 되면서, MoE 모델에 맞는 스케줄링을 위해 더 복잡하고 유연한 클라우드 컴퓨팅 아키텍처와 도구가 필요해집니다.

현재 기업 범용 에이전트 시나리오에서 화산 엔진은 더 나은 아키텍처와 도구인 OS 에이전트 솔루션을 출시했습니다. 이는 대규모 모델이 디지털 및 물리적 세계를 조작할 수 있도록 지원하며, 예를 들어 에이전트가 브라우저를 조작하고 상품 페이지를 검색하여 iPhone 가격을 비교하는 작업을 수행하거나, 심지어 원격 컴퓨터에서 Capcut으로 비디오 편집 및 음악 추가 등을 수행할 수 있습니다.

현재 화산 엔진 OS 에이전트 솔루션은 두바오 UI-TARS 모델과 veFaaS 함수 서비스, 클라우드 서버, 클라우드 휴대폰 등의 제품을 포함하여 코드, 브라우저, 컴퓨터, 휴대폰 및 기타 에이전트를 조작할 수 있습니다. 그중 두바오 UI-TARS 모델은 화면 시각적 이해, 논리적 추론, 인터페이스 요소 위치 지정 및 조작을 통합하여 기존 자동화 도구의 사전 설정 규칙 의존성의 한계를 극복하고, 에이전트의 지능형 상호작용을 위해 인간 조작에 더 가까운 모델 기반을 제공합니다.

범용 에이전트 시나리오에서 화산 엔진은 이 OS 에이전트 솔루션을 통해 기업 내부, 개인 또는 특정 영역에서 필요에 따라 에이전트를 정의하고 탐색할 수 있게 합니다.

수직 에이전트 분야에서 화산 엔진은 자체 강점 영역을 기반으로 탐색할 것입니다. 예를 들어 이전에 출시한 "지능형 프로그래밍 어시스턴트 Trae"와 데이터 제품 "데이터 에이전트"가 있으며, 후자는 데이터 플라이휠을 구축하여 데이터 처리 능력을 최대한 발휘합니다.

다른 한편으로, 에이전트의 침투로 인해 더 많은 모델 추론 소비가 발생할 것입니다. 대규모 추론 수요에 직면하여 화산 엔진은 특별히 AI 클라우드 네이티브 ServingKit 추론 스위트를 제작하여 모델 배포를 더 빠르게 하고 추론 비용을 더 낮추며, GPU 소비를 기존 솔루션 대비 80% 감소시켰습니다.

탄 대기의 관점에서 AI 시대의 수요를 충족시키기 위해 화산 엔진은 세 가지 측면에서 지속적으로 노력할 것입니다: 모델을 지속적으로 최적화하여 경쟁력 유지; 비용, 지연 시간을 지속적으로 낮추고 처리량 향상; 제품의 구현을 더 쉽게 만들기. 예를 들어 개발자를 위한 도구인 버튼, HiAgent, 클라우드 네이티브 구성 요소 OS 에이전트 등입니다. 제품과 기술의 선도를 유지하면 시장 점유율도 선도할 것입니다. 이전 IDC가 발표한 '중국 공용 클라우드 대규모 모델 서비스 시장 구도 분석, 1Q25'에 따르면 화산 엔진은 46.4%의 시장 점유율로 1위를 차지했습니다.

작년 12월, 두바오 대규모 모델의 일일 평균 토큰 호출량은 4조였습니다. 올해 3월 말 현재 이 수치는 12.7조를 넘어섰으며, 두바오 대규모 모델이 처음 출시되었을 때와 비교해 짧은 1년 미만의 기간 동안 106배 이상의 고속 성장을 달성했습니다. 앞으로 심층 사고 모델, 시각적 추론의 더욱 성숙과 AI 클라우드 기반 시설의 최적화에 따라 에이전트는 더 큰 토큰 호출량을 견인할 것입니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트