Odaily 오데일리 (Odaily) 오픈 소스 AI 연구소인 Sentient가 전 세계 AI 개발자들이 기업 수준의 AI 에이전트의 추론 기능을 스트레스 테스트하고 경쟁적으로 개선할 수 있는 실시간 운영 환경인 Arena를 공식 출시했습니다. 초기 참여 기업으로는 Founders Fund, Pantera, Franklin Templeton(운용 자산 1조 5천억 달러 이상), alphaXiv, Fireworks, OpenHands, OpenRouter 등이 있습니다.
Arena는 불완전한 정보, 장황한 맥락, 모호한 지침, 상충되는 출처 등 기업 워크플로의 실제 시나리오를 시뮬레이션하고, 전체 추론 과정을 기록하여 엔지니어링 팀이 실패 원인을 정확히 파악할 수 있도록 지원합니다. 첫 번째 과제는 문서 추론에 초점을 맞추어 AI 에이전트가 복잡한 비정형 데이터에 대한 추론 및 연산을 수행하도록 요구합니다.
프랭클린 템플턴 디지털 자산의 매니징 파트너인 줄리안 러브는 아레나와 같은 구조화된 환경이 업계에서 "잠재적인 아이디어"와 "실제로 프로덕션 환경에서 사용할 수 있는 기능"을 구분하는 데 도움이 될 것이라고 말했습니다. 센티언트의 공동 창립자인 히만슈 티야기는 기업들이 프로덕션 환경에서 에이전트 추론의 안정성과 반복성을 검증해야 한다고 강조했습니다. 아레나는 전 세계적으로 출시될 예정이며, 2026년 3월부터 샌프란시스코에서 오프라인 행사를 개최할 계획입니다.


