StepAudio 2.5, 음성 AI 벤치마크 테스트 5개 부문에서 1위 차지

이 기사는 기계로 번역되었습니다

원문 표시

CryptoBriefing에 따르면, StepFun의 StepAudio 2.5 실시간 음성 모델은 2026년 4월 주요 벤치마크 테스트 5개에서 1위를 차지했으며, 주관적 인간 평가 점수 80.41점을 기록하여 이전 버전보다 10점 향상되었습니다. 이 모델은 엔드투엔드 아키텍처를 채택하고 중국어와 영어 모두에서 실시간 상호 작용을 지원하며, 억양, 정서, 말 속도를 인식하는 비언어적 이해 기능을 통합했습니다. 기술 보고서에 따르면, 이 모델은 역할극 특화 RLHF 기술을 통해 역할 일관성을 유지함으로써 기존의 음성 인식-언어 모델-음성 합성 파이프라인과 차별화됩니다.