CryptoBriefing에 따르면, StepFun의 StepAudio 2.5 실시간 음성 모델은 2026년 4월 주요 벤치마크 테스트 5개에서 1위를 차지했으며, 주관적 인간 평가 점수 80.41점을 기록하여 이전 버전보다 10점 향상되었습니다. 이 모델은 엔드투엔드 아키텍처를 채택하고 중국어와 영어 모두에서 실시간 상호 작용을 지원하며, 억양, 정서, 말 속도를 인식하는 비언어적 이해 기능을 통합했습니다. 기술 보고서에 따르면, 이 모델은 역할극 특화 RLHF 기술을 통해 역할 일관성을 유지함으로써 기존의 음성 인식-언어 모델-음성 합성 파이프라인과 차별화됩니다.
StepAudio 2.5, 음성 AI 벤치마크 테스트 5개 부문에서 1위 차지
이 기사는 기계로 번역되었습니다
원문 표시
출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유





