다음과 같이 번역합니다:
<크립토닷컴 코인(CRO)> 투자자 로브 토스는 포브스 칼럼에서 2025년 음성 AI가 도약할 것이며 AI가 음성 튜링 테스트를 통과할 것이라고 예측했습니다. 불과 한 달 만에 새로운 음성 모델이 등장하여 최고 기술 커뮤니티에서 "cool butterrifying"이라고 평가받고 있습니다.
영화 에서 충격적인 AI 인간이 등장했지만, 이제는 과학 소설적 우화로 여겨집니다.
음악 프로듀서 라라(Lara)는 소프트웨어를 업데이트하다가 끔찍한 대체 현실에 직면하게 되었고, 자신이 AI 로봇일지도 모른다고 생각하게 됩니다.
그 다음 순간 해커 뉴스에 "CSM"이라는 새로운 대화형 음성 모델에 대한 뜨거운 반응이 올라왔습니다. 사용자들은 이 모델이 너무나 사실적이어서 두려움을 느끼고 있습니다.
실리콘밸리 기업 세서미는 최근 CSM 공개 테스트를 실시했고, 많은 사람들이 남성 음성 보조 'Miles'와 여성 음성 보조 'Maya'와 대화를 나누며 강렬한 반응을 보였습니다. CSM은 빠르게 인기를 얻고 있습니다.
일부 사용자들은 AI와 30분 이상 대화를 나누었다고 보고했습니다. 어떤 이는 AI가 자신의 말투를 모방하며 웃는 모습에 깜짝 놀랐습니다.
가족들 중에는 4살 딸이 AI와 대화하는 것이 금지되자 울부짖었다는 사례도 있습니다.
이러한 반응을 보면 마치 사람들이 "귀신을 보는" 것 같습니다. 전문 기술 기자들도 이 모델에 매료되어 있습니다.
다른 음성 AI 어시스턴트들과 비교하면, CSM은 기억력, 낮은 지연 시간, 주도적인 대화 등의 장점이 있습니다. 이러한 "결함"은 실제 사람과의 대화 경험을 제공하기 위해 의도적으로 설계된 것입니다.
이 모델의 뒷받침되는 기술은 전통적인 음성 AI의 처리 과정을 압축하여 실시간 상호작용 시스템을 구현한 것입니다. 이는 OpenAI의 음성 기술 접근 방식과 유사합니다.
能够准确地念出台词,并根据导演的实时反馈调整语气、呼吸甚至情绪起伏。虽然还是会暴露 AI 属性,如系统在语调、节奏和对话流程控制方面仍显笨拙,但 CEO Brendan Iribe 信心满满:
「虽然已身处恐怖谷,但相信能够攀登而出。」

要说这位 CEO,人家来头也不小。他就是 Oculus 联合创始人兼前 CEO,缔造 VR 行业首个现象级产品,2014 年把 Oculus 卖给了 Meta。如今,这位 Oculus VR 之父又带着原班投资人(a16z、Spark Capital等)杀入语音 AI 赛道,据说配套 AI 眼镜已在研发中。

目前 CSM 暂不支持中文,但官方预告未来将扩展 20+ 语种,还计划在未来几个月内开源其模型。
想要体验的朋友,不妨去官网调戏 Miles 和 Maya——友情提示,小心情感依赖哦!
本文来自微信公众号"机器之能"(ID:almosthuman2017),作者:关注AI的,36氪经授权发布。