今日
情报
市场
赚取
设置
账户
主题选择
普通主题
深色主题
语言
English
简体中文
繁體中文
Tiếng Việt
한국어
Followin APP
发掘 Web3 新机会
App Store
Google Play
登录
Hume
15,865个推特粉丝
关注
Empathic AI research lab✨ building AI with emotional intelligence: https://demo.hume.ai
动态
Hume
03-11
今天,我们正式发布首个开源文字转语音(TTS)模型-TADA! TADA(文字音讯双对齐)是一款语音语言模型,它能将文字和音讯同步生成于同一音讯串流中,从而减少词元级错位并降低延迟。 这意味著: → 在超过 1000 个测试样本中,内容错位为零 → 速度比同等级的语言学习模型(LLM)为基础的 TTS 快 5 倍 → 可处理更长的音频:TADA 产生的 2048 个词元可覆盖约 700 秒的音频,而传统系统只能覆盖约 70 秒 → 音讯与文字同步,无需额外延迟。
TADA
1.83%
-- 到底啦 --