本文目录
Toggle在生成式 AI 的语音赛道上,马斯克(Elon Musk)领军的 xAI 正式向 OpenAI 等竞争对手发起强烈攻势。
xAI 于 2026 年 4 月 30 日发布官方公告,宣布旗下 AI 平台迎来重大更新 —— 全面推出「自订语音(Custom Voices)」与全新的「语音库(Voice Library)」功能,让个人与企业能够以极低的门槛,将「自己的声音」无缝融入各种 AI 应用场景中。
录音不到 1 分钟,极速生成专属 AI 语音
根据 xAI 的说明,建立个人专属的 AI 语音模型现在变得前所未有地简单。用户只需在 xAI console(控制台)中,录制一段长度仅需「几秒到一分钟」的自然说话语音,整个模型建立过程不到 2 分钟即可完成。
一旦生成完毕,这套专属语音就能立即在 Grok 的文字转语音(Text-to-Speech, TTS)服务以及 Voice Agent API 中调用。xAI 官方点出了该技术的五大核心应用场景:
- 品牌客服代理:企业可让 AI 客服使用品牌专属、具一致性的声音,提升企业形象。
- 内容创作者与 Podcast:创作者能用自己的声音大规模旁白影片或生成有声书,无需每次亲自进录音室录制。
- 跨语言演讲:让跨国企业 CEO 能够用「自己的声音」,无缝切换多种语言(如中、英、日、法文等)发表关键演讲。
- 游戏与娱乐:为元宇宙或游戏中的 NPC 角色快速配音。
- 无障碍辅助:为即将失去说话能力的渐冻症等罕病患者,永久保留他们原本的声音特征。
严防 Deepfake!禁止上传录音档,双重验证卡关
随著语音复制技术的普及,利用 Deepfake(深伪技术)进行的名人声音造假与电信诈骗层出不穷。为了防止该技术被恶意滥用,xAI 在安全机制上祭出了极为严格的防护网。
xAI 强调,系统「绝对无法使用现有的录音档进行声音复制」。用户必须亲自进行即时录音,且系统会要求用户朗读一段随机生成的「验证短语(Passphrase)」。接著,AI 会透过语音转文字确认内容无误,并比对语音嵌入向量(Speaker Similarity),确保录制验证短语的人与原始录音是同一人。这套双重验证机制,从根本上阻断了骇客拿别人的音档来「偷声音」的可能。
语音库上线,使用自订语音「不加价」
除了强大的自订功能,xAI 此次也同步推出了「语音库(Voice Library)」,让开发团队能统一管理所有的自订语音与内建语音。目前语音库已内建超过 80 种高品质语音、支援高达 28 种语言供用户自由预览。
最令开发者与企业振奋的是,xAI 宣布使用自订语音功能将「完全不收取额外费用」,并且完全支援原本 TTS 系统的所有进阶功能(如语音标签、即时串流等)。用户只需在 API 中指定专属的 voice_id 即可轻松调用,这无疑将大幅降低企业导入专属语音 AI 的成本门槛。

相关报导
马斯克拒绝法国检方传唤,Grok 生成 Deepfake 色色图与 X 演算法调查持续
xAI 偷上线 Grok 4.3:直接生成 Word、PPT、Excel 档案,微软护城河被踩烂
喜欢特斯拉声音?xAI 正式开放 Grok 语音 API,TTS 每百万字元 4.2 美元、辨识率击败 ElevenLabs





