谷歌新的 Gemini TTS 模型太牛逼了!
直接可以通过提示词去控制说话人的性别、语调、语气、某个词的读音、年龄。
你能想到的都能控制,根本不需要切换单独的语音模型!
我的 AI 互动漫剧应用终于是完全体了!
使用Nano Banana Pro动态地生成每个场景的图片,以及新的TTS生成每角色的独特的语音。
twitter.com/op7418/status/1999...
就是说中文的时候,依然有一些老问题,就是有些外国口音。
但是比以前的TTS说中文要好多了。希望他们能把普通话这个诡异的音调问题修复一下。
通过提示词调整了一下,刚才听着有问题的再试试:

歸藏(guizang.ai)
@op7418
12-12
通过提示词调整了一下角色的音色效果好了非常多!
刚才觉得有问题的可以再听一下,Gemini 这个 TTS 如果中文再好点真的又要起飞了
AI 漫剧:Nano Banana Pro + Gemini 2.5 TTS + Gemini 3.0 Pro x.com/op7418/status/…
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享






