谷歌新的 Gemini TTS 模型太牛逼了!
直接可以通過提示詞去控制說話人的性別、語調、語氣、某個詞的讀音、年齡。
你能想到的都能控制,根本不需要切換單獨的語音模型!
我的 AI 互動漫劇應用終於是完全體了!
使用Nano Banana Pro動態地生成每個場景的圖片,以及新的TTS生成每角色的獨特的語音。
twitter.com/op7418/status/1999...
就是說中文的時候,依然有一些老問題,就是有些外國口音。
但是比以前的TTS說中文要好多了。希望他們能把普通話這個詭異的音調問題修復一下。
通過提示詞調整了一下,剛才聽著有問題的再試試:

歸藏(guizang.ai)
@op7418
12-12
通过提示词调整了一下角色的音色效果好了非常多!
刚才觉得有问题的可以再听一下,Gemini 这个 TTS 如果中文再好点真的又要起飞了
AI 漫剧:Nano Banana Pro + Gemini 2.5 TTS + Gemini 3.0 Pro x.com/op7418/status/…
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享






