歸藏(guizang.ai)의 인사이트

12-12

이 기사는 기계로 번역되었습니다

원문 표시

구글의 새로운 제미니 TTS 모델은 정말 놀랍습니다! 프롬프트를 사용하면 화자의 성별, 어조, 억양, 특정 단어 발음, 나이까지 직접 제어할 수 있습니다. 별도의 음성 모델로 전환할 필요 없이 생각할 수 있는 거의 모든 것을 제어할 수 있습니다! 제 AI 인터랙티브 만화책 앱이 드디어 완성되었습니다! 나노 바나나 프로(Nano Banana Pro)를 사용하여 각 장면에 맞는 이미지를 동적으로 생성하고, 새로운 TTS 기능을 통해 각 캐릭터마다 고유한 목소리를 만들어냅니다. twitter.com/op7418/status/1999...

중국어를 말할 때, 약간의 외국어 억양과 같은 몇 가지 기존 문제가 여전히 남아 있습니다. 하지만 이전 TTS 시스템에 비하면 중국어 발음은 훨씬 나아졌습니다. 앞으로 중국어에서 나타나는 어색한 억양 문제가 개선되기를 바랍니다.

안내 음성을 수정했습니다. 이전에 이상하게 들렸다면 다시 시도해 보세요.

歸藏(guizang.ai)

@op7418

12-12

通过提示词调整了一下角色的音色效果好了非常多！刚才觉得有问题的可以再听一下，Gemini 这个 TTS 如果中文再好点真的又要起飞了 AI 漫剧：Nano Banana Pro + Gemini 2.5 TTS + Gemini 3.0 Pro x.com/op7418/status/…

Twitter에서

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트