谷歌官方推出Gemini Live Chatbot,与OpenAI的高级语音模式直接竞争,承诺改变人机互动。
2024 年 8 月 13 日的「Made by Google」活动中上线了Gemini Live,这是一款由 Google 大语言模型 (LLM) 提供支援的语音聊天机器人。这项活动标记Google在语音聊天机器人竞赛中迈出了新的一步,与先前推出高级语音模式的OpenAI公司直接竞争。
Gemini Live 让使用者以自然的声音聊天,不到两秒钟即可快速回复。聊天机器人还可以在被打扰时灵活切换,这与其他语音聊天机器人相比是一大优势。
谷歌也大力投资声音多样性,为Gemini Live 提供 10 种由专业配音员制作的声音,提供更亲密、更自然的体验。与高级语音模式现有的三种语音相比,这对Google来说是一个显著的竞争优势。 Gemini Live 还承诺带来许多潜在的应用程序,特别是在寻找资讯和支援日常任务方面。
不过, Gemini Live仍存在一定的限制。该聊天机器人有时无法理解用户声音中的情绪语调,并可能「错觉」讯息。谷歌也限制用户唱歌或模仿声音的能力,以避免侵犯版权。这可能会影响Gemini Live丰富的互动性。
不过,Google计划未来集成到Gemini Live中。这是 Google 在 Google I/O 大会上推出的完整多模式人工智慧模型 Project Astra 的道路上迈出的一步。凭借上述功能, Gemini Live可以改变人们与科技互动的方式,特别是在资讯搜寻、虚拟助理和娱乐领域。
关注AI News ,不错过区块链科普论坛上人工智慧的最新动态。