Google đang thực sự đẩy mạnh giới hạn của các mô hình nhận dạng giọng nói. Đêm qua, họ đã cập nhật mô hình Gemini 2.5 Flash Native Audio để hỗ trợ dịch giọng nói theo thời gian thực, nghe liên tục và truyền phát giọng nói hai chiều dựa trên hội thoại, giữ nguyên ngữ điệu, nhịp điệu và cao độ của người nói. Hỗ trợ hơn 70 ngôn ngữ và 2000 cặp ngôn ngữ; Google Translate hiện đã có sẵn; ban đầu ứng dụng ra mắt trên Android tại Mỹ, Mexico và Ấn Độ. twitter.com/op7418/status/1999...
Bài viết này được dịch máy
Xem bản gốc
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận
Chia sẻ





