Không cần phải đợi đến mùa thu. Sáng sớm hôm nay, OpenAI đã thông báo rằng phiên bản mới của chế độ giọng nói nâng cao của ChatGPT sẽ được triển khai đầy đủ cho tất cả người dùng Plus và Team trong tuần này.
Giám đốc điều hành OpenAI Sam Altman đã đăng trên nền tảng X:
Chế độ giọng nói nâng cao ra mắt ngay hôm nay! (Sẽ được phát hành đầy đủ trong tuần này) Tôi hy vọng bạn cảm thấy nó đáng để chờ đợi🥺🫶
Tuy nhiên, phiên bản mới của chế độ giọng nói nâng cao cũng có giới hạn thời gian sử dụng hàng ngày và giới hạn này cũng sẽ thay đổi khi người dùng còn 15 phút, hệ thống sẽ đưa ra lời nhắc.
Điều này có nghĩa là sẽ không thực tế nếu sử dụng nó như một người bạn thân AI mà bạn có thể nói chuyện về mọi thứ 24 giờ một ngày.
Có hai phương pháp đơn giản để xác định xem bạn có đạt được tư cách đẩy hay không.
Đầu tiên, nếu bạn tư cách để được đẩy, thông báo sau sẽ hiển thị trong Ứng dụng khi bạn truy cập chế độ giọng nói lần đầu tiên:
Phương pháp thứ hai là kiểm tra số lượng kiểu giọng nói.
Trước đây, ChatGPT hỗ trợ năm kiểu giọng đặt sẵn, nhưng sau đó đã hủy niêm yết do tranh chấp pháp lý giữa kiểu giọng "Sky" và "Widow Sister".
Hôm nay, OpenAI ra mắt năm kiểu giọng nói mới nghe tự nhiên hơn—Vale, Spruce, Arbor, Maple và Sol.
Trang web chính thức của OpenAI mô tả chín âm thanh này như sau:
Arbor - Dễ dàng và linh hoạt
Breeze - Sống động và nghiêm túc
Cove - Bình tĩnh và thẳng thắn
Ember - Tự tin và lạc quan
Juniper - cởi mở và lạc quan
Maple - Vui vẻ và thẳng thắn
Sol - thông minh và thoải mái
Vân sam - bình tĩnh và tự tin
Vale - Thông minh và tò mò
Sau khi nghe phong cách giọng hát mới, cư dân mạng đều có những sở thích riêng. Một số nhớ "Sky", trong khi những người khác đã đắm chìm trong phong cách giọng hát mới. Sol hiện là giai điệu phổ biến nhất. Bạn thích giai điệu nào hơn? Bạn có thể chia sẻ nó ở phần bình luận.
Vậy chế độ giọng nói nâng cao của ChatGPT có tác dụng gì?
Chính thức đưa ra một ví dụ. Khi bạn muốn chân thành xin lỗi bà của mình, người chỉ nói tiếng phổ thông vì đến muộn, bạn có thể sử dụng ChatGPT, ứng dụng nói được hơn 50 ngôn ngữ, để đạt được điều này.
Bạn đã nghe đúng rồi, ChatGPT đã nói những điều sau bằng tiếng Quan Thoại một cách rõ ràng và ngắn gọn:
Bà ơi, con xin lỗi, con đến muộn, con không cố ý để bà đợi lâu như vậy.
Ngoài ra, chế độ giọng nói nâng cao của ChatGPT hiện hỗ trợ cài đặt lệnh tùy chỉnh.
Nhân viên OpenAI chỉ ra rằng phương thức giọng nói (cách truyền giọng nói) chứa nhiều yếu tố có thể không được phản ánh trong cuộc trò chuyện bằng văn bản, chẳng hạn như giọng nói, ngữ điệu, nhịp điệu, v.v.
Giờ đây, người dùng có thể tùy chỉnh cách mô hình AI nói thông qua các cài đặt mô tả chính xác hơn cách người dùng muốn mô hình nói.
Cô đưa ra những ví dụ như yêu cầu người mẫu nói theo một nhịp điệu cụ thể, phát âm rõ ràng, nói chậm và sử dụng tên người dùng định kì. Cô ấy khuyên bạn nên bắt đầu đơn giản, chẳng hạn như cho mô hình biết tên người dùng và một số thông tin cơ bản.
Trong một tình huống cụ thể, người dùng hỏi họ có thể làm những điều thú vị gì vào cuối tuần. Chế độ giọng nói nâng cao của ChatGPT cung cấp các đề xuất dựa trên thời tiết và vị trí của người dùng (Vùng Vịnh), chẳng hạn như đi bộ đường dài, dã ngoại hoặc lái xe dọc theo Tuyến đường 1.
Hoặc khi cô ấy nói rằng cô ấy thích ý tưởng lái xe ngắm cảnh và hỏi cô ấy nên đi tuyến đường nào, ChatGPT có thể đưa ra một kế hoạch kỹ lưỡng.
Tóm lại, bằng cách tùy chỉnh giọng nói và tương tác của mô hình, chế độ giọng nói nâng cao của ChatGPT có thể đưa ra các đề xuất cụ thể dựa trên sở thích và nhu cầu của người dùng, giúp tương tác trở nên tự nhiên và hữu ích hơn.
Ngoài ra, tốc độ hội thoại, độ trôi chảy và giọng nói của phiên bản mới của chế độ giọng nói nâng cao ChatGPT đã được cải thiện rất nhiều. Nó có thể thực sự đáng được coi là đối tác ngoại ngữ của bạn.
Khi nói về trải nghiệm người dùng, nhà thiết kế mô hình OpenAI Drew cho biết khi anh đang làm gì đó hoặc không cần nói chuyện với ChatGPT, ChatGPT sẽ giữ im lặng.
Khi có câu hỏi, anh ấy sẽ hỏi câu hỏi đó và câu hỏi đó có thể biến thành một cuộc trò chuyện dài.
Trong cuộc trò chuyện, giọng nói của ChatGPT sẽ điều chỉnh theo âm điệu của cuộc trò chuyện. Trong quan điểm của anh, ChatGPT giống như một người bạn ngồi cạnh, không chỉ cung cấp thông tin mà còn truyền đạt ý tưởng.
Trong thực tế, bạn cũng có thể thử sử dụng nó để thực hành các cuộc phỏng vấn và các tình huống khác mà không phải lo lắng về sự chậm trễ.
“Ý tôi là, độ trễ quá thấp, giống như đang nói chuyện với một con người khác,” Drew nhấn mạnh.
Đối với loạt trải nghiệm người dùng đầu tiên, bạn có thể xem lại các bài viết trước của APPSO👇
Loạt trải nghiệm người dùng đầu tiên về chế độ giọng nói GPT-4o đã có mặt! Phim "Her" cuối cùng cũng thành hiện thực, netizen: Suýt chút nữa tôi đã yêu cô ấy
Điều đáng chú ý là phiên bản mới của chế độ giọng nói nâng cao do OpenAI tung ra hiện chưa được mở cho EU, Vương quốc Anh, Thụy Sĩ, Iceland, Na Uy và Liechtenstein.
Một hòn đá gây ra hàng ngàn sóng gió, cư dân mạng bị ảnh hưởng vừa tức giận vừa bất lực.
Thật không may, tính năng chia sẻ video và màn hình của ChatGPT vẫn chưa ra mắt.
Bốn tháng trước, tính năng này đã được công bố tại một cuộc họp báo. Khi đó, OpenAI còn hướng dẫn chúng ta cách hỏi ChatGPT theo thời gian thực bài toán trên tờ giấy trước mặt hoặc đoạn mã trên màn hình máy tính.
Hiện tại, OpenAI chưa xác định thời điểm ra mắt tính năng này.
Trong một ngành công nghiệp AI mà sự phát triển luôn khó lường, chế độ giọng nói nâng cao muộn màng thực chất là một sản phẩm bị thiến.
Không có tính năng mới nào quá bắt mắt và thậm chí còn chưa hoàn thành các cam kết về chức năng tại hội nghị tháng 5. Cú hích toàn diện đã được hâm nóng sụp đổ như một sản phẩm nhắm đến mô hình mới của Google.
Nghịch lý thay, từ "sắp ra mắt" trong từ điển OpenAI dường như lại khác với từ điển của chúng ta.
Một số tính năng được hứa hẹn từ lâu có thể sẽ có vào ngày mai hoặc năm sau.
Nếu bạn nghĩ về nó từ một góc độ khác, OpenAI, công ty có khả năng kỹ thuật xuất sắc, cũng là một công ty bán trí tưởng tượng. Điều mà chúng tôi mong đợi nhất có thể là hoạt động đào tiếp theo của họ.
Rốt cuộc, nó đã trở thành một truyền thống đối với họ, phải không?
Một điều nữa
Trang web chính thức của OpenAI hôm nay đã cập nhật phiên bản câu trả lời QA về chế độ giọng nói ChatGPT. Chúng tôi cũng đã tóm tắt ngắn gọn một số câu trả lời thực tế, hy vọng sẽ tham khảo cho bạn.
1. Khi sử dụng chế độ giọng nói nâng cao, bạn vẫn có thể ẩn điện thoại và tiếp tục cuộc trò chuyện.
2. Nếu bạn chuyển từ chế độ văn bản hoặc giọng nói tiêu chuẩn sang chế độ giọng nói nâng cao, xin lưu ý rằng bạn sẽ không thể quay lại trạng thái hội thoại bằng văn bản hoặc giọng nói tiêu chuẩn trước đó.
3. Khi sử dụng chức năng Bluetooth hoặc điện thoại rảnh tay trong ô tô, trải nghiệm đối thoại bằng giọng nói nâng cao có thể bị ảnh hưởng vì OpenAI hiện không cung cấp tối ưu hóa đặc biệt cho các thiết bị này.
3. Đối thoại bằng giọng nói nâng cao chưa được mở cho GPT. Bạn chỉ có thể trò chuyện bằng giọng nói tiêu chuẩn với GPT. GPT có tùy chọn giọng nói độc đáo của riêng họ được gọi là Shimmer.
4. Để tôn trọng bản quyền của người sáng tạo âm nhạc, OpenAI đã áp dụng một số biện pháp bảo mật, bao gồm các điều kiện lọc mới để ngăn các cuộc trò chuyện bằng giọng nói tạo ra nội dung âm nhạc, bao gồm cả ca hát.
5. Chế độ giọng nói nâng cao Cuộc trò chuyện có bản chất là đa phương thức và văn bản được phiên âm không phải lúc nào cũng khớp chính xác với cuộc trò chuyện ban đầu.
6. Âm thanh trong cuộc trò chuyện bằng giọng nói nâng cao sẽ được giữ lại cùng với lịch sử trò chuyện cho đến khi bạn chủ động xóa nó. Sau khi xóa, âm thanh thường bị xóa trong vòng 30 ngày nhưng có thể được giữ lại lâu hơn trong một số trường hợp nhất định.
7. OpenAI cho biết theo mặc định, hệ thống sẽ không sử dụng âm thanh của bạn trong các cuộc trò chuyện thoại để huấn luyện mô hình trừ khi bạn chọn chia sẻ âm thanh.
8. Nếu tùy chọn "Cải thiện trải nghiệm trò chuyện thoại cho tất cả người dùng" không được bật trong "Cài đặt", điều đó có nghĩa là bạn chưa chia sẻ âm thanh và hệ thống sẽ không sử dụng âm thanh của bạn để huấn luyện mô hình.
Kèm theo là địa chỉ website chính thức: https://help.openai.com/en/articles/8400625-voice-mode-faq
Bài viết này xuất phát từ tài khoản công khai WeChat "APPSO" , tác giả: APPSO, 36 Krypton được xuất bản với sự cho phép.





