Giao tiếp rõ ràng là rất quan trọng trong lực lượng lao động toàn cầu ngày nay, nhưng với một số người, điều này dễ dàng hơn so với những người khác.
Vào hôm thứ Ba, Krisp, một nhà phát triển phần mềm AI âm thanh, đã giới thiệu công cụ Chuyển đổi Giọng nói để phá vỡ rào cản ngôn ngữ bằng cách thay đổi cách giọng nói của một người được truyền tới người nghe.
Mặc dù công nghệ này hứa hẹn về tính bao hàm, nhưng nó cũng gây ra lo ngại về sự thiên vị văn hóa, bản sắc văn hóa và ý nghĩa của việc "nghe có vẻ chuyên nghiệp".
Bộ chuyển đổi giọng nói AI của Krisp nhằm tạo điều kiện cho các thực hành tuyển dụng bao gồm và công bằng hơn bằng cách loại bỏ sự thiên vị nhận thức và đảm bảo rằng giọng nói của một người không ảnh hưởng đến cách khách hàng nhận thức tính chuyên nghiệp hoặc đáng tin cậy của họ.
Theo đồng sáng lập Krisp Arto Minasyan, một nghiên cứu gần đây đã tiết lộ khoảng cách nhận thức đáng kể giữa khách hàng và các trung tâm liên lạc.
"Trong nghiên cứu của chúng tôi, 79% khách hàng Hoa Kỳ cho biết họ yêu cầu các đại lý nói tiếng Anh không phải là tiếng mẹ đẻ lặp lại ít nhất một lần mỗi cuộc gọi, nhưng chỉ có 33% trung tâm liên lạc tin rằng điều này xảy ra," Minasyan nói với Decrypt. "Khoảng cách này dẫn đến sự không hài lòng và thất vọng cho cả hai bên của cuộc họp."
Minasyan lưu ý rằng các công ty hoặc từ chối các ứng viên có giọng nói mạnh, loại bỏ trung bình 64% đại lý, hoặc phải đầu tư vào việc đào tạo giọng nói tốn kém.
Được thành lập vào năm 2017 bởi Minasyan và Davit Baghdasaryan, Krisp là một công ty phần mềm xử lý âm thanh dựa trên AI có trụ sở tại Berkeley, California. Nó chuyên về công nghệ triệt tiếng ồn và giọng nói thời gian thực.
Minasyan giải thích rằng công cụ này không phân biệt giữa các giọng nói mà thay vào đó chuyển đổi giọng nói để phù hợp với một giọng nói mục tiêu cụ thể. Trong quá trình chuyển đổi, Krisp nắm bắt các đặc điểm từ giọng nói của người dùng và kết hợp chúng vào đầu ra cuối cùng.
"Cách tiếp cận này giúp duy trì giọng nói nghe tự nhiên hơn và bảo toàn âm điệu cảm xúc của đầu vào ban đầu," anh nói.
Mặc dù người dùng có thể bật và tắt bộ chuyển đổi giọng nói AI theo thời gian thực, nhưng Minasyan cho biết tùy chọn điều chỉnh mức độ chuyển đổi hiện không có sẵn.
Mặc dù các công cụ giọng nói AI có thể cải thiện cơ hội việc làm, nhưng chúng cũng mang theo rủi ro bị lạm dụng.
Những lo ngại này đã khiến FBI cảnh báo vào tháng 5 năm 2024 về những scammer tận dụng phần mềm giọng nói được hỗ trợ bởi AI để thực hiện các vụ lừa đảo scams.
Trước cuộc bầu cử Tổng thống năm 2024, FCC đã cấm các cuộc gọi tự động sử dụng giọng nói được tạo bằng AI của các ứng cử viên sau khi một deepfake của Tổng thống Joe Biden khi đó được sử dụng để cố gắng lừa cử tri ở New Hampshire không đi bỏ phiếu.
Khi được hỏi về khả năng bị lạm dụng bởi tội phạm mạng, Minasyan thừa nhận các rủi ro, lưu ý rằng các công cụ của Krisp, như điện thoại di động, máy tính xách tay hoặc Internet, có thể bị khai thác bất chấp mục đích ban đầu của chúng.
"Mặc dù chúng tôi nhận thức được việc lạm dụng là một mối lo ngại, nhưng không thể giám sát hoàn toàn cách sử dụng công cụ mà không làm ảnh hưởng đến quyền riêng tư của người dùng," anh nói.
Tuy nhiên, vẫn có hy vọng rằng công nghệ này sẽ được sử dụng chủ yếu cho mục đích tốt hơn là cho các mục đích khác.
"Chúng tôi chưa trực tiếp tham khảo ý kiến các nhà ngôn ngữ xã hội, nhưng chúng tôi đã thử nghiệm công nghệ này trong các bối cảnh thực tế với khách hàng trước khi phát hành rộng rãi," Minasyan nói.
Nhà sáng lập chỉ ra một số số liệu nội bộ, bao gồm cải thiện 99% điểm số người ủng hộ thuần, tăng hơn 26% tỷ lệ chuyển đổi bán hàng và tăng 12,2% điểm số người ủng hộ đại lý, thể hiện "sự tự tin cao hơn của đại lý".
"Việc chứng kiến những cải thiện này ở cả phía người dùng và khách hàng đã tăng cường niềm tin của chúng tôi rằng công nghệ này không mang lại những hạn chế văn hóa hoặc kinh doanh lớn," anh nói.
Được chỉnh sửa bởi Sebastian Sinclair