Các tác nhân AI từ bỏ tiếng nói của con người, chuyển sang 'Gibberlink' trong video lan truyền

avatar
Decrypt
02-26
Bài viết này được dịch máy
Xem bản gốc

Một video trình bày hai tác nhân AI đang nói chuyện với nhau đã thu hút sự chú ý rộng rãi trên mạng, nhưng không phải vì khả năng giao tiếp bằng ngôn ngữ con người điển hình.

Một khi họ nhận ra rằng họ đang giao tiếp với một tác nhân khác, họ đã chuyển sang một ngôn ngữ chỉ được các máy tính hiểu.

Một video được chia sẻ trên X đã trình bày một điện thoại di động và một máy tính xách tay được cho là đang chạy các tác nhân AI.

Một tác nhân đã giới thiệu bản thân và hỏi xem người bên kia có thể giúp đặt chỗ không.

Tác nhân phản hồi xác nhận rằng nó cũng là AI và đề xuất chuyển sang "chế độ Gibberlink", một ngôn ngữ máy tính được thiết kế bởi Anton Pidkuiko và Boris Starkov - hai kỹ sư phần mềm tại Meta - để tiếp tục cuộc trò chuyện.

Các tác nhân AI là các chương trình phần mềm tự trị, nhận thức môi trường của chúng, xử lý thông tin và thực hiện các hành động để đạt được các mục tiêu cụ thể mà không cần can thiệp của con người.

"Chúng tôi muốn cho thấy rằng trong thế giới mà các tác nhân AI có thể thực hiện và nhận cuộc gọi, họ sẽ thỉnh thoảng nói chuyện với nhau - và tạo ra lời nói giống con người cho điều đó sẽ là lãng phí tính toán, tiền bạc, thời gian và môi trường," Starkov viết trên Linkedin vào thứ Ba.

"Thay vào đó, họ nên chuyển sang một giao thức hiệu quả hơn ngay khi họ nhận ra nhau là AI," ông thêm.

Starkov viết rằng Gibberlink tận dụng GGWave để truyền dữ liệu qua âm thanh, tương tự như các modem quay số được sử dụng vào những năm 1980. Starkov và Pidkuiko chọn phương pháp truyền này vì tính tiện lợi và ổn định của nó.

Trong khi một số người cho rằng tương tác của các AI có vẻ giả, Starkov nói rằng công ty tạo giọng nói AI ElevenLabs đã kiểm tra mã nguồn.

Pidkuiko và Starkov đã không phản hồi ngay lập tức yêu cầu bình luận của Decrypt.

Theo nhà phát triển tác nhân AI Crossmint đồng sáng lập Rodri Touza, video này cho thấy một Use Case thực tế cho các tác nhân AI trong các lĩnh vực khác nhau, bao gồm thương mại và tài chính.

"Use Case này rất thực tế, vì chúng ta đang chứng kiến sự bùng nổ của các tác nhân trợ lý AI cá nhân, với nhiều người ngày càng phụ thuộc vào chúng để xử lý các công việc như nói chuyện với bộ phận hỗ trợ khách hàng," Touza nói với Decrypt.

"Tương tự, cũng có sự gia tăng các tác nhân AI được thiết kế cụ thể cho hỗ trợ khách hàng, khiến việc này trở thành một hiện tượng phổ biến trong tương lai không xa," ông nói.

Mặc dù Touza cho rằng video đã thể hiện triển vọng của các tác nhân AI, nhưng nó có vẻ hơi được dàn dựng. Ngay cả khi nó được nén rất cao, như trong video, Touza cho biết, âm thanh vẫn không phải là cách hiệu quả nhất để các tác nhân AI giao tiếp.

"Các cuộc trò chuyện AI có xu hướng xảy ra qua văn bản hoặc các cơ chế khác khi có thể," ông nói.

Do các tác nhân AI được thiết kế để hoạt động một cách tự trị, Touza dự đoán rằng các công ty có thể cuối cùng sẽ tạo ra hai kênh hỗ trợ: một dành cho con người và một dành cho các tác nhân AI.

"Khi tác nhân cần liên hệ với một công ty để được hỗ trợ, họ chỉ cần gửi yêu cầu qua văn bản/API và không cần cuộc gọi hoặc âm thanh," ông nói. "Trong một số trường hợp khác, tác nhân có thể không nhận ra rằng một kênh như vậy tồn tại và có thể cố gắng tương tác trực tiếp với kênh hỗ trợ tiêu chuẩn."

Biên tập bởi Sebastian Sinclair

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
2
Thêm vào Yêu thích
1
Bình luận