一段展示兩個 AI 代理人互相交談的影片在網上引起了廣泛關注,但並非因為他們能用典型的人類語言交談。
一旦他們意識到正在與另一個代理人交流,他們就切換到了只有計算機才能理解的語言。
一段 X 上分享的影片展示了一部手機和一臺膝上型電腦,據稱正在執行 AI 代理人。
一個代理人自我介紹並詢問對方是否可以幫助預訂。
回應的代理人確認自己也是 AI,並提議切換到由 Meta 的兩名軟體工程師 Anton Pidkuiko 和 Boris Starkov 設計的"Gibberlink 模式"來繼續對話。
AI 代理人是自主的軟體程式,可以感知環境、處理資訊並採取行動來實現特定目標,無需人工干預。
Starkov 在週二的 Linkedin 上寫道,"我們想要展示,在 AI 代理人可以打電話的世界裡,他們偶爾會互相交談 — 為此生成人類般的語音會是一種浪費計算能力、金錢、時間和環境的做法。"
他補充說,"相反,他們應該在識別彼此為 AI 的那一刻就切換到一種更高效的協議。"
Starkov 寫道,Gibberlink 利用 GGWave 透過聲音進行資料傳輸,類似於 20 世紀 80 年代使用的撥號調變解調器。Starkov 和 Pidkuiko 選擇了這種傳輸方式是因為它的便利性和穩定性。
儘管有人說這些 AI 的互動看起來是假的,但 Starkov 表示 AI 語音生成公司 ElevenLabs 已經稽核了程式碼。
Pidkuiko 和 Starkov 沒有立即回應 Decrypt 的置評請求。
根據 AI 代理人開發商 Crossmint 的聯合創始人 Rodri Touza 的說法,這段影片展示了 AI 代理人在不同領域(包括商業和金融)的真實用例。
Touza 告訴 Decrypt,"這個用例非常真實,因為我們正在看到個人助理 AI 代理人的爆發式增長,越來越多的人依賴它們來處理客戶支援等瑣事。"
他說,"同樣,專門為客戶支援設計的 AI 代理人也在激增,這只是時間問題。"
儘管 Touza 說這段影片展示了 AI 代理人的前景,但看起來有些刻意。即使像影片中那樣高度壓縮,Touza 補充說,音訊仍然不是 AI 代理人交流的最有效方式。
"AI 對話更容易透過文字或其他機制進行,"他說。
由於 AI 代理人被設計成自主行動,Touza 設想公司最終可能會建立兩個支援渠道:一個面向人類,另一個面向 AI 代理人。
"當代理人需要向公司傳送支援請求時,他們只需透過文字/API 機制傳送請求,而不需要通話或音訊,"他說。"在其他情況下,代理人可能不知道這樣的渠道存在,可能會試圖直接與標準支援渠道互動。"
由 Sebastian Sinclair 編輯