DolphinGemma:Google人工智慧模型能夠理解海豚的對話

avatar
AI News
04-14
本文為機器翻譯
展示原文

谷歌開發了一個名為DolphinGemma的人工智慧模型,旨在破譯海豚的交流方式,並最終促進跨物種交流。

長期以來,科學家們一直對海豚水下世界中迴盪的複雜咔嗒聲、哨音和脈衝著迷。科學家們的夢想是理解和破譯它們複雜發聲中的模式。

谷歌與佐治亞理工學院的工程師合作,並利用野生海豚專案(WDP)的實地研究,推出了DolphinGemma以幫助實現這一目標。

在海豚日前後宣佈,這個基礎人工智慧模型代表了理解鯨類交流的新工具。DolphinGemma專門訓練用於學習海豚聲音的結構,甚至可以生成新的類似海豚的音訊序列。

野生海豚專案自1985年開始運作,數十年來進行了世界上最長的連續水下海豚研究,以發展對特定語境聲音的深入理解,例如:

  • 特徵"哨音":作為獨特識別符號,類似於名字,對於母親與幼崽重聚等互動至關重要。
  • 突發脈衝"尖叫":通常與衝突或攻擊性遭遇有關。
  • 點選"嗡嗡聲":常在求偶活動或海豚追逐鯊魚時被檢測到。

WDP的最終目標是揭示這些自然聲音序列中固有的結構和潛在意義,尋找可能表示某種語言形式的語法規則和模式。

這種長期、艱苦的分析為訓練像DolphinGemma這樣複雜的人工智慧模型提供了必要的基礎和標記資料。

DolphinGemma:鯨類聲音的人工智慧耳朵

分析海豚交流的海量和複雜性是一項極其適合人工智慧處理的艱鉅任務。

谷歌開發的DolphinGemma採用專門的音訊技術來應對這一挑戰。它使用SoundStream分詞器高效地表示海豚聲音,並將這些資料輸入到擅長處理複雜序列的模型架構中。

基於谷歌Gemma系列輕量級開放模型(與強大的Gemini模型共享技術)的見解,DolphinGemma作為音訊輸入輸出系統執行。

透過輸入WDP廣泛資料庫中的自然海豚聲音序列,DolphinGemma學習識別重複出現的模式和結構。關鍵是,它可以預測序列中可能出現的後續聲音,非常類似於人類語言模型預測下一個詞。

擁有約4億個引數,DolphinGemma經過最佳化,可以高效執行,甚至可以在WDP用於現場資料收集的谷歌Pixel智慧手機上執行。

隨著WDP本季開始部署該模型,它有望顯著加速研究。透過自動標記先前需要大量人力才能發現的模式和可靠序列,它可以幫助研究人員揭示海豚自然交流中隱藏的結構和潛在意義。

CHAT系統和雙向互動

雖然DolphinGemma專注於理解自然交流,但平行專案探索了另一種途徑:主動的雙向互動。

CHAT(鯨類聽覺增強遙測)系統由WDP與佐治亞理工學院合作開發,旨在建立一個更簡單的共享詞彙,而不是直接翻譯複雜的海豚語言。

這個概念依賴於將特定的新型合成哨音(由CHAT建立,不同於自然聲音)與海豚喜歡互動的物品(如圍巾或海藻)關聯起來。研究人員展示哨音-物品的聯絡,希望海豚的天然好奇心能引導它們模仿這些聲音以請求這些物品。

隨著透過像DolphinGemma這樣的模型更多地理解自然海豚聲音,這些聲音可能最終會被納入CHAT互動框架。

谷歌Pixel支援海洋研究

支撐自然聲音分析和互動式CHAT系統的是關鍵的移動技術。谷歌Pixel手機作為處理高保真音訊資料的大腦,直接在具有挑戰性的海洋環境中執行。

例如,CHAT系統依賴谷歌Pixel手機來:

  • 在背景噪音中檢測潛在的模仿。
  • 識別使用的特定哨音。
  • 透過水下骨傳導耳機提醒研究人員海豚的"請求"。

這使研究人員能夠快速用正確的物品響應,強化學習到的關聯。雖然最初由Pixel 6處理,但計劃於2025年夏季的下一代CHAT系統將利用Pixel 9,整合揚聲器/麥克風功能,並同時執行深度學習模型和模板匹配演算法,以提高效能。

將用於下一代DolphinGemma CHAT系統的谷歌Pixel 9手機。

使用像Pixel這樣的智慧手機極大地減少了對笨重、昂貴的定製硬體的需求。它提高了系統可維護性,降低了功耗,並縮小了物理尺寸。此外,整合到CHAT中的DolphinGemma的預測能力可以幫助更快地識別模仿,使互動更加流暢和有效。

認識到突破往往源於合作,谷歌計劃在今年夏季晚些時候釋出DolphinGemma作為開放模型。雖然是在大西洋斑點海豚上訓練,但其架構對於研究其他鯨類的研究人員來說很有前景,可能需要針對不同物種的發聲repertoire進行微調。

目標是為全球研究人員配備強大的工具,分析他們自己的聲學資料集,加速集體努力理解這些智慧海洋哺乳動物。我們正從被動傾聽轉向主動破譯模式,使跨物種交流的前景可能更近了一步。

另請參閱:國際能源署:人工智慧對全球能源的機遇和挑戰

想要從行業領袖那裡瞭解更多關於人工智慧和大資料的資訊嗎?請檢視在阿姆斯特丹、加利福尼亞和倫敦舉行的AI與大資料博覽會。這個全面的活動與其他領先活動同地舉辦,包括智慧自動化大會、BlockX、數字轉型周和網路安全與雲計算博覽會。

在此處探索由TechForge提供支援的其他即將到來的企業技術活動和網路研討會。

本文最初發表於AI新聞網。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論