DolphinGemma:Google人工智慧模型能够理解海豚的对话

avatar
AI News
04-14
本文为机器翻译
展示原文

谷歌开发了一个名为DolphinGemma的人工智能模型,旨在破译海豚的交流方式,并最终促进跨物种交流。

长期以来,科学家们一直对海豚水下世界中回荡的复杂咔嗒声、哨音和脉冲着迷。科学家们的梦想是理解和破译它们复杂发声中的模式。

谷歌与佐治亚理工学院的工程师合作,并利用野生海豚项目(WDP)的实地研究,推出了DolphinGemma以帮助实现这一目标。

在海豚日前后宣布,这个基础人工智能模型代表了理解鲸类交流的新工具。DolphinGemma专门训练用于学习海豚声音的结构,甚至可以生成新的类似海豚的音频序列。

野生海豚项目自1985年开始运作,数十年来进行了世界上最长的连续水下海豚研究,以发展对特定语境声音的深入理解,例如:

  • 特征"哨音":作为独特标识符,类似于名字,对于母亲与幼崽重聚等互动至关重要。
  • 突发脉冲"尖叫":通常与冲突或攻击性遭遇有关。
  • 点击"嗡嗡声":常在求偶活动或海豚追逐鲨鱼时被检测到。

WDP的最终目标是揭示这些自然声音序列中固有的结构和潜在意义,寻找可能表示某种语言形式的语法规则和模式。

这种长期、艰苦的分析为训练像DolphinGemma这样复杂的人工智能模型提供了必要的基础和标记数据。

DolphinGemma:鲸类声音的人工智能耳朵

分析海豚交流的海量和复杂性是一项极其适合人工智能处理的艰巨任务。

谷歌开发的DolphinGemma采用专门的音频技术来应对这一挑战。它使用SoundStream分词器高效地表示海豚声音,并将这些数据输入到擅长处理复杂序列的模型架构中。

基于谷歌Gemma系列轻量级开放模型(与强大的Gemini模型共享技术)的见解,DolphinGemma作为音频输入输出系统运行。

通过输入WDP广泛数据库中的自然海豚声音序列,DolphinGemma学习识别重复出现的模式和结构。关键是,它可以预测序列中可能出现的后续声音,非常类似于人类语言模型预测下一个词。

拥有约4亿个参数,DolphinGemma经过优化,可以高效运行,甚至可以在WDP用于现场数据收集的谷歌Pixel智能手机上运行。

随着WDP本季开始部署该模型,它有望显著加速研究。通过自动标记先前需要大量人力才能发现的模式和可靠序列,它可以帮助研究人员揭示海豚自然交流中隐藏的结构和潜在意义。

CHAT系统和双向交互

虽然DolphinGemma专注于理解自然交流,但平行项目探索了另一种途径:主动的双向交互。

CHAT(鲸类听觉增强遥测)系统由WDP与佐治亚理工学院合作开发,旨在建立一个更简单的共享词汇,而不是直接翻译复杂的海豚语言。

这个概念依赖于将特定的新型合成哨音(由CHAT创建,不同于自然声音)与海豚喜欢互动的物品(如围巾或海藻)关联起来。研究人员展示哨音-物品的联系,希望海豚的天然好奇心能引导它们模仿这些声音以请求这些物品。

随着通过像DolphinGemma这样的模型更多地理解自然海豚声音,这些声音可能最终会被纳入CHAT交互框架。

谷歌Pixel支持海洋研究

支撑自然声音分析和交互式CHAT系统的是关键的移动技术。谷歌Pixel手机作为处理高保真音频数据的大脑,直接在具有挑战性的海洋环境中运行。

例如,CHAT系统依赖谷歌Pixel手机来:

  • 在背景噪音中检测潜在的模仿。
  • 识别使用的特定哨音。
  • 通过水下骨传导耳机提醒研究人员海豚的"请求"。

这使研究人员能够快速用正确的物品响应,强化学习到的关联。虽然最初由Pixel 6处理,但计划于2025年夏季的下一代CHAT系统将利用Pixel 9,集成扬声器/麦克风功能,并同时运行深度学习模型和模板匹配算法,以提高性能。

将用于下一代DolphinGemma CHAT系统的谷歌Pixel 9手机。

使用像Pixel这样的智能手机极大地减少了对笨重、昂贵的定制硬件的需求。它提高了系统可维护性,降低了功耗,并缩小了物理尺寸。此外,集成到CHAT中的DolphinGemma的预测能力可以帮助更快地识别模仿,使交互更加流畅和有效。

认识到突破往往源于合作,谷歌计划在今年夏季晚些时候发布DolphinGemma作为开放模型。虽然是在大西洋斑点海豚上训练,但其架构对于研究其他鲸类的研究人员来说很有前景,可能需要针对不同物种的发声repertoire进行微调。

目标是为全球研究人员配备强大的工具,分析他们自己的声学数据集,加速集体努力理解这些智能海洋哺乳动物。我们正从被动倾听转向主动破译模式,使跨物种交流的前景可能更近了一步。

另请参阅:国际能源署:人工智能对全球能源的机遇和挑战

想要从行业领袖那里了解更多关于人工智能和大数据的信息吗?请查看在阿姆斯特丹、加利福尼亚和伦敦举行的AI与大数据博览会。这个全面的活动与其他领先活动同地举办,包括智能自动化大会、BlockX、数字转型周和网络安全与云计算博览会。

在此处探索由TechForge提供支持的其他即将到来的企业技术活动和网络研讨会。

本文最初发表于AI新闻网。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论