DolphinGemma: Mô hình AI của Google hiểu được tiếng kêu của cá heo

avatar
AI News
04-14
Bài viết này được dịch máy
Xem bản gốc

Google đã phát triển một mô hình AI có tên DolphinGemma để giải mã cách cá heo giao tiếp và một ngày nào đó có thể tạo điều kiện thuận lợi cho việc giao tiếp giữa các loài.

Những tiếng lách cách, tiếng huýt sáo và nhịp đập phức tạp vang vọng khắp thế giới dưới nước của cá heo từ lâu đã làm các nhà khoa học say mê. Ước mơ là hiểu và giải mã các mô hình trong tiếng kêu phức tạp của chúng.

Google, hợp tác với các kỹ sư tại Viện Công nghệ Georgia và tận dụng nghiên cứu thực địa của Dự án Cá heo hoang dã (WDP), đã ra mắt DolphinGemma để giúp hiện thực hóa mục tiêu đó.

Được công bố vào Ngày Cá heo Quốc gia, mô hình AI nền tảng đại diện cho một công cụ mới trong nỗ lực hiểu được giao tiếp của cá voi. Được đào tạo cụ thể để học cấu trúc âm thanh của cá heo, DolphinGemma thậm chí có thể tạo ra các chuỗi âm thanh mới lạ giống như cá heo.

Trong nhiều thập kỷ, Dự án Cá heo hoang dã – hoạt động từ năm 1985 – đã thực hiện nghiên cứu dưới nước liên tục dài nhất thế giới về cá heo để phát triển sự hiểu biết sâu sắc về các âm thanh cụ thể theo ngữ cảnh, chẳng hạn như:

  • “Tiếng còi” đặc trưng: Có vai trò là dấu hiệu nhận dạng duy nhất, tương tự như tên, rất quan trọng trong các tương tác như khi mẹ đoàn tụ với bê con.
  • Tiếng kêu “kêu” đột ngột: Thường liên quan đến xung đột hoặc các cuộc chạm trán hung hăng.
  • Tiếng “vù”: Thường được phát hiện trong các hoạt động tán tỉnh hoặc khi cá heo đuổi theo cá mập.

Mục tiêu cuối cùng của WDP là khám phá cấu trúc vốn có và ý nghĩa tiềm ẩn trong các chuỗi âm thanh tự nhiên này, tìm kiếm các quy tắc và mẫu ngữ pháp có thể biểu thị một dạng ngôn ngữ.

Quá trình phân tích dài hạn và tỉ mỉ này đã cung cấp nền tảng thiết yếu và dữ liệu được gắn nhãn rất quan trọng để đào tạo các mô hình AI phức tạp như DolphinGemma.

DolphinGemma: Tai AI dành cho âm thanh của cá voi

Phân tích khối lượng giao dịch và độ phức tạp trong giao tiếp của cá heo là một nhiệm vụ khó khăn, lý tưởng cho AI.

DolphinGemma, do Google phát triển, sử dụng các công nghệ âm thanh chuyên biệt để giải quyết vấn đề này. Nó sử dụng bộ mã hóa SoundStream để biểu diễn hiệu quả âm thanh của cá heo, đưa dữ liệu này vào kiến ​​trúc mô hình có khả năng xử lý các chuỗi phức tạp.

Dựa trên những hiểu biết sâu sắc từ dòng sản phẩm Gemma nhẹ, mở của Google (chia sẻ công nghệ với dòng sản phẩm Gemini mạnh mẽ), DolphinGemma hoạt động như một hệ thống âm thanh vào, âm thanh ra.

Được nuôi dưỡng bằng chuỗi âm thanh cá heo tự nhiên từ cơ sở dữ liệu mở rộng của WDP, DolphinGemma học cách xác định các mẫu và cấu trúc lặp lại. Quan trọng là nó có thể dự đoán các âm thanh có khả năng xảy ra tiếp theo trong một chuỗi—giống như các mô hình ngôn ngữ của con người dự đoán từ tiếp theo.

Với khoảng 400 triệu tham số, DolphinGemma được tối ưu hóa để chạy hiệu quả, ngay cả trên điện thoại thông minh Google Pixel mà WDP sử dụng để thu thập dữ liệu tại hiện trường.

Khi WDP bắt đầu triển khai mô hình này trong mùa này, nó hứa hẹn sẽ đẩy nhanh quá trình nghiên cứu đáng kể. Bằng cách tự động đánh dấu các mẫu và trình tự đáng tin cậy trước đây đòi hỏi nỗ lực to lớn của con người để tìm ra, nó có thể giúp các nhà nghiên cứu khám phá ra các cấu trúc ẩn và ý nghĩa tiềm ẩn trong giao tiếp tự nhiên của cá heo.

Hệ thống CHAT và tương tác hai chiều

Trong khi DolphinGemma tập trung vào việc tìm hiểu giao tiếp tự nhiên thì một dự án song song khác lại khám phá một hướng khác: tương tác chủ động, hai chiều.

Hệ thống CHAT (Hệ thống đo từ xa tăng cường thính giác ở cá voi) – do WDP phát triển hợp tác với Georgia Tech – nhằm mục đích thiết lập một vốn từ vựng chung đơn giản hơn thay vì dịch trực tiếp ngôn ngữ phức tạp của cá heo.

Khái niệm này dựa trên việc liên kết các tiếng còi tổng hợp mới lạ, cụ thể (do CHAT tạo ra, khác với âm thanh tự nhiên) với các vật thể mà cá heo thích tương tác, như khăn quàng cổ hoặc rong biển. Các nhà nghiên cứu chứng minh LINK (Chainlink) giữa tiếng còi và vật thể, hy vọng rằng sự tò mò tự nhiên của cá heo sẽ khiến chúng bắt chước âm thanh để yêu cầu các vật phẩm.

Khi âm thanh tự nhiên của cá heo được hiểu rõ hơn thông qua việc sử dụng các mô hình như DolphinGemma, chúng có khả năng được đưa vào khuôn khổ tương tác CHAT.

Google Pixel cho phép nghiên cứu đại dương

Nền tảng cho cả phân tích âm thanh tự nhiên và hệ thống CHAT tương tác là công nghệ di động quan trọng. Điện thoại Google Pixel đóng vai trò là bộ não xử lý dữ liệu âm thanh có độ trung thực cao theo thời gian thực, trực tiếp trong môi trường đại dương đầy thách thức.

Ví dụ, hệ thống CHAT dựa vào điện thoại Google Pixel để:

  • Phát hiện sự bắt chước tiềm ẩn trong tiếng ồn xung quanh.
  • Xác định loại còi cụ thể được sử dụng.
  • Thông báo cho nhà nghiên cứu (thông qua tai nghe truyền âm qua xương dưới nước) về 'yêu cầu' của cá heo.

Điều này cho phép nhà nghiên cứu phản hồi nhanh chóng với đúng đối tượng, củng cố mối liên kết đã học. Trong khi Pixel 6 ban đầu xử lý việc này, hệ thống CHAT thế hệ tiếp theo (dự kiến ​​vào mùa hè năm 2025) sẽ sử dụng Pixel 9, tích hợp chức năng loa/micrô và chạy đồng thời cả mô hình học sâu và thuật toán khớp mẫu để nâng cao hiệu suất.

Điện thoại Google Pixel 9 sẽ được sử dụng cho hệ thống DolphinGemma CHAT thế hệ tiếp theo.

Sử dụng điện thoại thông minh như Pixel làm giảm đáng kể nhu cầu về phần cứng tùy chỉnh cồng kềnh, đắt tiền. Nó cải thiện khả năng bảo trì hệ thống, giảm yêu cầu về điện năng và thu nhỏ kích thước vật lý. Hơn nữa, sức mạnh dự đoán của DolphinGemma được tích hợp vào CHAT có thể giúp xác định các bản sao nhanh hơn, giúp tương tác trôi chảy và hiệu quả hơn.

Nhận ra rằng những đột phá thường bắt nguồn từ sự hợp tác, Google dự định sẽ phát hành DolphinGemma dưới dạng mô hình mở vào cuối mùa hè này. Trong khi được huấn luyện trên cá heo đốm Đại Tây Dương, kiến ​​trúc của nó hứa hẹn cho các nhà nghiên cứu đang nghiên cứu các loài cá voi khác, có khả năng đòi hỏi phải tinh chỉnh cho các tiết mục giọng nói của các loài khác nhau.

Mục đích là trang bị cho các nhà nghiên cứu trên toàn cầu những công cụ mạnh mẽ để phân tích các tập dữ liệu âm thanh của riêng họ, đẩy nhanh nỗ lực chung để hiểu những loài động vật có vú biển thông minh này. Chúng ta đang chuyển từ việc lắng nghe thụ động sang giải mã các mẫu chủ động, mang lại triển vọng thu hẹp khoảng cách giao tiếp giữa các loài của chúng ta có lẽ chỉ gần hơn một chút.

Xem thêm: IEA: Cơ hội và thách thức của AI đối với năng lượng toàn cầu

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ những người dẫn đầu ngành? Hãy xem Triển lãm AI & Big Data diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh , BlockX , Tuần lễ chuyển đổi sốTriển lãm an ninh mạng & đám mây .

Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trực tuyến do TechForge hỗ trợ tại đây .

Bài đăng DolphinGemma: Mô hình AI của Google hiểu được tiếng kêu của cá heo xuất hiện đầu tiên trên AI News .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận