Google mang công nghệ tạo nhạc bằng AI đến Gemini— Chúng tôi đã thử và thấy rằng nó quá ít và quá muộn.

02-20

Bài viết này được dịch máy

Xem bản gốc

Google đã dành nhiều năm âm thầm xây dựng mô hình âm nhạc AI của mình. Vào thứ Ba, cuối cùng họ đã đưa nó vào sử dụng cho mọi người.

Lyria 3 , mô hình tạo nhạc mới nhất của Google DeepMind, hiện đang được triển khai thử nghiệm beta trong ứng dụng Gemini , cho phép bất kỳ người dùng nào trên 18 tuổi mô tả ý tưởng hoặc tải ảnh lên và nhận lại bản nhạc hoàn chỉnh chỉ trong vài giây—bao gồm lời bài hát, nhạc cụ và ảnh bìa do AI tạo ra.

“Chỉ cần mô tả một ý tưởng hoặc tải lên một bức ảnh, ví dụ như 'một bản nhạc R&B hài hước về một chiếc tất đi tìm chiếc còn lại' và chỉ trong vài giây, Gemini sẽ chuyển nó thành một bản nhạc chất lượng cao, dễ nghe,” Google cho biết trong bài đăng chính thức trên blog của mình. “Để thúc đẩy sự sáng tạo hơn nữa, bạn thậm chí có thể yêu cầu Gemini lấy cảm hứng từ thứ bạn tải lên.”

Chúng tôi đã thử nghiệm. Tóm Short : Nó hoạt động tốt, thú vị và có thể gây ấn tượng với bất kỳ ai chưa từng sử dụng các mô hình tiên tiến khác như Suno hoặc Udio. Còn đối với những người đã sử dụng, nó sẽ không thay thế hoàn toàn quy trình làm việc của họ trong thời gian ngắn.

Các bản nhạc mà Lyria 3 tạo ra có độ dài 30 giây. Đó là giới hạn hiện tại, và Google cũng rất thẳng thắn về điều này – mục tiêu đã nêu không phải là tạo ra những bài hát thương mại hoàn chỉnh mà là tạo ra những khoảnh khắc dễ chia sẻ. Sản phẩm mà chúng tôi thử nghiệm khá mạch lạc, lời bài hát phù hợp với yêu cầu và chất lượng sản xuất ở mức khá tốt.

Đây là những gì Google, Suno và Udio có thể làm với cùng một lời nhắc:

Vấn đề bắt đầu khi bạn vượt qua giới hạn. Lyria 3 dường như có phạm vi thể loại khá rộng mà nó xử lý tốt—pop, afrobeat, R&B, hip-hop nhẹ. Nhưng khi chúng tôi thử nghiệm các yêu cầu về phong cách cụ thể hơn hoặc khác thường hơn, mô hình gặp khó khăn trong việc bám sát chúng. Hướng dẫn tạo đề bài từ DeepMind cũng ngầm thừa nhận điều này: Nó tập trung nhiều vào các ví dụ về thể loại chính thống và ít hướng dẫn cho bất cứ thứ gì nằm ngoài những thể loại đó.

Hãy so sánh điều đó với Udio , khi ra mắt vào năm 2024 đã có các tính năng như thanh trượt "cường độ gợi ý", bộ điều chỉnh độ rõ nét cho tiếng ồn nền và gợi ý phủ định để loại trừ các âm thanh hoặc phong cách cụ thể. Hoặc Suno , công cụ đã tạo ra các bài hát hoàn chỉnh dài nhiều phút với cấu trúc bài hát đúng chuẩn—các đoạn thơ, điệp khúc, đoạn nối—và được coi là mô hình tốt nhất trong lĩnh vực này. Cả hai công cụ đều cho phép bạn tạo ra các bản nhạc dài, nghe giống như những bài hát thực sự, chứ không phải là các đoạn nhạc mẫu. Giới hạn 30 giây và xu hướng lệch khỏi các gợi ý bất thường của Lyria 3 đặt nó ở một đẳng cấp khác.

Cũng cần đề cập đến một số khía cạnh pháp lý. Cả Suno và Udio đều bị Hiệp hội Công nghiệp Ghi âm Hoa Kỳ (RIAA) kiện vào năm 2024 vì bị cáo buộc sử dụng các bản ghi âm có bản quyền để huấn luyện người mẫu của họ mà không được phép. Udio đã đạt được thỏa thuận với Warner Music vào tháng 11 năm 2025 và hiện đang chuyển sang một nền tảng được cấp phép đầy đủ, dự kiến ra mắt vào năm 2026. Vụ kiện của Suno vẫn đang tiếp diễn.

Về phía mình, Google cho biết họ đã "rất chú trọng đến bản quyền và các thỏa thuận đối tác" trong quá trình huấn luyện Lyria 3, và mô hình này cố tình tránh bắt chước các nghệ sĩ cụ thể — nếu bạn nêu tên một nghệ sĩ trong một gợi ý, Lyria sẽ hiểu đó là nguồn cảm hứng về mặt cảm xúc chứ không phải là một chỉ dẫn trực tiếp.

Về khía cạnh an toàn và minh bạch, tất cả các bản nhạc được tạo ra trong Gemini đều được tích hợp SynthID, dấu ấn AI không thể nhận biết của Google. Công ty cũng đã thêm tính năng xác minh âm thanh vào Gemini: bạn có thể tải lên một bản nhạc và hỏi xem nó có được tạo bởi AI của Google hay không. Loại công cụ xác thực nguồn gốc này ngày càng quan trọng khi âm thanh do AI tạo ra tràn lan trên các nền tảng phát trực tuyến — Deezer đã triển khai các công cụ phát hiện để xác định và gắn cờ các luồng giả mạo từ nhạc AI.

Lyria 3 hiện đã có sẵn trên máy tính để bàn cho tất cả người dùng Gemini từ 18 tuổi trở lên bằng tiếng Anh và một số ngôn ngữ khác. Phiên bản di động sẽ được triển khai trong vài ngày tới. Người dùng đăng ký Google AI Plus, Pro và Ultra sẽ nhận được giới hạn tạo nhạc cao hơn. Mô hình này cũng mở rộng tính năng Dream Track của YouTube trên toàn cầu, trước đây chỉ có ở Mỹ, cho phép người tạo nội dung Shorts sử dụng nhạc nền do AI tạo cho video của họ.

Khu vực:

Quản Trị

DeFi

Jump Crypto

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan