구글, 제미니(Gemini) 에 AI 음악 생성 기능 탑재 — 직접 사용해본 결과, 너무 늦은 감이 있다

02-20

이 기사는 기계로 번역되었습니다

원문 표시

구글은 수년간 조용히 인공지능 음악 모델을 개발해 왔습니다. 그리고 화요일, 마침내 모든 사람이 실제로 사용할 수 있는 곳에 그 모델을 공개했습니다.

구글 딥마인드의 최신 음악 생성 모델인 Lyria 3가 제미니(Gemini) 앱에서 베타 버전으로 출시되었습니다. 18세 이상 사용자는 아이디어를 설명하거나 사진을 업로드하면 가사, 반주, AI가 생성한 앨범 커버 아트가 포함된 완성된 트랙을 몇 초 만에 받아볼 수 있습니다.

구글은 공식 블로그에서 "아이디어를 설명하거나 사진을 업로드하기만 하면 됩니다. 예를 들어 '양말이 짝을 찾는 것에 대한 유쾌한 R&B 슬로우 잼'처럼 말이죠. 그러면 제미니(Gemini) 몇 초 만에 고품질의 중독성 있는 음악으로 변환해 줍니다."라고 밝혔습니다. "창의력을 더욱 확장하고 싶다면, 업로드한 이미지에서 영감을 얻도록 제미니(Gemini) 요청할 수도 있습니다."

직접 사용해 봤습니다. 숏 말하자면, 작동도 잘 되고 재미있으며, Suno나 Udio 같은 최첨단 모델을 사용해 본 적 없는 사람이라면 꽤 인상적일 겁니다. 하지만 이미 그런 모델을 사용해 본 사람이라면, 이 제품이 곧바로 기존 작업 방식을 대체할 것 같지는 않습니다.

Lyria 3가 생성하는 트랙의 길이는 30초입니다. 현재로서는 이것이 최대 길이이며, 구글은 이 점을 명확히 밝히고 있습니다. Lyria 3의 목표는 세련된 상업적 노래를 만드는 것이 아니라 공유할 수 있는 순간을 만들어내는 것이라고 합니다. 저희가 테스트한 결과물은 내용이 일관성이 있었고, 가사는 제시된 주제와 일치했으며, 제작 품질도 괜찮았습니다.

다음은 Google, Suno 및 Udio가 동일한 프롬프트에 대해 수행할 수 있는 작업입니다.

문제는 장르의 범위를 넘어서면서 발생합니다. Lyria 3는 팝, 아프로비트, R&B, 가벼운 힙합과 같은 일반적인 장르에서는 안정적인 성능을 보여줍니다. 하지만 보다 구체적이거나 특이한 스타일을 요구하는 프롬프트를 테스트했을 때, 모델은 그 요구에 충실하기 어려워했습니다. DeepMind의 프롬프트 가이드는 이러한 점을 암묵적으로 인정하고 있습니다. 주류 장르에 대한 예시는 풍부하게 제시하지만, 그 외의 장르에 대한 지침은 부족합니다.

2024년 출시 당시 "프롬프트 강도" 슬라이더, 배경 소음 제거를 위한 선명도 조절 기능, 특정 사운드나 스타일을 제외하는 음성 프롬프트 기능 등을 제공했던 Udio 와 비교해 보세요. 혹은 제대로 된 곡 구조(절, 후렴, 브릿지)를 갖춘 수 분 분량의 완성도 높은 곡을 생성해내며 업계 최고로 손꼽히는 Suno 와 비교해 보세요. 두 도구 모두 샘플이 아닌 실제 노래처럼 느껴지는 긴 트랙을 만들 수 있게 해줍니다. Lyria 3는 30초라는 시간 제한과 다소 특이한 프롬프트 때문에 다른 범주에 속하게 됩니다.

법적인 맥락도 언급할 필요가 있습니다. Suno와 Udio는 2024년 미국음반산업협회(RIAA)로부터 저작권이 있는 음원을 허가 없이 모델 학습에 사용했다는 혐의로 소송을 당했습니다. Udio는 2025년 11월 워너 뮤직과 합의했고 , 현재 정식 라이선스를 취득한 플랫폼으로 전환 중이며 2026년 출시를 목표로 하고 있습니다. Suno의 소송은 아직 진행 중입니다.

구글 측은 리리아 3를 학습시키는 과정에서 "저작권 및 파트너 계약을 매우 신중하게 고려했다"고 밝혔으며, 해당 모델은 특정 아티스트를 모방하는 것을 의도적으로 피한다고 설명했습니다. 즉, 프롬프트에 아티스트 이름을 언급하면 리리아는 이를 직접적인 지시가 아닌 분위기적 영감으로 받아들입니다.

안전성과 투명성 측면에서, 제미니(Gemini) 에서 생성된 모든 트랙에는 구글의 눈에 띄지 않는 AI 워터마크인 SynthID가 포함되어 있습니다. 또한 구글은 제미니(Gemini) 에 오디오 검증 기능을 추가하여 트랙을 업로드하고 구글 AI가 제작했는지 여부를 확인할 수 있도록 했습니다. 이러한 출처 확인 도구는 AI 생성 오디오가 스트리밍 플랫폼에 넘쳐나는 상황에서 점점 더 중요해지고 있습니다. 디저는 이미 AI 음악으로 만들어진 가짜 스트림을 식별하고 표시하는 도구를 배포했습니다.

Lyria 3는 오늘부터 18세 이상 모든 제미니(Gemini) 사용자에게 데스크톱 버전으로 영어 및 몇 가지 추가 언어로 제공됩니다. 모바일 버전은 향후 며칠 내에 출시될 예정입니다. Google AI Plus, Pro, Ultra 구독자는 더 높은 생성 한도를 이용할 수 있습니다. 또한 이 모델은 기존에 미국에서만 제공되던 YouTube의 Dream Track 기능을 전 세계로 확대하여 Shorts 크리에이터가 AI로 생성된 배경 음악을 동영상에 사용할 수 있도록 합니다.

섹터:

거버넌스

디파이

점프 크립토

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트