불법 복제 전자책과 학술 논문을 검색 가능하게 만드는 것으로 가장 잘 알려진 그림자 도서관 인 안나스 아카이브(Anna's Archive)는 이번 주말 역사상 최대 규모의 음악 불법 복제 작전을 발표했습니다. "스포티파이를 백업했습니다."
해당 그룹은 스포티파이에서 8,600만 개의 오디오 파일을 수집했으며, 이는 사람들이 실제로 스포티파이에서 듣는 모든 콘텐츠의 99.6%에 해당한다고 주장했습니다. 총 용량은 약 300테라바이트이며, 대량 토렌트를 통해 배포되었습니다.
스포티파이는 불쾌감을 드러냈습니다. 스포티파이 대변인은 빌보드와 의 인터뷰에서 "제3자가 공개된 메타데이터를 수집하고 불법적인 수법을 이용해 DRM을 우회해 플랫폼의 일부 오디오 파일에 접근했다"고 밝혔습니다. 여기서 "일부"라는 표현에 주목해야 합니다. 애나스 아카이브는 해당 파일 수가 8,600만 개에 달한다고 주장하지만, 스포티파이는 정확한 규모를 확인해주지 않고 있습니다. 스포티파이는 또한 해당 단체를 "반저작권 극단주의자" 라고 비난하며, 이들이 이전에도 유튜브 콘텐츠를 불법 복제한 전력이 있다고 지적했습니다.
그렇다면 스포티파이와 음반 아티스트(그들의 수입은 주로 저작권료에서 나옵니다)를 속인 것 외에, 그들은 정확히 무엇을 얻었을까요?
안나스 아카이브(Anna's Archive)는 스포티파이(Spotify)의 2억 5,600만 곡 중 99%에 해당하는 음원의 메타데이터를 보유하고 있다고 주장합니다. 여기에는 실제로 사람들이 듣는 8,600만 곡의 음원 파일도 포함됩니다. 이 메타데이터 데이터베이스에는 1억 8,600만 개의 고유한 ISRC(국제 표준 녹음 코드)가 저장되어 있습니다. 비교하자면, 가장 큰 규모의 합법적인 공개 음악 데이터베이스인 뮤직브레인 즈(MusicBrainz )는 약 500만 개의 ISRC를 보유하고 있습니다. 안나스 아카이브는 이보다 37배나 더 큰 규모의 데이터베이스를 구축한 것입니다.
인기곡들은 원본 OGG Vorbis 포맷(초당 160킬로비트) 그대로 보존하여 재인코딩이나 음질 손실 없이 저장했습니다. 인기가 덜한 곡들은 공간 절약을 위해 OGG Opus 포맷(초당 75킬로비트)으로 압축했습니다. 제작진은 Spotify 자체의 인기 지표를 활용하여 어떤 곡을 먼저 추출할지 우선순위를 정했고, 인기 점수가 0점 이상인 곡들을 우선적으로 추출했습니다.
Spotify에 있는 2억 5,600만 곡 중 70% 이상이 인기 점수가 0점입니다. 아무도 듣지 않는다는 뜻이죠. 인기 점수 상위 1만 곡은 70점에서 100점 사이입니다. 약 21만 곡, 즉 전체 곡의 약 0.1%만이 인기 점수 50점 이상을 받았습니다. 이 0.1%가 전체 청취 활동의 대부분을 차지합니다.
현재 스포티파이에서 가장 인기 있는 세 곡은 무엇일까요? 레이디 가가와 브루노 마스의 "Die With A Smile"(30억 7천만 스트리밍), 빌리 아일리시의 "BIRDS OF A FEATHER"(31억 3천만 스트리밍), 그리고 배드 버니의 "DtMF"(11억 2천만 스트리밍)입니다. 이 세 곡의 총 스트리밍 횟수만 해도 하위 2천만에서 1억 곡을 모두 합친 것보다 많습니다.
다시 말해, 스포티파이는 대부분 아무도 듣지 않을 노래들의 무덤과 같습니다. 스포티파이는 그 무덤(전체 음원 목록)을 아카이빙하지 않기로 결정했는데, 그 이유는 전체 청취 활동의 0.04%에 불과한 콘텐츠를 위해 추가로 700테라바이트의 저장 공간이 필요했기 때문입니다. 게다가 그 대부분은 AI가 생성한 엉터리 콘텐츠입니다.
안나의 기록보관소는 그들이 발견한 내용에 대한 광범위한 분석 결과를 발표했습니다. 그중 일부는 예상 가능했지만, 일부는 기이했습니다.
트랙 길이는 정확히 2분, 3분, 4분에 집중되어 있습니다. 그룹 측은 그 이유를 알 수 없다고 밝혔습니다. 앨범 발매량은 2015년 이후 기하급수적으로 증가하여 2023년 한 해에만 1천만 장 이상의 앨범이 발매되었는데, 이는 인공지능(AI) 기반 생성과 자동 업로드 때문인 것으로 추정됩니다.
일렉트로닉/댄스 장르가 아티스트 수 기준으로 가장 큰 장르(520,075명)이며, 그 다음으로 록(370,179명)과 월드/전통 음악(202,529명)이 뒤를 잇습니다.
또한 믿기 어렵겠지만, 오페라, 합창, 실내악은 특정 하위 장르별로 가장 많은 아티스트를 보유하고 있습니다.
오디오 특징 데이터 분석 결과, 음량은 에너지와 강한 상관관계를 보이며(놀랄 일도 아니지만), BPM은 120 부근에 집중되어 정규 분포를 따르고, 대부분의 트랙은 "음성"과 "악기 연주" 점수가 낮아 보컬이 주를 이룬다는 것을 알 수 있습니다. 가장 흔한 조성은 C장조와 G장조입니다. Spotify에 있는 전체 트랙 중 약 13.5%가 선정적인 콘텐츠로 분류되어 있습니다.
안나의 아카이브는 이를 불법 복제가 아닌 보존으로 규정합니다. 블로그 게시글에는 "우리는 보존을 최우선 목표로 하는 음악 아카이브를 구축하는 것이 우리의 역할이라고 생각했습니다."라고 적혀 있습니다. 이 단체는 기존의 음악 아카이빙 노력이 인기 아티스트와 음질 포맷(무손실 FLAC)에 지나치게 집중되어 있어, 플랫폼 정책 변경이나 서비스 종료 시 잘 알려지지 않은 음악이 사라질 위험에 처해 있다고 주장합니다.
어느 정도 일리가 있는 말입니다. 스포티파이는 2억 5,600만 곡의 음원을 관리하며, 콘텐츠를 삭제하거나, 라이선스 조건을 변경하거나, 아예 사라질 수도 있습니다. 반면, 분산형 토렌트 배포 방식은 어느 한 주체가 막을 수 없는 중복성을 만들어냅니다. 데이터는 이미 전 세계 수천 개의 토렌트 노드에 분산되어 있습니다.
하지만 솔직히 말해봅시다. 이것도 결국 불법 복제입니다. 스포티파이는 아티스트에게 스트리밍 한 번당 0.003달러에서 0.005달러 정도를 지급합니다. 디토뮤직의 스포티파이 수익 계산기에 따르면, 100만 번 재생되면 아티스트는 4,370달러의 로열티를 받게 됩니다. 토렌트를 통한 무료 배포는 이러한 최소한의 보상마저 없애버립니다.
두 가지 모두 동시에 참입니다.
안나스 아카이브는 이미 거센 법적 압력에 직면해 있습니다. 벨기에는 2025년 7월 최대 50만 유로의 벌금을 부과하는 접속 차단 명령을 내렸고, 영국은 2024년 12월 고등법원에서 접속 차단 명령을 확보했습니다. 독일의 주요 인터넷 서비스 제공업체(ISP)들은 2025년 10월 해당 사이트의 주요 도메인을 차단했습니다. 구글 자체 투명성 보고서에 따르면, 구글은 2012년 이후 접수된 모든 DMCA 삭제 요청의 5%에 해당하는 7억 4,900만 개의 안나스 아카이브 URL을 검색 결과에서 삭제했습니다.
합법적인 비영리 단체인 인터넷 아카이브는 더 이상 사용되지 않는 78rpm 레코드를 디지털화한 '그레이트 78 프로젝트'로 인해 음반사들이 제기한 6억 2100만 달러의 손해배상 소송을 합의로 마무리했습니다 . 그런데 안나스 아카이브는 그보다 3만 1000배나 더 많은, 모두 최신 인기곡들을 아카이빙했습니다. 음악 업계의 법적 대응은 인터넷 아카이브 사건을 오히려 소박하게 보이게 할 정도입니다.
해커 뉴스(Hacker News) 에서 댓글 작성자들은 스포티파이의 편리함을 고려할 때 해당 아카이브가 실제로 소비자에게 유용할지에 대해 논쟁을 벌였습니다. 한 댓글 작성자는 안나의 아카이브(Anna's Archive)가 이미 수만 달러에 "기업 수준"의 도서 아카이브 접근 권한을 제공하고 있다는 점을 지적하며, 이는 사실상 AI 기업에 대량 데이터 접근 권한을 학습용으로 판매하는 것이라고 설명했습니다.
현재로서는 메타데이터만 완전히 공개되었습니다. 오디오 파일은 가장 인기 있는 트랙부터 시작하여 대량 토렌트를 통해 점진적으로 배포되고 있습니다. 안나스 아카이브는 사용자들에게 토렌트 시딩을 도와달라고 요청했으며, 충분한 관심이 있다면 개별 파일 다운로드도 추가할 수 있다고 언급했습니다.
소송이 제기될 가능성이 높습니다. 문제는 그 소송에서 아카이브가 살아남을 수 있느냐는 것인데, 사실 지금 시점에서는 그다지 중요하지 않을지도 모릅니다. 데이터는 이미 수천 개의 노드에 분산되어 중앙에서 차단할 수 없는 상태로 퍼져 있습니다. 토렌트의 핵심이 바로 그런 것이죠.





