以提供盜版電子書和學術論文搜尋服務而聞名的秘密圖書館Anna's Archive本週末宣布了一項可能是歷史上最大的音樂盜版行動:“我們備份了 Spotify。”
該組織聲稱他們從Spotify抓取了8,600萬個音訊文件,佔該平台用戶實際收聽內容的99.6%。總大小略低於300TB,透過大量BT下載傳播。
Spotify對此很不高興。發言人告訴Billboard ,「第三方抓取了公開的元數據,並使用非法手段繞過DRM(數位版權管理),獲取了平台上的部分音訊檔案。」注意這裡措辭很謹慎:「部分」音訊檔案。 Anna's Archive網站稱有8,600萬個音訊檔案被偷走。 Spotify並未證實這個數字。該公司還稱該組織為「反版權極端分子」 ,他們先前曾盜版YouTube的內容。
那麼,除了剽竊 Spotify 和主要依靠版稅收入的錄音藝術家之外,他們究竟得到了什麼?
Anna's Archive 聲稱擁有 Spotify 曲庫中 2.56 億首歌曲中 99% 的元數據,其中包括 8600 萬首真正重要的歌曲(也就是人們經常播放的歌曲)的音訊檔案。僅元資料資料庫就包含 1.86 億個唯一的 ISRC(國際標準錄音代碼)。相較之下,最大的合法開放音樂資料庫MusicBrainz 的ISRC 數量約為 500 萬。 Anna's Archive 建構的資料庫規模是 MusicBrainz 的 37 倍。
熱門歌曲以原始的 OGG Vorbis 格式(160 kbps)保留,未進行重新編碼,因此音質無損。不太熱門的歌曲則被壓縮成 OGG Opus 格式(75 kbps)以節省空間。團隊使用 Spotify 的流行度指標來確定優先抓取哪些歌曲,並專注於流行度得分高於零的歌曲。
Spotify 2.56 億首歌曲中,超過 70% 的歌曲流行度得分為零,幾乎無人問津。前 1 萬的歌曲流行度得分在 70 到 100 之間。只有約 21 萬首歌曲(約佔曲庫的 0.1%)流行度得分達到 50 或更高。而這 0.1% 的歌曲卻佔了絕大部分的收聽量。
目前Spotify播放量最高的三首歌分別是:Lady Gaga和Bruno Mars的《Die With A Smile》(30.7億次播放)、Billie Eilish的《BIRDS OF A FEATHER》(31.3億次播放)以及Bad Bunny的《DtMF》(11.2億次播放)。這三首歌的總播放量就超過了播放量最低的2000萬到1億首歌的總和。
換句話說,Spotify 基本上就是一個歌曲墳場,裡面堆滿了無人問津的歌曲。 Spotify 決定不把這個「墳場」(完整的曲庫)存檔——因為僅僅佔收聽量 0.04% 的內容,就需要額外 700 TB 的儲存空間。而且,其中很多都是人工智慧生成的垃圾歌曲。
安娜檔案館發表了對他們發現的詳細分析。其中有些結果在意料之中,有些則令人匪夷所思。
歌曲長度明顯集中在 2 分鐘、3 分鐘和 4 分鐘這幾個時段。團隊表示他們也不知道原因。自 2015 年以來,專輯發行量呈指數級增長,僅在 2023 年就預計將發行超過 1000 萬張專輯——這很可能是由人工智慧生成和自動上傳驅動的。
電子/舞曲是藝人數量最多的音樂類型(520,075),其次是搖滾(370,179)和世界/傳統音樂(202,529)。
另外,信不信由你,歌劇、合唱和室內樂這三個子流派的藝術家數量最多。
音頻特徵數據顯示,響度與能量密切相關(這並不令人意外),BPM 值集中在 120 左右,呈正態分佈,大多數曲目的“人聲”和“樂器”得分較低——這意味著人聲占主導地位。 C 大調和 G 大調是最常見的調。 Spotify 上約有 13.5% 的曲目被標記為包含露骨內容。
Anna's Archive 將此舉定義為保存而非盜版。 「我們認為我們在這裡可以發揮作用,建立一個主要以保存為目標的音樂檔案館,」該組織在其部落格文章中寫道。他們認為,現有的音樂存檔工作過於專注於流行歌手和發燒級音質格式(無損 FLAC),導致一些冷門音樂一旦平台改變政策或關閉,就很容易消失。
這話不無道理。 Spotify 控制著 2.56 億首歌曲,可以刪除內容、更改授權條款,甚至徹底消失。而去中心化的種子分發方式則創造了冗餘機制,任何單一實體都無法關閉。數據已經分散在全球數千個種子節點。
但說實話,這其實就是盜版。 Spotify 給藝術家的報酬是每次播放0.003 到 0.005 美元。根據 Dittomusic 的 Spotify 收入計算器,100 萬次播放量能為藝術家帶來 4,370 美元的版稅。而透過種子文件免費傳播,連這點微薄的收入都拿不到。
這兩件事同時成立。
Anna's Archive 已面臨越來越大的法律壓力。比利時於2025 年 7 月發布了封鎖令,並處以最高 50 萬歐元的罰款。英國於 2024 年 12 月通過高等法院獲得了封鎖令。德國的主要網路服務供應商於 2025 年 10 月封鎖了該網站的主要網域。根據Google自身的透明度報告,Google已從搜尋結果中移除了7.49 億個Anna's Archive 的 URL——這佔該搜尋引擎自 2012 年以來收到的所有 DMCA 刪除請求的 5%。
網路檔案館(Internet Archive)是一家合法的非營利機構,它因其「偉大78計畫」(Great 78 Project)將過時的78轉唱片數位化而與出版商達成和解,此前出版商索賠6.21億美元。而安娜檔案館(Anna's Archive)剛剛存檔的曲目數量是其3.1萬倍,而且全部都是當下熱門的流行歌曲。音樂產業的法律回應會讓網路檔案館的案例顯得微不足道。
在Hacker News上,評論者們就 Spotify 的便利性是否足以滿足消費者需求展開了辯論。有人指出,Anna's Archive 已經以數萬美元的價格提供「企業級」圖書庫存取權限——本質上是將大量資料出售給人工智慧公司用於訓練。
目前,只有元數據已完全發布。音訊檔案正透過大量種子逐步發布,首先發布的是最熱門的曲目。 Anna's Archive 請求用戶幫忙做種,並表示如果需求足夠,他們可能會添加單一文件的下載。
訴訟很可能即將到來。唯一的問題是,存檔能否在訴訟中倖存下來——但到了現在,這可能已經無關緊要了。資料已經存在於網路上,分佈在成千上萬個節點上,這些節點無法被集中關閉。這正是BT下載的意義。





