維基媒體基金會宣佈與多家人工智能公司建立新的合作伙伴關係,這些公司將能夠利用維基百科的內容來訓練和驅動其人工智能模型。這家非營利組織希望在不斷變化的網絡行為中鞏固其長期可持續性。
這些協議是通過維基媒體企業版(Wikimedia Enterprise)簽署的,該平臺是維基媒體基金會面向大規模內容再利用者和分發者的商業產品。新簽約的合作伙伴包括 Ecosia、微軟、Mistral AI、Perplexity、Pleias 和 ProRata。他們將與亞馬遜、谷歌和 Meta 等現有合作伙伴攜手合作。
“在人工智能時代,維基百科及其人類創建和整理的知識從未像現在這樣有價值,”該基金會在一份聲明中表示。
“它的知識庫為生成式人工智能聊天機器人、搜索引擎、語音助手等提供了強大的支持。維基百科是訓練大型語言模型所使用的最高質量的數據集之一。”
該公告是為慶祝維基百科成立25週年而推出的更新的一部分。
該在線百科全書是全球訪問量排名前十的網站之一,也是其中唯一一家由非營利組織運營的網站。據該基金會稱,其收錄的6500多萬篇文章,以300多種語言發佈,每月瀏覽量近150億次。
然而,維基百科也發出警告,流量模式正在發生變化。10月份,維基百科表示,用戶對網站的訪問量同比下降了8%,並將此歸因於用戶更多地依賴人工智能生成的摘要,而不是直接訪問網站。如今,近60%的谷歌搜索在沒有點擊的情況下就結束了,頁面上的搜索結果往往來自維基百科的內容。
這些交易正值人工智能公司如何獲取訓練數據引發廣泛討論之際。大型語言模型通常使用海量的在線資料進行訓練,這種做法招致了作者、出版商和其他版權所有者的批評,他們認為未經許可使用受版權保護的作品構成侵權。
其中,Reddit 因使用其內容訓練模型而與多家人工智能公司發生訴訟,儘管它已與谷歌等公司達成許可協議。
週四,大型圖書出版商阿歇特圖書集團(Hachette Book Group)和聖智學習出版集團(Cengage Group) 提交動議,要求加入針對谷歌的集體訴訟。該訴訟指控谷歌在構建其Gemini人工智能平臺的過程中實施了“歷史性的版權侵權”。訴訟稱,谷歌在人工智能訓練過程中未經授權複製了書籍。此案最初由一群作家於2023年提起。
OpenAI 也面臨著類似的訴訟,原告包括《權力的遊戲》作者喬治·R·R·馬丁。
娛樂公司也在積極推動此事。12月中旬,迪士尼向谷歌發出停止侵權通知函,指控其侵犯版權。與此同時,迪士尼卻與OpenAI達成了一項單獨的授權協議,涵蓋數百個用於人工智能生成視頻的角色。迪士尼還向其他人工智能公司發出了類似的通知,並與其他大型電影公司聯手,對圖像生成公司Midjourney提起訴訟。
同月,由作家、演員和技術專家組成的聯盟成立了一個新的行業組織,旨在推動制定可強制執行的標準,規範人工智能在娛樂行業的訓練和使用方式。超過500位知名人士支持這項倡議,其中包括娜塔莉·波特曼、凱特·布蘭切特、本·阿弗萊克、吉爾莫·德爾·託羅和塔伊加·維迪提。
歐盟委員會也已正式啟動反壟斷調查,以查明谷歌是否違反歐盟競爭規則,未經公平補償或徵得同意,使用出版商和 YouTube 的內容來支持其人工智能服務。
版權所有者最終能否獲得救濟尚不確定。美國聯邦法官近期對Meta和Anthropic公司做出了部分勝訴判決,裁定它們使用受版權保護的書籍訓練人工智能模型屬於合理使用,但同時批評這兩家公司永久保存盜版作品庫。




