위키미디어 재단은 변화하는 온라인 환경 속에서 장기적인 지속가능성을 강화하기 위해 인공지능 기업들과 새로운 파트너십을 체결했다고 발표했습니다. 이 파트너십을 통해 기업들은 위키피디아 콘텐츠를 활용하여 인공지능 모델을 학습시키고 활용할 수 있게 됩니다.
이번 계약은 위키미디어 재단의 상용 제품인 위키미디어 엔터프라이즈를 통해 체결되었습니다. 위키미디어 엔터프라이즈는 위키미디어 프로젝트 콘텐츠를 대규모로 재사용하고 배포하는 사용자를 위해 설계되었습니다. 새롭게 가입한 기업으로는 에코시아, 마이크로소프트, 미스트랄 AI, 퍼플렉시티, 플레이아스, 프로라타 등이 있으며, 기존 파트너인 아마존, 구글, 메타 등에 합류하게 됩니다.
재단은 성명 에서 "인공지능 시대에 위키피디아와 그 안에 담긴 인간의 창작 및 선별된 지식은 그 어느 때보다 더 가치 있다"고 밝혔다.
"위키피디아의 지식은 생성형 AI 챗봇, 검색 엔진, 음성 비서 등을 움직이는 원동력입니다. 위키피디아는 대규모 언어 모델 학습에 사용되는 최고 품질의 데이터 세트 중 하나입니다."
이번 발표는 위키피디아 25주년 기념 업데이트의 일환으로 이루어졌습니다.
이 온라인 백과사전은 전 세계에서 가장 많이 방문하는 웹사이트 상위 10위 안에 들며, 그중 유일하게 비영리 단체가 운영하는 사이트입니다. 재단에 따르면 300개 이상의 언어로 제공되는 6,500만 개 이상의 기사는 매달 약 150억 회 조회됩니다.
하지만 위키피디아는 트래픽 패턴이 변화하고 있다고 경고했습니다. 지난 10월, 위키피디아에 대한 사람의 방문 횟수가 전년 대비 8% 감소했다고 발표하면서 , 그 원인으로 사용자들이 사이트를 직접 방문하는 대신 AI가 생성한 요약본에 의존하는 경향을 꼽았습니다. 현재 구글 검색의 약 60%는 클릭 없이 끝나고, 웹페이지 내 응답은 위키피디아 콘텐츠를 기반으로 하는 경우가 많습니다.
이번 계약은 AI 기업들이 학습 데이터를 확보하는 방식에 대한 광범위한 논쟁 속에서 이루어졌습니다. 대규모 언어 모델은 일반적으로 방대한 양의 온라인 자료를 기반으로 학습되는데, 이는 저작권자의 허가 없이 저작물을 사용하는 것은 저작권 침해라고 주장하는 저작자, 출판사 및 기타 권리 보유자들의 비판을 받아왔습니다.
그중에서도 레딧은 자사 콘텐츠를 모델 학습에 사용한 것과 관련하여 여러 AI 회사와 소송 에 휘말려 있지만, 구글과 같은 회사와는 라이선스 계약을 체결하기도 했습니다.
목요일, 주요 출판사인 아셰트 북 그룹(Hachette Book Group)과 센게이지 그룹(Cengage Group)은 구글이 인공지능 플랫폼 '제미니(Gemini) )' 개발 과정에서 "오랜 기간 저작권을 침해했다"며 제기된 집단 소송에 참여하겠다는 신청서를 제출했습니다. 소송 내용은 구글이 인공지능 학습 과정에서 적절한 라이선스 없이 도서를 복제했다는 것입니다. 이 소송은 원래 2023년 작가 그룹이 제기한 것입니다.
오픈아이(OpenAI)는 '왕좌의 게임' 작가 조지 RR 마틴을 포함한 원고들로부터 유사한 소송 에 직면해 있습니다.
엔터테인먼트 회사들도 이 문제를 제기하고 있습니다. 12월 중순, 디즈니는 구글에 저작권 침해를 이유로 사용 중지 및 경고장을 보냈 는데, 이는 디즈니가 AI 생성 영상에 사용되는 수백 개의 캐릭터에 대한 라이선스 계약을 오픈AI와 별도로 체결한 것과는 상반되는 조치였습니다. 디즈니는 다른 AI 기업들에도 유사한 통지서를 보냈으며, 주요 스튜디오들과 함께 이미지 생성 회사인 미드저니를 상대로 소송을 진행 중입니다.
같은 달, 작가, 배우, 기술 전문가들로 구성된 연합체가 엔터테인먼트 업계에서 인공지능(AI)의 훈련 및 사용 방식을 규제하는 강제적인 기준을 마련하기 위한 새로운 업계 단체를 출범시켰습니다 . 나탈리 포트만, 케이트 블란쳇, 벤 애플렉, 기예르모 델 토로, 타이카 와이티티 등 500명이 넘는 유명 인사들이 이 계획을 지지했습니다.
유럽연합 집행위원회는 또한 구글이 정당한 보상이나 동의 없이 출판사 및 유튜브 콘텐츠를 자사 AI 서비스에 활용하여 EU 경쟁법을 위반했는지 여부에 대해 공식적인 반독점 조사를 시작했습니다 .
저작권자들이 궁극적으로 구제책을 찾을 수 있을지는 확실하지 않습니다. 최근 미국 연방 판사들은 메타와 앤트로픽 측에 부분적인 승리를 안겨주며, AI 모델 훈련에 저작권이 있는 책을 사용한 것은 공정 사용에 해당한다고 판결했지만, 불법 복제 저작물을 영구적으로 보관하는 행위에 대해서는 비판했습니다.





