아마존 지원 기업 앤트로픽의 AI 전문가가 저작권이 있는 노래 가사를 허가 없이 AI 모델 학습에 사용했다는 주장에 대응하기 위한 법정 제출 서류에서 허위 학술 논문을 인용했다는 의혹을 받고 있습니다.
앤트로픽의 데이터 과학자 올리비아 첸이 제출한 이 서류는 유니버설 뮤직 그룹, 콩코드, ABKCO 및 기타 주요 출판사가 제기한 7,500만 달러 소송에 대한 법적 대응의 일부였습니다.
2023년 소송에서 출판사들은 앤트로픽이 비욘세, 롤링 스톤스, 비치 보이스 등의 수백 곡의 가사를 불법적으로 사용하여 클로드 언어 모델을 학습시켰다고 주장했습니다.
첸의 선서 진술서에는 클로드가 저작권이 있는 가사를 매우 드물고 특정한 조건에서만 재현한다는 앤트로픽의 주장을 뒷받침하기 위해 아메리칸 스태티스티션 저널의 논문을 인용했습니다.
샌호세에서 열린 화요일 청문회에서 원고 측 변호사 맷 오펜하임은 이 인용을 "완전한 날조"라고 불렀지만, 첸이 의도적으로 만들어낸 것은 아니며 아마도 클로드 자체를 사용해 출처를 생성했을 것이라고 말했습니다.
앤트로픽의 변호사 시 담레는 첸의 오류가 잘못된 인용일 뿐이며 날조가 아니라고 법정에서 주장했으며, 원고 측이 절차 후반에 이 문제를 제기한 점을 비판했습니다.
미국 치안판사 수잔 밴 클런은 이 문제가 "매우 심각하고 중대한" 우려를 제기한다며, "잘못된 인용과 AI가 생성한 환각 사이에는 엄청난 차이가 있다"고 언급했습니다.
그녀는 첸에 대해 즉시 질문하는 요청을 거부했지만, 앤트로픽에 목요일까지 이 주장에 대해 공식적으로 대응하도록 명령했습니다.
앤트로픽은 디크립트의 논평 요청에 즉시 응답하지 않았습니다.
앤트로픽을 상대로 한 소송은 2023년 10월에 제기되었으며, 원고들은 앤트로픽의 클로드 모델이 대량의 저작권이 있는 가사로 학습되었고 요청 시 이를 재현한다고 주장했습니다.
그들은 손해배상, 학습 데이터셋 공개, 침해 콘텐츠 파기를 요구했습니다.
앤트로픽은 2024년 1월에 자사 시스템이 저작권 가사를 출력하도록 설계되지 않았다고 반박했습니다.
이러한 재현을 "드문 버그"로 규정하고, 출판사들이 일반 사용자가 침해 콘텐츠를 접했다는 증거를 제시하지 못했다고 비난했습니다.
2024년 8월, 앤트로픽은 앤드레아 바르츠, 찰스 그레이버, 커크 월리스 존슨 작가들로부터 또 다른 소송을 받았습니다. 이들은 앤트로픽이 클로드를 해적판 도서로 학습시켰다고 주장했습니다.
이 사건은 저작권이 있는 자료를 동의 없이 학습 데이터셋에 포함시킨 생성형 AI 기업들에 대한 점점 커지는 역풍의 일부입니다.
오픈AI는 코미디언 사라 실버만, 작가 길드, 뉴욕 타임스로부터 저작권이 있는 책과 기사를 허가나 라이선스 없이 GPT 모델 학습에 사용했다는 여러 소송에 직면해 있습니다.
메타도 유사한 소송에 이름이 올라있으며, 원고들은 메타의 LLaMA 모델이 해적판 데이터셋에서 추출한 무단 문학 작품으로 학습되었다고 주장하고 있습니다.
한편 3월, 오픈AI와 구글은 AI 학습에 대한 저작권 제한을 완화해달라고 트럼프 행정부에 요청했으며, 향후 미국 "AI 액션 플랜"을 위한 공식 제안에서 이를 혁신의 장애물로 규정했습니다.
영국에서는 AI 기업이 저작권 보호 작품을 허가 없이 사용할 수 있게 하는 정부 법안이 이번 주 난관에 부딪혔습니다. 상원이 AI 기업이 모델에 사용한 저작권 자료를 공개하도록 요구하는 수정안을 지지했기 때문입니다.






