메타는 인공 지능 시스템을 훈련시키기 위해 수천 개의 음란물 비디오를 불법적으로 다운로드하고 배포했다는 소송을 기각해 달라고 미국 법원에 요청했습니다.
월요일 캘리포니아 북부 지방 법원에 제출된 기각 동의안 에서는 Meta의 AI 모델이 저작권이 있는 자료를 포함하거나 이를 바탕으로 훈련되었다는 증거가 없으며, 이러한 주장은 "터무니없고 근거가 없다"고 주장했습니다.
이 신청은 목요일에 Ars Technica 에서 처음 보도 되었으며, Meta는 이 주장이 "거짓"이라고 말하며 직접적으로 부인했습니다.
원고들은 "추측과 암시로 이 이야기를 엮어내기 위해 많은 노력을 기울였지만, 그들의 주장은 설득력이 없고 잘 입증된 사실로 뒷받침되지 않는다"고 동의안에 적혀 있습니다.
원래 고소는 Strike 3 Holdings가 7월에 제기했으며, Meta가 2018년부터 다중 모드 AI 시스템을 구축하려는 광범위한 노력의 일환으로 기업 및 은닉된 IP 주소를 사용하여 약 2,400편의 성인 영화를 토런트로 다운로드했다고 주장했습니다.
Strike 3 Holdings는 Vixen, Blacked, Tushy 등의 브랜드로 콘텐츠를 배포하는 마이애미에 본사를 둔 성인 영화 홀딩 회사입니다.
디크립트(Decrypt) Meta와 Strike 3 Holdings, 그리고 각 회사의 법률 고문에게 연락을 취했으며, 연락이 오는 경우 이 기사를 업데이트하겠습니다.
메타의 동의안은 주장된 다운로드의 규모와 패턴이 Strike 3의 AI 훈련 이론과 모순된다고 주장합니다.
7년 동안 Strike 3의 영화 중 Meta의 기업 IP 주소를 사용하여 다운로드된 것은 157개에 불과했으며, 이는 47개의 다른 주소에서 연평균 약 22개에 해당합니다.
메타 변호사 앤젤라 L. 더닝은 이를 "다양한 개인"이 "개인적인 용도"로 저지른 "빈약하고 조직화되지 않은 활동"으로 규정했으며, 따라서 Strike 3가 주장하는 것처럼 기술 거대 기업이 AI 훈련을 위한 데이터를 수집하려는 노력의 일부가 아니었다고 설명했습니다.
이 동의안은 또한 Strike 3가 Meta가 2,500개 이상의 "숨겨진" 제3자 IP 주소를 사용했다는 주장을 반박하며, Strike 3가 해당 주소의 소유자가 누구인지 확인하지 않고 대신 느슨한 "상관관계"를 만들었다고 주장합니다.
IP 범위 중 하나는 Meta와 링크(Chainlink) 없는 하와이 비영리 단체에 등록된 것으로 알려졌으며, 다른 IP 범위는 소유자가 확인되지 않았습니다.
메타는 또한 해당 다운로드 사실을 알고 있었거나, 이를 막을 수 있었다는 증거가 없다고 주장하며, 이를 통해 아무런 이득도 얻지 못했으며, 글로벌 네트워크의 모든 파일을 모니터링하는 것은 간단하지도 않고 법적으로 요구되는 것도 아니라고 덧붙였다.
메타의 변호는 처음에는 "특이하다"고 보일 수 있지만, 벤처 자본 회사인 Ryze Labs의 공동 창립자인 더멋 맥그래스가 디크립트(Decrypt) 밝힌 바에 따르면, 핵심 주장은 "모델 학습에 해당 자료가 사용되지 않았다"는 것입니다.
맥그래스는 "메타가 모델에 데이터가 사용되었다는 것을 인정한다면, 공정 사용에 대한 주장을 펼치고, 불법 복제 콘텐츠를 포함시킨 것을 정당화해야 하며, 내부 교육 및 감사 시스템에서 발각될 수 있는 상황에 노출되어야 합니다."라고 말하며, 데이터가 어떻게 사용되었는지 변호하는 대신 "전혀 사용된 적이 없다"고 부인했다고 덧붙였습니다.
하지만 법원이 그러한 방어수단을 유효하다고 인정한다면 "엄청난 허점"이 생길 수 있다고 맥그래스는 말했다. "AI 학습 데이터 소송에 대한 저작권 보호를 사실상 약화시킬 수 있다"며, 향후 소송에서는 "기업의 지시에 대한 더 강력한 증거가 필요하게 될 것"이라고 경고했다. "기업들은 오히려 이를 숨기는 데 더 능숙해질 것"이라고 덧붙였다.
그래도 안전이나 검토 도구를 개발하는 등 노골적인 자료를 처리하는 데에는 정당한 이유가 있습니다.
맥그래스는 "대부분의 주요 AI 기업들은 유해한 메시지를 사용하여 모델의 취약점을 조사하고 AI가 노골적이거나 위험하거나 금지된 콘텐츠를 생성하도록 유도하는 '레드팀'을 보유하고 있습니다."라고 말했습니다. "효과적인 안전 필터를 구축하려면 블록 하려는 사례에 대한 필터를 학습시켜야 합니다."




