소송은 결코 사랑의 축제가 아니지만, 뉴욕 타임스와 OpenAI 및 Microsoft 간의 저작권 싸움은 특히 격렬해지고 있습니다. 이번 주, 타임스는 OpenAI의 엔지니어들이 잠재적인 증거로 팀이 150시간 이상 추출한 데이터를 실수로 지웠다고 주장했습니다.
OpenAI는 데이터의 대부분을 복구할 수 있었지만, 타임스 법률팀은 여전히 원본 파일 이름과 폴더 구조가 누락되었다고 말합니다. 수요일 법원에 제출된 선언문에 따르면, 이는 "뉴스 원고의 복사된 기사가 OpenAI의 인공지능 모델에 어떻게 통합되었는지 확인할 수 없다"는 것을 의미합니다.
"우리는 제기된 주장에 동의하지 않으며 곧 답변을 제출할 것입니다."라고 OpenAI 대변인 Jason Deutrom이 WIRED에 전했습니다. 뉴욕 타임스는 의견을 밝히지 않았습니다.
타임스는 지난해 OpenAI와 Microsoft를 상대로 저작권 소송을 제기했는데, 이 회사들이 ChatGPT와 같은 인공지능 도구를 훈련하기 위해 기사를 불법적으로 사용했다고 주장했습니다. 이 사건은 진행 중인 많은 법적 분쟁 중 하나입니다.
타임스 사건은 현재 증거 수집 단계에 있으며, 양측은 증거가 될 수 있는 문서와 정보를 제출하고 있습니다. 이 과정의 일환으로 OpenAI는 법원의 명령에 따라 타임스에 자사의 훈련 데이터를 공개해야 했습니다. OpenAI는 이를 위해 "샌드박스"라고 불리는 두 개의 "가상 머신"을 만들었고, 타임스 변호사들이 이를 살펴볼 수 있었습니다. Maisel 변호사의 선언문에 따르면, OpenAI 엔지니어들이 이 중 한 곳에 있던 타임스 팀이 정리한 데이터를 "지웠다"고 합니다.
Maisel의 제출서에 따르면, OpenAI는 정보가 삭제되었음을 인정하고 이달 초 이 문제를 해결하려 했습니다. 그러나 신문사 변호사들이 "복구된" 데이터를 살펴보니 너무 무질서해서 "상당한 시간과 컴퓨터 처리 시간을 들여 처음부터 다시 작업해야 했다"고 다른 타임스 변호사들이 서한에 밝혔습니다.
변호사들은 삭제가 "의도적이지 않았다"고 믿는다고 밝혔습니다. Maisel 변호사의 서한과 함께 제출된 이메일에서 OpenAI 변호사 Tom Gorman은 데이터 삭제를 "오류"라고 언급했습니다.
이는 이 소송에서 발생한 첫 번째 분쟁이 아닙니다. 지난 1년 동안 타임스와 기술 기업들은 누가 훈련 데이터를 정리해야 하는지를 두고 싸워왔습니다. 최근 서한에서 신문사 변호사들은 OpenAI가 이를 더 잘 할 수 있다고 다시 주장했습니다. "이 과정은 순조롭지 않았다"고 타임스 변호사 Steven Lieberman은 이달 초 제출한 서면에서 밝혔습니다.
타임스는 최근 OpenAI와 Microsoft에 Ilya Slutskever와 Brad Lightstone 등 주요 OpenAI 인사들의 Slack 메시지, 문자 메시지, 소셜 미디어 대화를 제공하도록 요구했습니다. 지난주 뉴욕 타임스는 법원에 Microsoft와 OpenAI가 추가 자료를 공개하도록 요구하는 또 다른 서한을 제출했습니다. 한 첨부 파일에는 전 OpenAI CTO Mira Murati가 개인 휴대전화 "접근을 거부"했다는 이메일이 포함되어 있었습니다.
한편 Microsoft는 뉴욕 타임스에 자사의 생성형 AI 사용과 관련된 문서를 제출하도록 요청했습니다. 법정 문서에서 Microsoft는 특히 스타 기술 칼럼니스트 Kevin Roose(법정 문서에서는 "Kevin Rouse"로 표기)를 언급했습니다. Microsoft는 타임스의 AI 도구 사용 정보가 자사의 변론에 여러 가지 방식으로 관련될 수 있다고 주장했습니다. Roose는 의견을 밝히지 않았습니다.
이 사건과 다른 유사한 사건이 법정을 거치는 동안, OpenAI는 The Atlantic, Axel Springer, Vox Media, WIRED 모회사 Condé Nast 등 다른 출판사들과 콘텐츠 라이선스 거래를 추진하고 있습니다. 미디어와 법조계 내에서 이 사건들의 결과에 대한 합의는 없지만, 어쨌든 이는 미국에서 AI 산업이 어떻게 운영될 수 있는지에 대한 중요한 선례가 될 것입니다.