3월 16일, 브리태니커 백과사전은 메리엄-웹스터와 함께 오픈아이언(OpenAI)을 상대로 기소하다 챗GPT에 대해 네 가지 주요 혐의를 제기했습니다. 브리태니커가 냉혹하다고 생각하지 마세요. 챗GPT는 이전에도 허위 정보를 유포하고 출처를 브리태니커로 거짓 표기한 적이 있습니다. 오픈아이언은 아직 이에 대한 답변을 내놓지 않았습니다.
OpenAI가 또다시 기소하다 휘말렸습니다.
3월 16일, 브리태니커 백과사전은 자회사인 메리엄-웹스터와 함께 오픈AI를 상대로 소송을 제기했다.
그 이유는 ChatGPT가 대규모 저작권 침해를 저질렀다고 믿기 때문입니다.
브리태니커는 모든 원고들보다 더 철저하게 준비했습니다. 훈련 데이터 수집, 모델 메모리 출력, 실시간 RAG 검색에 초점을 맞추는 동시에 란햄법에 따른 상표권 침해도 추가했습니다.
인공지능 저작권 소송 역사상 누군가가 전체 생성 과정을 해체하려 시도한 것은 이번이 처음입니다.
GPT-4는 브리태니커 백과사전 전체를 단어 하나하나까지 암송할 수 있습니다.
테크크런치에 따르면 브리태니커는 GPT-4를 직접적으로 언급하며, GPT-4가 자사의 저작권이 있는 콘텐츠를 대량 암기하고 있으며 요청에 따라 거의 음성에 가까운 내용을 출력할 수 있다고 주장했습니다.
비슷한 것도 아니고, 전혀 비슷하지도 않아요. 각 캐릭터를 완전히 복제한 거예요.
여기에는 나름의 기술적 근거가 있습니다. 스탠포드와 예일 대학의 연구팀은 주류 대형 모델에서 "해리 포터" 원문을 클레임 실험을 진행했으며, 최고 클레임 은 96%에 달했습니다.
즉, 훈련 데이터의 상당 부분 내용이 모델 가중치에 저장되어 있으며, 특정 조건이 충족될 경우 거의 완벽하게 재현될 수 있습니다.
브리태니커 백과사전은 상당한 양의 저작권 보호 콘텐츠를 보유하고 있습니다. 약 10만 건 에 달하는 온라인 기사, 백과사전 항목, 사전 정의는 과학, 역사, 문학 등 거의 모든 주요 지식 분야를 망라합니다.
이 콘텐츠는 수십 년에 걸쳐 전문 편집자와 해당 분야 전문가들이 수집한 것입니다. 위키피디아가 등장하기 전에는 이 시스템이 인류 지식의 표준 색인 역할을 했습니다.
OpenAI는 회색 지대에서 활동해 왔습니다.
정보를 검색하는 것이 저작권 침해로 간주되는 건가요?
이전에 제 콘텐츠를 모델 학습에 사용하는 것이 저작권 침해에 해당하는지에 대한 논쟁이 있었습니다.
이번에 브리태니커의 비난은 한 단계 더 나아갔습니다. 그의 비난은 세 가지입니다.
첫 번째 단계는 대규모 모델 학습에 사용하기 위해 약 10만 개의 기사를 허가 없이 수집하는 것이었습니다.
둘째로 , ChatGPT는 답변을 생성할 때 브리태니커 백과사전의 콘텐츠를 전부 또는 일부 그대로 복사하여 출력하는데, 이는 직접적인 저작권 침해에 해당합니다.
세 번째이자 가장 논란이 되는 부분은 OpenAI가 ChatGPT RAG 워크플로우에서 브리태니커 백과사전의 논문을 사용한 점입니다.
RAG는 ChatGPT가 외부 데이터베이스를 스캔하여 최신 정보를 얻는 메커니즘입니다.
브리태니커는 자사의 콘텐츠가 학습 데이터 세트에 포함되지 않더라도 실시간 검색 결과에 나타나는 한 저작권 침해로 간주된다고 주장합니다.
이 아이디어는 전례가 없는 것입니다. 즉, 정적 학습이든 동적 검색이든 관계없이 저작권이 있는 콘텐츠를 허가 없이 사용하는 사람은 누구든지 책임을 져야 한다는 것을 의미합니다.
더욱 흥미로운 것은 네 번째 혐의, 즉 란햄법과 관련된 상표권 침해입니다.
브리태니커는 ChatGPT가 때때로 환각을 만들어낸 다음, 이러한 잘못된 내용을 브리태니커에 귀속시켜 브리태니커가 허위 정보를 유포하는 것처럼 보이게 한다고 믿습니다.
이는 단순한 저작권 침해가 아닙니다. 브리태니커의 브랜드 평판은 오픈AI의 실수로 인해 큰 타격을 입어야 합니다.
이는 대중이 양질의 신뢰할 수 있는 온라인 정보에 지속적으로 접근할 수 있는 능력을 위협합니다.
같은 사안입니다. 독일은 저작권 침해를 주장하고, 영국은 이를 부인합니다.
이는 소송 전체의 핵심 쟁점이며, 전 세계 법조계에서 가장 뜨거운 논쟁거리 중 하나입니다.
GEMA 대 OpenAI 소송에서 독일 뮌헨 법원은 가사가 GPT-4 및 GPT-4o 모델 가중치에 포함되어 있는 것이 저작권 침해에 해당하므로 금지 명령 및 손해 배상을 지급해야 한다고 판결했습니다.
모델 가중치는 인공지능이 훈련 과정에서 학습하는 수치적 매개변수로, 모델의 출력값을 결정합니다. 뮌헨 법원은 이러한 매개변수로부터 해당 저작물을 재구성할 수 있다는 것만으로도 저작권 침해가 성립한다고 보았습니다.
영국 고등법원은 게티 이미지 대 스테빌리티 AI 사건에서 완전히 정반대의 결론을 내렸습니다.
AI 모델은 저작물의 가중치가 저작물 자체를 포함하거나 복제하는 것이 아니라 학습된 패턴만 저장하기 때문에 저작권 침해 복제물이 아닙니다.
미국에서 앤트로픽은 저작권 소송에서 연방 판사 윌리엄 알섭을 설득하여 해당 콘텐츠를 훈련 데이터로 사용하는 것이 공정 사용에 해당할 만큼 충분히 변형적인 행위라는 판결을 받아냈습니다.
하지만 알섭 판사는 앤트로픽이 수백만 권의 책을 불법적으로 다운로드하고 대금을 지불하지 않은 사실이 드러났으며, 이는 법률 위반에 해당한다고 판단하여 결국 1억 5천만 달러 규모 의 집단 소송 합의로 이어졌습니다.
브리태니커의 소송은 뉴욕에서 제기되었으며 미국 연방법의 적용을 받습니다.
하지만 현재 저작권이 있는 콘텐츠를 사용하여 LLM 과정을 운영하는 것이 저작권 침해에 해당하는지 여부를 명확히 규정한 판례는 없습니다. 각 사례의 결과는 여전히 담당 판사의 판단에 크게 좌우됩니다.
만약 법원이 실시간 검색 또한 저작권 침해에 해당한다고 인정한다면, 그 영향은 인공지능 산업 전체에 미치는 파급 효과를 훈련 데이터 분쟁보다 훨씬 더 클 것입니다.
퍼플렉시티를 상대로 한 소송은 오픈AI를 위한 예행연습에 불과하다.
브리태니커가 이러한 움직임을 보인 것은 이번이 처음이 아닙니다.
2025년 9월, 브리태니커는 퍼플렉시티를 상대로 유사한 저작권 및 상표권 침해 소송을 제기했으며, 이 소송은 현재까지 진행 중입니다.
Perplexity는 RAG를 핵심 제품 논리로 삼는 AI 검색 회사입니다.
브리태니커가 퍼플렉시티를 먼저 표적으로 삼은 것은 일종의 법적 예행연습으로, 동일한 논리를 오픈AI에 적용하기 전에 RAG의 저작권 침해 가능성을 가늠해보려는 시도라고 볼 수 있습니다.
동시에 업계 전반에서 저작권 분쟁이 심화되고 있습니다.
뉴욕 타임스, 지프 데이비스, 그리고 미국과 캐나다의 10여 개 신문사가 오픈AI를 상대로 기소하다.
더 인터셉트와 US 뉴스 앤 월드 리포트도 원고 대열에 합류했습니다.
AI 저작권 소송 추적 전문 웹사이트인 ChatGPT Is Eating The World에 따르면, 이번 소송은 OpenAI를 상대로 제기된 63번째 저작권 소송입니다.
OpenAI는 TechCrunch의 논평 요청에 응답하지 않았습니다.
위키피디아에 의해 무력화되었고, 그 후 ChatGPT에 의해 차단되었습니다.
다른 관점에서 보면, 보상액보다 더 주목해야 할 몇 가지 요소가 있습니다.
1768년에 설립된 브리태니커는 영어권에서 가장 오랜 역사를 자랑하는 백과사전 브랜드로, 수 세기 동안 이어져 온 인류 지식 체계화 전통의 상징입니다.
그러한 조직이 AI 저작권 소송의 원고로 등장한다는 것은 분명한 신호입니다. 즉, 지식 권위라는 개념이 법적 수단을 통해 AI 생태계 내에서 그 경계를 재정의하려 한다는 것입니다.
브리태니커는 한때 인쇄 백과사전 시대에 절대적인 권위를 누렸지만, 위키피디아의 등장으로 대중의 관심에서 거의 사라질 지경에 이르렀습니다.
이후 디지털 구독 플랫폼으로 전환하여 콘텐츠의 신뢰성과 전문성을 바탕으로 다시금 입지를 다졌습니다.
이제 ChatGPT의 등장으로 기존 백과사전은 다시 한번 대체될 위기에 처했지만, 더 나은 백과사전이 아니라 기존 백과사전의 콘텐츠로 학습되었지만 단 한 푼의 대가도 받지 않은 모델에 의해 대체될 위기에 놓였습니다.
고소장에는 다음과 같은 문장이 포함되어 있습니다.
ChatGPT는 게시자의 콘텐츠를 대체하는 답변을 생성하여 게시자의 트래픽을 가로챕니다.
이는 비즈니스 모델의 직접적인 충돌입니다. RAG의 주장이 타당한지는 두고 봐야 할 것입니다.
하지만 법원이 이러한 논리를 받아들인다면, 업계 전체의 실시간 검색 파이프라인은 권한 부여 방식을 재협상해야 할 것입니다.
온라인 검색과 AI 생성 콘텐츠를 핵심 제품으로 하는 모든 기업은 이러한 문제에 직면합니다.
250년 역사를 자랑하는 한 백과사전 출판사가 소송을 통해 인공지능의 경계를 명확히 하려 하고 있다.
이 경계선은 궁극적으로 어디에 그어질까요? 아마 2026년쯤이면 답을 알 수 있을 겁니다.
참고 자료
https://www.reuters.com/legal/litigation/encyclopedia-britannica-sues-openai-over-ai-training-2026-03-16/
https://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit/
https://the-decoder.com/encyclopedia-britannica-sues-openai-for-training-on-nearly-100000-articles-without-permission/
https://gizmodo.com/encyclopedia-britannica-sues-openai-over-ai-training-data-2000607770
https://news.bloomberglaw.com/ip-law/britannica-merriam-webster-accuse-openai-of-copying-their-works
https://chatgptiseatingtheworld.com/wp-content/uploads/2026/03/Encyclopedia_Britannica_Inc-v-OpenAI-COMPLAINT-Mar-13-2026.pdf
https://www.aol.com/articles/encyclopedia-britannica-sues-openai-over-141324436.html
이 글은 위챗 공식 계정 "신지능" 의 Qingqing 작성 글이며, 36Kr의 허가를 받아 게재되었습니다.




