Anthropic이 실수로 클로드 코드의 출처를 유출했습니다. 인터넷은 이 정보를 영원히 보관할 것입니다.

이 기사는 기계로 번역되었습니다
원문 표시

앤트로픽은 클로드 코드(Claude Code)를 오픈소스로 공개할 의도는 없었습니다. 하지만 화요일에 회사는 사실상 그렇게 해버렸고, 아무리 많은 변호사가 동원된다 해도 이미 벌어진 일을 되돌릴 수는 없습니다.

모든 것은 단 하나의 파일에서 시작되었습니다. 화요일 새벽에 npm 레지스트리에 푸시된 Claude Code 버전 2.1.88에는 59.8MB 크기의 JavaScript 소스 맵 파일이 포함되어 있었습니다. 이 디버그 파일은 압축된 코드에서 원래 코드를 복원할 수 있도록 설계되었습니다. 이러한 파일은 자동으로 생성되며 비공개로 유지되어야 합니다. 하지만 무시 설정의 한 줄 때문에 릴리스와 함께 배포된 것입니다.

해당 파일을 처음 발견한 사람 중 한 명으로 보이는 인턴 겸 연구원 차오판 쇼우는 미국 동부시간으로 오전 4시 23분경 X의 다운로드 링크(Chainlink) 게시했고 , 1,600만 명이 넘는 사람들이 해당 게시글에 몰려들었습니다. 앤스로픽은 npm 패키지를 삭제했지만, 인터넷에는 이미 프로젝트의 주요 부분을 구성하는 1,900개의 파일에 걸쳐 512,000줄의 코드가 저장되어 있었습니다.

앤트로픽 대변인은 디크립트(Decrypt) 인터뷰에서 "오늘 클로드 코드(Claude Code) 릴리스에 내부 소스 코드가 포함되었습니다. 하지만 고객의 민감한 데이터나 자격 증명이 유출되거나 노출된 것은 아닙니다."라고 밝혔습니다. "이는 보안 침해가 아닌 인적 오류로 인한 릴리스 패키징 문제였습니다. 이러한 일이 다시 발생하지 않도록 조치를 취하고 있습니다."

이번 유출로 시중에서 가장 정교한 AI 코딩 에이전트 중 하나로 꼽히는 LLM의 내부 아키텍처 전체가 드러났습니다. 여기에는 LLM API 오케스트레이션, 다중 에이전트 조정, 권한 로직, OAuth 흐름, 그리고 출시되지 않은 기능을 포함하는 44개의 숨겨진 기능 플래그가 포함됩니다.

이번에 발견된 것들 중에는 메모리 로그를 저장하고 매일 밤 "꿈"을 꾸어 지식을 통합하는 상시 실행 백그라운드 데몬인 카이로스(Kairos)와, 18종의 다양한 종과 희귀도, 디버깅, 인내심, 혼돈, 지혜 등의 능력치를 가진 타마고치 스타일의 AI 펫 버디(Buddy)가 있습니다. 이 "버디"의 티저 공개는 4월 1일부터 7일까지 진행될 예정입니다.

그리고 해커 뉴스 에서 모두를 폭소하게 만든 디테일이 있습니다. 유출자 Kuberwastaken 에 따르면, 코드 내부에 "언더커버 모드" 라는 기능이 숨겨져 있었는데, 이는 AI가 오픈 소스 저장소에 기여할 때 앤트로픽의 내부 코드명이나 프로젝트 이름을 실수로 유출하는 것을 방지하기 위해 설계된 전체 하위 시스템이었습니다. 클로드의 컨텍스트에 삽입된 시스템 메시지는 말 그대로 "정체를 드러내지 마십시오"라고 적혀 있었습니다.

알고 보니, 앤트로픽이 깃허브 미러 서버에 대해 DMCA 삭제 요청을 하기 시작했습니다. 그때부터 상황이 흥미로워졌죠.

월스트리트 저널 에 250억 개의 클로드 코드 토큰을 소비한 것으로 이달 초 보도된 한국 개발자 시그리드 진은 새벽 4시에 잠에서 깨어나 이 소식을 접했습니다. 그는 자리에 앉아 oh-my-codex 라는 AI 오케스트레이션 도구를 사용하여 핵심 아키텍처를 처음부터 파이썬으로 포팅하고 해가 뜨기 전에 claw-code를 배포했습니다. 이 저장소는 역사상 어떤 저장소보다도 빠르게 깃허브 스타 3만 개를 달성했습니다.

기본적으로 원래 언어의 모든 코드를 파이썬으로 번역한 것이기 때문에 엄밀히 말하면 같은 것은 아니죠? 그건 변호사나 기술 철학자들에게 맡기도록 하죠.

여기서 법적 논리는 날카롭습니다. 프래그매틱 엔지니어 뉴스레터의 창립자인 게르겔리 오로즈는 X에 올린 글 에서 다음과 같이 주장했습니다. "이건 정말 대단한 건지 아니면 무서운 건지 모르겠습니다. 앤트로픽이 실수로 클로드 코드의 TS 소스 코드를 유출했습니다. 소스 코드를 공유하는 저장소는 DMCA 때문에 삭제됩니다. 하지만 이 저장소는 파이썬으로 코드를 다시 작성했기 때문에 저작권을 침해하지 않으므로 삭제될 수 없습니다!"

완전히 새롭게 재구성한 클린룸 작업입니다. 완전히 새로운 창작물이며, 저작권 침해 방지(DMCA) 문제를 일으키지 않도록 설계되었습니다.

인공지능이 생성한 저작물의 법적 지위를 고려할 때 저작권 문제는 더욱 복잡해지며, 변호사들이 해당 저작물에 자동적으로 저작권이 발생하는지 여부를 판단해야 할 때 기준이 얼마나 모호해 지는지 생각해 보면 더욱 그렇습니다. 워싱턴 D.C. 항소법원은 2025년 3월에 이러한 입장을 지지했고 , 대법원은 이의 제기를 심리하지 않기로 결정했습니다.

앤트로픽의 CEO가 암시했듯이, 클로드 코드의 상당 부분이 클로드 본인에 의해 작성되었다면, 저작권 주장의 법적 효력은 날이 갈수록 더욱 불분명해질 것입니다.

탈중앙화는 영속성을 한층 더 강화합니다. @gitlawb 계정은 원본 코드를 탈중앙화된 Git 플랫폼인 Gitlawb에 "절대 삭제되지 않습니다"라는 간단한 메시지와 함께 미러링했습니다. 원본 코드는 여전히 그곳에서 접근 가능합니다 . 별도의 저장소에는 Claude의 내부 시스템 프롬프트가 모두 컴파일되어 있는데, 이는 프롬프트 엔지니어와 탈옥 전문가들에게 Anthropic이 모델을 구성하는 방식에 대한 더 많은 통찰력을 제공하기 때문에 유용할 것입니다.

이 문제는 단순한 논란을 넘어 더 중요한 의미를 지닙니다. DMCA 삭제 요청은 중앙 집중식 플랫폼에 효과적입니다. GitHub는 법적 의무 때문에 이를 준수합니다. Gitlawb, 토렌트, 그리고 암호화폐 자체를 구동하는 분산형 인프라는 중앙 집중식 플랫폼처럼 단일 실패 지점을 갖고 있지 않습니다. 기업이 인터넷에서 콘텐츠를 삭제하려고 할 때, 문제는 미러 서버가 몇 개 존재하고 어떤 종류의 인프라에 있는지뿐입니다. 그리고 이 경우, 몇 시간 만에 "충분하다"는 답이 나왔습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
69
즐겨찾기에 추가
19
코멘트