앤트로픽의 "양치기 소년" 이야기가 월스트리트에 공황을 불러일으켰습니다! 27년 묵은 취약점 때문에 미소스는 8개의 AI에 의해 순식간에 패배했습니다.

이 기사는 기계로 번역되었습니다
원문 표시
인공지능 세계의 "오펜하이머의 순간"은 연출된 것일까? 클로드 미토스의 제로데이 취약점 발견 능력은 지나치게 과장되었다. 인위적으로 조작된 것일 뿐만 아니라, 오픈소스 GPT에도 손쉽게 도전장을 내밀 수 있다. 한편, 오푸스 4.6은 최악의 "부분 절제술"을 겪고 있다.

기사 작성자 및 출처: Synced

클로드 미토스는 실제로 모습을 드러내기도 전에 이미 월가 전체에 공황 상태를 불러일으켰다.

미국 금융 규제 당국은 밤사이 주요 은행들과 긴급 회의를 소집했고, 분위기는 긴장되고 대립적이었다.

그들은 미토스가 전례 없는 인공지능 기반의 시스템적 사이버 공격을 촉발할 수 있다는 데 만장일치로 동의했다.

하지만 사실은 모두가 속았다는 거죠!

Mythos가 발견한 수만 건의 취약점 중 대다수는 근본적으로 악용이 불가능한 "오래된 소프트웨어"에 존재합니다.

더욱 심각한 것은 "심각"하다고 분류된 제로데이 취약점 보고서가 실제로는 단 198건의 사람 검토에만 의존했다는 점입니다.

AISLE 실험 연구진은 Mythos의 "결과"를 재검토한 결과 다음과 같은 사실을 발견했습니다.

인공지능의 보안 능력은 모델 크기에 비례하여 선형적으로 증가하는 것이 아니라, 진정한 의미의 "지그재그" 분포를 보입니다.

그들은 단 36억(GPT-OSS-20b)의 활성화 매개변수 하나만 사용하여 Mythos가 발견한 대표적인 FreeBSD 취약점을 정확하게 식별했습니다.

51억 개의 매개변수를 활성화한 이 모델은 27년 동안 잠들어 있던 OpenBSD 취약점 분석 로직을 성공적으로 재현했습니다.

미소스에서 취약점이 발견된 것이 과장되었을 뿐만 아니라, 클로드 오푸스 4.6의 심각한 "무능함"이 드러나면서 큰 파장을 일으켰습니다.

일부 사용자들은 Opus 4.6이 ChatGPT 및 Opus 4.5보다 성능이 떨어진다는 사실까지 발견했습니다.

미토스의 36B 모델은 27년 묵은 취약점을 드러내며 호평을 받았습니다.

며칠 전, Anthropic은 Claude Mythos(프리뷰 버전)와 "Project Glasswing"에 대한 대대적인 발표를 했습니다.

244페이지 분량의 시스템 카드 문서에서 그들은 다음과 같이 주장했습니다.

Mythos는 OpenBSD에 27년 동안 숨어 있던 오래된 버그와 FFmpeg에 16년 동안 숨겨져 있던 버그를 포함하여 수만 건의 제로데이 취약점을 독자적으로 발견했습니다.

CC의 제작자는 심지어 "미토스는 너무나 강력해서 공포심을 불러일으켜야 한다"고 단언했습니다.

하지만 AISLE 창립자 스타니슬라프 포트가 최근 발표한 혹독한 테스트 보고서는 이러한 화려한 겉모습을 완전히 뒤집어 놓았습니다.

시험 결과는 매우 놀랍습니다.

8개의 오픈 소스 모델 모두에서 FreeBSD의 주요 제로데이 취약점이 발견되었으며, 가장 작은 매개변수 값도 30억에 불과했습니다.

인공지능 사이버보안 역량의 장벽은 그 어떤 "최상위급 대형 모델" 하나로는 절대 무너뜨릴 수 없습니다.

미소스(Mythos)의 신화를 검증하기 위해, 팀은 앤스로픽(Anthropic)이 공개한 몇 가지 주요 취약점을 클레임.

그런 다음, 그들은 단순히 그것들을 작고 저렴하며 심지어 오픈 소스 모델들에 마구잡이로 적용합니다.

FreeBSD NFS 취약점이 무차별적으로 악용되었습니다.

GPT-OSS-20b(활성 매개변수 36억 개에 불과)와 DeepSeek R1을 포함한 8개의 모델이 모두 이 복잡한 스택 버퍼 오버플로 취약점을 성공적으로 탐지했습니다.

가장 인상적인 점은 이 작업을 성공적으로 완료한 오픈 소스 미니 모델의 호출 비용이 백만 토큰당 0.11달러에 불과했다는 것입니다.

OpenBSD SACK 취약점 "전체 체인" 재현

27년 된 취약점을 해결하기 위해 매우 뛰어난 수학적 추론 능력이 요구되는 이 문제에 대해, GPT-OSS-120b(활성화 매개변수 51억 개)는 단 한 번의 API 호출로 공개된 취약점의 전체 공격 과정을 성공적으로 재구성하고 만점(A+)의 공격 계획 개요를 제공했습니다.

게다가 OWASP 오탐지 취약점 식별 테스트 중에 훨씬 더 이상한 현상이 나타났습니다.

SQL 인젝션으로 위장한 자바 코드처럼 매우 교묘한 공격 대면 , DeepSeek R1과 같은 소형 모델들은 쉽게 위장을 간파하고 데이터 흐름을 정확하게 추적했습니다.

반대로 GPT-5.4 및 Claude Sonnet 4.5와 같은 최상위급 비공개 소스 모델은 모두 고위험 취약점으로 오판되어 처참하게 실패했습니다.

이는 사이버 보안 분야에서 "영구적으로 가장 강력한" 단일 조직 모델이란 존재하지 않는다는 것을 의미합니다.

198차례에 걸친 수동 물 주입 시도 중 대부분은 사용할 수 없었습니다.

톰스 하드웨어의 또 다른 보고서에서 데이터 이면에 숨겨진 진실이 밝혀졌습니다.

  • 표본 편향: 소위 "수천 개"의 취약점 중 상당수는 더 이상 유지 관리되지 않는 오래된 소프트웨어에 존재합니다.
  • 악용 불가능: 태그 "취약점" 대량 실제 환경에서 작동되거나 악용될 수 없습니다.
  • 인공 습기: 해당 모델이 주장하는 파괴력은 실제로 198건의 수동 검증에만 기반합니다.

따라서 극히 작은 표본을 바탕으로 "세계를 뒤바꿀 만한 위협"을 일반화하는 것은 학계와 안보 공동체 모두에서 명백히 용납될 수 없습니다.

보안 전문가가 격분하며 비판했다

게다가 최고의 사이버 보안 전문가이자 전설적인 해커인 조지 호츠 역시 이러한 리스크 심하게 과장되었다고 지적했습니다.

아이폰과 플레이스테이션 3 해킹으로 유명세를 얻은 이 IT 거물은 소셜 미디어에서 두 AI 거대 기업에 공개적으로 도전장을 내밀었다.

그의 말은 매우 날카로웠다.

새로운 모델이 출시될 때까지 매일 제로데이 취약점을 하나씩 공개하면 어떻게 될까요?

이로써 OpenAI와 Anthropic이 입을 다물고 소위 "사이버 보안 리스크"을 퍼뜨리는 것을 멈출 수 있을까요?

호츠의 핵심 관점 매우 간단합니다. 소프트웨어 취약점은 AI 연구소에서 묘사하는 것보다 실제로 훨씬 쉽게 찾을 수 있다는 것입니다.

제로데이 취약점은 기술적 난이도 때문이 아니라 법적인 문제 때문에 시장에 거의 없다. 그는 타인의 시스템을 해킹하는 것이 불법이기 때문에 아무도 진지하게 제로데이 취약점을 찾으려 하지 않는다고 생각한다.

GPT-5.4보다 아주 약간 나은 수준입니다.

시스템 카드에서 Anthropic은 Claude 모델 자체가 실제로 개선되었으며, Mythos 프리뷰에서 Opus 4.6에 비해 상당한 발전이 이루어졌다고 밝혔습니다.

에포크 역량 지수(ECI)는 여러 AI 벤치마크 테스트를 통합하는 단일 지표로, 장기간에 걸쳐 모델을 비교할 수 있도록 합니다.

여러 벤치마크 테스트에서 Claude Mythos는 Opus 4.6보다 전반적으로 우수한 성능을 보였습니다.

그렇지 않다면, 성능은 떨어지고 가격은 더 비싼 새로운 AI 모델을 출시할 이유가 있겠습니까?

하지만 GPT나 제미니와 비교하면 클로드 미토스의 발전은 획기적인 것이라기보다는 이전 모델들에 비해 상대적으로 선형적인 개선에 그치고 있습니다!

기후 및 청정에너지 투자자이자 작가인 라메즈 남은 다음과 같이 단도직입적으로 말했다.

Epoch Capabilities Index(ECI)에서 Mythos는 가속화 추세를 보이지 않았으며 GPT 5.4보다 약간 더 나은 수준에 그쳤습니다.

https://epoch.ai/eci/

하지만 앤트로픽의 내부 ECI 보고서와 에포크 AI가 공개적으로 발표한 공식 ECI 보고서를 비교해 보면, 미토스가 ECI를 가속화하고 있는 것으로 보이지는 않는다는 점이 분명해집니다.

이 모든 건 앤트로픽의 계획의 일부야!

시스템 카드에서 앤트로픽은 미토스와 같은 모델의 ECI 점수에 더 큰 불확실성이 있음을 인정했습니다.

더욱이, Anthropic의 Mythos 개발 진전은 인간의 연구에 기반한 것이며 AI 모델의 상당한 도움을 받지 않았습니다. 따라서 의미 있는 재귀적 자기 개선은 아직 관찰되지 않았습니다.

인공지능 종말은 자기주도적이고 자기연기적인 드라마인가?

이전에도 앤트로픽은 60 Minutes와 같은 언론 매체에 "랜섬웨어 연구"에 대한 보도를 부추겨 주장을 과장하고 여론을 조작했는데, 투자 전문가 데이비드 삭스는 이를 "사기"라고 비난했습니다.

삭스는 명확한 패턴을 발견했습니다. 앤트로픽이 새로운 모델을 발표할 때마다 항상 언론의 주목을 받고 여론에 영향을 미치기 위해 섬뜩한 내용의 보안 연구 결과를 동시에 발표한다는 것입니다.

이에 대해 그는 비꼬는 투로 "앤트로픽은 두 가지를 잘한다는 것을 증명해 보였습니다. 바로 제품을 출시하는 것과 사람들을 겁주는 것이죠."라고 말했다.

그는 앤트로픽이 훌륭한 제품을 만들 수 있다는 점에는 의심의 여지가 없지만, 대중을 위협하는 그의 접근 방식은 문제가 있다고 생각한다.

이번에 앤트로픽이 실제로 "기아 마케팅"에 관여하고 있는지는 알 수 없지만, 자사의 이윤을 보호하려는 의도는 분명해 보인다.

미소스는 진전을 이루었지만, 앤트로픽은 이러한 "제한적인 진전"을 "세계적 수준의 위협"으로 포장했습니다. 아이러니하게도, 초인공지능 리스크 요란하게 경고하는 와중에도, 사용자들은 오푸스 4.6이 눈에 띄게 멍청해졌다고 불평하고 있습니다.

클로드는 심각한 지적 장애를 앓고 있으며, 뇌의 일부를 제거해야 할 수도 있습니다.

클로드 미토스는 분명 적절한 분위기를 조성했지만, 작품 등급이 4.6으로 하향 조정되면서 많은 사람들의 불만을 불러일으켰습니다.

지난 며칠 동안 온갖 불만들이 쏟아져 나왔습니다.

네티즌들은 앤트로픽이 오푸스 4.6을 완전히 채소처럼 만들어버렸다고 직설적으로 비판했다.

동일한 세차 환경에서 Opus 4.5가 Opus 4.6보다 실제로 더 나은 성능을 보였습니다.

실제로 AMD 임원의 블로그 게시글은 클로드가 폐엽절제술을 받았다는 널리 퍼진 의혹을 확인시켜 주었습니다.

1월부터 3월까지 클로드의 세션 로그를 심층 분석한 결과는 다음과 같습니다.

클로드의 "평균 사고 길이"가 약 2200자에서 600자로 급격히 감소했는데, 이는 심층적인 추론 능력이 크게 저하되었음을 나타냅니다.

2월과 3월 사이에 API 요청이 80배 급증했습니다. 클로드의 사고 과정이 단축되고 단일 시도 성공률이 감소함에 따라 사용자는 자주 재시도해야 했고, 그 결과 토큰 소모량이 증가하고 비용이 급격히 상승했습니다.

클로드 맥스의 또 다른 고액 구독자는 앤트로픽에 대한 심층적인 비판을 담은 장문의 글을 발표했습니다.

그의 견해로는, 앤트로픽은 해시레이트 부족이라는 딜레마에 빠져 있으며, 이는 사용량 제한을 강화하고 사용자들이 토큰 소비를 줄이도록 강요하는 노력에서 드러난다.

하지만 그를 기술적 병목 현상보다 더 화나게 한 것은 그들의 "비정통적인" 제품 전략이었다.

불안정한 핵심 모델과 잦은 버그로 인해, 그들은 "/buddy" 터미널 펫과 같은 화려한 기능을 개발하는 데 귀중한 해시레이트 낭비했습니다.

이것은 아마도 인공지능 역사상 가장 어처구니없는 "시간 순서가 뒤죽박죽인" 사례일 것입니다. 연구실의 클로드 미토스는 세상을 파괴하고 있는 반면, 웹상의 오푸스 4.6은 지능이 급격히 저하되고 있습니다.

앤스로픽은 "슈뢰딩거의 초인공지능"을 성공적으로 구현했습니다.

참고 자료:

https://officechai.com/ai/anthropic-and-openai-are-exaggerating-cybersecurity-risk-says-hacker-george-hotz/

https://x.com/stanislavfort/status/2041922370206654879?s=20

https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier

https://x.com/cgtwts/status/2043095382121681272?s=20

https://www.reddit.com/r/ClaudeAI/comments/1siqwmp/anthropic_stop_shipping_seriously/

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
64
즐겨찾기에 추가
15
코멘트