인류 중심적 클로드 신화: 심각한 위협인가, 아니면 과대광고인가? AI 보안 연구소의 의견

avatar
Decrypt
04-14
이 기사는 기계로 번역되었습니다
원문 표시

영국의 AI 보안 연구소는 앤트로픽의 클로드 미토스 프리뷰(Claude Mythos Preview)를 평가하여 이 AI 모델이 주장하는 강력한 사이버 보안 기능을 검증한 결과, 전례 없는 성공률로 정교한 사이버 공격을 자율적으로 실행할 수 있음을 발견했습니다.

클로드 미토스의 존재는 3월 말 웹사이트 유출을 통해 처음 알려졌으며, 앤트로픽은 이 강력한 차세대 모델이 기존 AI 모델로는 전례 없는 수준으로 사이버 보안 취약점을 찾아내고 악용할 수 있다고 확인했습니다. 이 모델은 현재 웹 브라우저와 운영 체제에서 심각한 취약점을 발견했다고 합니다.

앤트로픽은 해당 모델을 공개하는 대신, 수십 개의 보안 연구 회사에 제한적인 접근 권한을 제공하여 모델을 테스트하고 고급 기능을 활용할 준비를 하도록 했습니다. 지난주, 스콧 베센트 미국 트레져리 장관과 제롬 파월 연준 의장은 은행 경영진들에게 클로드 미토스가 제기하는 심각한 보안 위협에 대해 경고한 것으로 알려졌습니다.

월요일에 발표된 AI 보안 연구소의 테스트 결과는 과장된 홍보 뒤에 숨겨진 실질적인 근거를 보여줍니다. 평가에 따르면 Mythos Preview는 전문가 수준의 깃발 뺏기(capture-the-flag) 작업에서 73%의 성공률을 보였는데, 연구소는 이러한 과제를 2025년 4월 이전에는 어떤 AI 모델도 완료할 수 없었다고 밝혔습니다.

이러한 위협은 상당하고 광범위할 수 있지만, 해당 기술은 취약점을 악용하는 데 그치지 않고 찾아내고 수정하는 데 사용될 수도 있습니다. 암호화 인프라 운영자에게 있어, 이러한 발전된 AI 기능은 AI 시스템이 네트워크 취약점을 독립적으로 탐색하고 악용할 수 있게 됨에 따라 새로운 유형의 잠재적 보안 위협을 의미합니다.

인공지능 보안 연구소(AI Security Institute)에 따르면, 미소스 프리뷰(Mythos Preview)는 기업 네트워크 공격 시뮬레이션인 "더 라스트 원스(The Last Ones, TLO)"를 완료한 최초의 AI 모델이 되었습니다. TLO는 일반적으로 사람이 완료하는 데 20시간이 걸리는 32단계 시뮬레이션입니다. 미소스 프리뷰 모델은 10번의 시도 중 3번 성공했으며, 모든 실행에서 평균 22단계를 완료했습니다.

이 시뮬레이션은 초기 정찰부터 네트워크 전체 장악에 이르기까지 실제 기업 침입 상황을 모방합니다. 두 번째로 성능이 뛰어난 모델인 Claude Opus 4.6은 평균 16단계만 거쳤습니다. 영국 연구소는 Mythos Preview의 성능이 컴퓨팅 리소스 증가에 따라 지속적으로 향상되며, 평가 실행당 최대 1억 개의 토큰을 사용한다고 밝혔습니다.

통제된 평가 환경에서 명시적으로 지시받고 네트워크 접근 권한이 부여되었을 때, 해당 모델은 사람의 지시 없이도 다단계 공격을 실행하고 취약점을 발견하는 능력을 보여주었습니다.

이러한 발전은 불과 2년 전만 해도 AI 모델이 기본적인 사이버 보안 훈련조차 제대로 수행하지 못했던 것과 비교하면 괄목할 만한 진전입니다. 2023년부터 이러한 AI 역량을 추적해 온 영국 AI 안전 연구소는 초급 수준의 작업에서 전문가 수준의 자율 공격으로의 급속한 발전을 기록했습니다.

스마트 계약 취약점과 거래소 해킹으로 이미 매년 수십억 달러의 손실이 발생하는 암호화폐 생태계에서, AI 기반 공격은 기존 위험을 더욱 증폭시킬 수 있습니다. 특히 복잡하게 상호 연결된 시스템에 의존하는 탈중앙화 금융 (DeFi ) 프로토콜은 여러 공격 경로를 동시에 분석하고 공격할 수 있는 자동화된 악용 시도에 취약할 수 있습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
68
즐겨찾기에 추가
18
코멘트