영국 AI 보안 연구소는 클로드 미토스를 평가한 결과, 32단계에 걸친 기업 사이버 공격을 자율적으로 시뮬레이션할 수 있음을 확인했습니다.

이 기사는 기계로 번역되었습니다

원문 표시

영국 AI 보안 연구소(AISI)는 13일 Anthropic Claude Mythos Preview의 사이버 보안 기능을 평가한 보고서를 발표했습니다 . 평가 결과에 따르면, Mythos Preview는 최첨단 모델의 사이버 공격 능력이 지속적이고 빠르게 향상되는 상황 속에서 또 한 번 중요한 도약을 이룬 것으로 나타났습니다.

AISI는 2023년부터 AI 사이버 공격 역량을 추적해 왔으며, 기본적인 대화형 탐색부터 Capture the Flag(CTF) 챌린지, 그리고 이제는 다단계 사이버 공격 시뮬레이션에 이르기까지 매년 더욱 까다로운 평가 시스템을 구축해 왔습니다. 이번 평가에서는 최대 1억 토큰의 추론 예산을 가진 사이버 레인지를 사용했으며, Mythos Preview는 이 한도 내에서 지속적으로 성능이 향상되었습니다.

CTF 평가: 전문가 수준 준수율 73%

Capture the Flag(CTF)는 사이버 보안을 평가하는 표준적인 방법입니다. AI 모델은 대상 시스템의 취약점을 식별하고 악용하여 숨겨진 "플래그" 문자열을 획득해야 합니다. 이러한 과제는 실제 공격 시나리오의 단일 기술적 측면을 시뮬레이션하며, 모델의 침투 테스트 능력을 측정하는 벤치마크 역할을 합니다.

평가 결과에 따르면 Claude Mythos Preview는 전문가 수준의 CTF 과제에서 73%의 성공률을 달성했는데, 이는 "2025년 4월 이전에는 어떤 모델도 완료할 수 없는" 수준입니다. AISI는 이 수치가 최첨단 모델들이 고립된 단일 지점 공격 기법에서 매우 성숙한 수준에 도달했음을 의미한다고 지적합니다.

32단계 기업 공격 시뮬레이션

하지만 전문가 수준의 CTF(Capture the Flag) 대회는 단 하나의 기술적 능력만을 테스트합니다. 실제 사이버 공격은 여러 호스트와 네트워크 세그먼트에 걸쳐 연결된 수십 단계의 과정을 필요로 하며, 이러한 지속적인 작전을 완료하는 데에는 전문가가 몇 시간, 며칠, 심지어 몇 주가 걸릴 수도 있습니다.

AISI는 실제 공격 시나리오와 더욱 유사하게 만들기 위해 "더 라스트 원스(The Last Ones, TLO)"라는 기업 사이버 공격 시뮬레이션 환경을 개발했습니다. TLO는 초기 정찰부터 기업 네트워크의 완전한 장악에 이르기까지 전체 과정을 포괄하는 32단계로 구성되어 있습니다. AISI는 전문가가 이 과정을 완료하는 데 약 20시간이 소요될 것으로 추산합니다.

클로드 미토스 프리뷰는 10번의 시도 중 3번 만에 32단계 모두를 완료하며 TLO를 처음부터 끝까지 완벽하게 통과한 최초의 모델이 되었습니다. 실패한 시도를 포함하더라도 미토스 프리뷰는 평균 22/32단계를 완료했습니다. 이에 비해 두 번째로 좋은 성적을 거둔 클로드 오푸스 4.6은 평균 16단계만 완료했습니다.

평가 결과, 명확한 지침과 네트워크 접근 권한이 부여된 통제된 환경에서 Mythos Preview는 다단계 공격을 수행하고 취약점을 자율적으로 발견 및 악용할 수 있는 것으로 나타났습니다. 이는 이전에는 전문가가 며칠씩 소요해야 했던 작업입니다.

역량 한계

AISI는 또한 기존 평가 프레임 와 현실 세계 간의 격차를 지적했습니다. 현재 테스트 범위에는 실제 환경에서 흔히 볼 수 있는 많은 방어 요소가 부족합니다. 능동적인 방어자 개입이나 방어 도구 배포가 없으며, 보안 경고를 유발할 수 있는 모델의 행동에 대한 제재도 없습니다.

AISI는 "이는 Mythos Preview가 방어가 잘 된 시스템을 공격할 수 있는지 확신할 수 없다는 것을 의미합니다."라고 솔직하게 밝혔습니다. Mythos Preview의 현재 능력에 대한 가장 정확한 설명은 네트워크 진입점만 있다면 알려진 취약점이 있는 소규모의 방어가 취약한 기업 시스템을 자율적으로 공격할 수 있다는 것입니다.

양날의 검과 조직적 대응

AISI의 조사 결과는 AI 네트워크 기능의 양면성을 명확히 보여줍니다. 한편으로는 유사한 기능을 가진 모델들이 앞으로 계속해서 등장하여 방어 체계가 취약한 조직에 점점 더 큰 리스크 될 것이지만, 다른 한편으로는 AI 네트워크 기능이 방어 측면에서도 획기적인 발전을 가져올 수 있다는 것입니다.

AISI는 조직적 과제에 대응하여 기본적인 사이버 보안 역량 구축의 시급성을 강조합니다. 여기에는 정기적인 보안 업데이트 적용, 강력한 접근 제어, 안전한 구성 관리, 그리고 포괄적인 로깅이 포함됩니다. AISI는 미래의 최첨단 모델들이 더욱 강력해질 것이므로 지금 사이버 방어에 투자하는 것이 매우 중요하다고 지적합니다.

AISI는 향후 평가 방향과 관련하여, 실제 공격 시나리오와 더욱 유사한 방식으로 AI 네트워크 공격 능력의 실제 상한선을 측정하기 위해 사전 모니터링, 엔드포인트 탐지, 실시간 이벤트 대응 등의 요소를 통합한 강화된 방어 환경을 시뮬레이션하는 테스트 범위를 구축할 것이라고 밝혔습니다.

자세한 내용은 원본 보고서를 참조하십시오.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트