OpenAI의 GPT-5.5, 사이버 공격 능력에서 Claude Mythos와 동등: AI 보안 연구소

이 기사는 기계로 번역되었습니다
원문 표시

영국 정부 기관이 오픈AI의 최신 인공지능 모델이 복잡한 사이버 공격을 자율적으로 수행할 수 있으며, 인간 보안 전문가가 약 12시간이 걸린 역공학 과제를 10분 남짓 만에 해결했다는 사실을 발견했습니다.

영국 과학혁신기술부 산하 연구기관인 AI 보안 연구소(AISI)는 목요일 발표한 연구 결과 에서 GPT-5.5가 사이버 공격 능력 측면에서 연구소가 평가한 모델 중 가장 강력한 모델 중 하나이며, 앤트로픽의 유명한 클로드 미토스와 거의 동등한 수준이라고 밝혔습니다.

보고서에 따르면 GPT-5.5는 AISI의 가장 까다로운 테스트인 "The Last Ones"라고 불리는 32단계 모의 기업 네트워크 공격 테스트를 10번의 시도 중 2번 자율적으로 완료한 두 번째 모델입니다. 이 기록을 달성한 첫 번째 모델은 Anthropic의 Claude Mythos Preview로, 10번의 시도 중 3번 만에 시뮬레이션을 완료했습니다.

사이버 보안 회사인 SpecterOps와 협력하여 구축된 기업 네트워크 시뮬레이션에서는 에이전트가 정찰, 자격 증명 탈취, 여러 Active Directory 포리스트를 넘나드는 측면 이동, CI/CD 파이프라인을 통한 공급망 전환, 그리고 궁극적으로 보호된 내부 데이터베이스 유출을 순차적으로 수행해야 합니다. AISI는 이러한 단계를 인간 전문가가 수행하는 데 약 20시간이 소요될 것으로 추산합니다.

아마도 가장 놀라운 결과는 매우 어려운 역공학 퍼즐과 관련된 것이었을 겁니다. GPT-5.5는 맞춤형 가상 머신의 명령어 세트를 재구성하고, 역어셈블러를 처음부터 작성하고, 제약 조건 해결을 통해 암호화 암호를 복구해야 하는 이 과제를 10분 22초 만에 해결했으며, API 사용 비용은 1.73달러였습니다. 전문 도구를 사용하는 인간 전문가가 이 과제를 해결하는 데는 약 12시간이 걸렸습니다.

AISI의 고급 사이버 보안 과제 모음에서 GPT-5.5는 가장 어려운 "전문가" 등급에서 평균 71.4%의 합격률을 달성하여 Mythos Preview의 68.6%를 근소하게 앞섰고 GPT-5.4의 52.4%를 크게 앞섰습니다.

이번 연구 결과는 인공지능 개발의 전반적인 방향에 중요한 시사점을 제공합니다. AISI는 GPT-5.5의 성능이 사이버 능력의 급속한 향상이 단지 일회성 돌파구가 아니라 일반적인 추세의 일부일 수 있음을 시사한다고 결론지었으며, 공격적인 사이버 능력이 추론, 코딩 및 자율 작업 완료의 광범위한 개선의 부산물로 나타나고 있다면 향후 더욱 빠른 속도로 발전이 이어질 수 있다고 경고했습니다.

보고서는 또한 모델의 안전장치에 대한 심각한 우려를 제기했습니다. 연구원들은 다중 턴 에이전트 환경을 포함하여 테스트된 모든 악성 사이버 쿼리에서 유해 콘텐츠를 유발하는 범용 탈옥 취약점을 발견했습니다. 이 공격을 개발하는 데 전문가 레드팀이 6시간이 소요되었습니다. OpenAI는 이후 안전장치 스택을 업데이트했지만, 구성 문제로 인해 AISI는 최종 버전의 효과를 검증할 수 없었습니다.

AISI는 자체적인 역량 평가가 통제된 연구 환경에서 수행되었으며 일반 사용자가 접근할 수 있는 수준을 반드시 반영하는 것은 아니라고 경고하면서, 공개 배포에는 추가적인 보안 조치와 접근 제어가 포함된다고 언급했습니다.

이번 보고서는 영국 사이버 보안에 대한 우려스러운 상황 속에서 발표되었습니다. 목요일에 함께 발표된 영국 정부의 연례 사이버 보안 침해 조사에 따르면, 지난 12개월 동안 기업의 43%가 사이버 침해 또는 공격을 경험한 것으로 나타났습니다.

이에 정부는 사이버 복원력 강화를 위해 9천만 파운드의 신규 자금을 지원 한다고 발표했으며 , 필수 서비스 보호를 위한 사이버 보안 및 복원력 법안을 추진하고 있다고 밝혔습니다. 또한, 인공지능(AI)의 발달로 보안 결함 발견 및 악용 속도가 빨라짐에 따라 새롭게 발견되는 소프트웨어 취약점이 급증할 가능성에 대비해야 한다는 지침을 발표했습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트