지난달 앤트로픽(Anthropic)은 자체 개발 AI 모델 'Mythos Preview'가 사이버 보안 위협을 과장해 발표했으며, 초기 출시를 '핵심 산업 파트너'로 제한했다고 밝혔다. 그러나 영국 AI 보안 연구소(AISI)의 새로운 연구 결과에 따르면, 오픈AI(OpenAI)의 최신 모델 GPT-5.5(지난주 공개)가 지난달 AISI가 평가한 Mythos Preview와 유사한 사이버 보안 성능을 발휘했다고 밝혔다.

AISI는 2023년부터 95개의 다양한 '캡처 더 플래그(CTF)' 챌린지를 통해 AI 모델의 사이버 보안 능력을 평가해왔다. 이 챌린지들은 역공학, 웹 취약점 공격, 암호학 등 실무와 유사한 과제로 구성되어 있다. 최고 난이도 '전문가(Expert)' 등급에서 GPT-5.5는 평균 71.4%의 성공률을 기록했으며, 이는 Mythos Preview의 68.6%와 거의 유사했다(오차 범위 내).

특히 어려운 과제 중 하나였던 Rust 바이너리를 디스어셈블러로 디코딩하는 작업에서는 GPT-5.5가 10분 22초 만에 인간 도움 없이 해결했으며, API 호출 비용은 단 1.73달러에 불과했다.

AISI는 또한 GPT-5.5가 '더 라스트 원즈(The Last Ones, TLO)'라는 자체 개발 테스트에서도 Mythos Preview와 유사한 성능을 보였다고 밝혔다. TLO는 기업 네트워크에서 32단계 데이터 추출 공격을 시뮬레이션하는 테스트로, GPT-5.5는 10회 시도 중 3회 성공했으며, Mythos Preview는 2회 성공했다. 이전 모델들은 이 테스트에서 한 번도 성공하지 못했다.

그러나 AISI가 개발한 더 어려운 '쿨링 타워(Cooling Tower)' 시뮬레이션(발전소 제어 시스템 해킹 시나리오)에서는 GPT-5.5를 포함한 모든 AI 모델이 여전히 실패했다.