GPT-5.5 vs Mythos Preview: AI 사이버 보안 테스트 결과 공개

GPT-5.5 AI 보안 Mythos Preview 사이버 보안 테스트 AI 모델 성능 AISI 캡처 더 플래그 Rust 바이너리 쿨링 타워 AI 보안 연구

지난달 앤트로픽(Anthropic)은 자체 개발 AI 모델 'Mythos Preview'가 사이버 보안 위협을 과장해 발표했으며, 초기 출시를 '핵심 산업 파트너'로 제한했다고 밝혔다. 그러나 영국 AI 보안 연구소(AISI)의 새로운 연구 결과에 따르면, 오픈AI(OpenAI)의 최신 모델 GPT-5.5(지난주 공개)가 지난달 AISI가 평가한 Mythos Preview와 유사한 사이버 보안 성능을 발휘했다고 밝혔다.

AISI는 2023년부터 95개의 다양한 '캡처 더 플래그(CTF)' 챌린지를 통해 AI 모델의 사이버 보안 능력을 평가해왔다. 이 챌린지들은 역공학, 웹 취약점 공격, 암호학 등 실무와 유사한 과제로 구성되어 있다. 최고 난이도 '전문가(Expert)' 등급에서 GPT-5.5는 평균 71.4%의 성공률을 기록했으며, 이는 Mythos Preview의 68.6%와 거의 유사했다(오차 범위 내).

특히 어려운 과제 중 하나였던 Rust 바이너리를 디스어셈블러로 디코딩하는 작업에서는 GPT-5.5가 10분 22초 만에 인간 도움 없이 해결했으며, API 호출 비용은 단 1.73달러에 불과했다.

AISI는 또한 GPT-5.5가 '더 라스트 원즈(The Last Ones, TLO)'라는 자체 개발 테스트에서도 Mythos Preview와 유사한 성능을 보였다고 밝혔다. TLO는 기업 네트워크에서 32단계 데이터 추출 공격을 시뮬레이션하는 테스트로, GPT-5.5는 10회 시도 중 3회 성공했으며, Mythos Preview는 2회 성공했다. 이전 모델들은 이 테스트에서 한 번도 성공하지 못했다.

그러나 AISI가 개발한 더 어려운 '쿨링 타워(Cooling Tower)' 시뮬레이션(발전소 제어 시스템 해킹 시나리오)에서는 GPT-5.5를 포함한 모든 AI 모델이 여전히 실패했다.

출처: Ars Technica

← 이전

클리블랜드 브라운스 QB 경쟁 관련 ‘샤일로 샌더스’의 기자 비판 발언

클라렌스 토머스 대법관의 독립선언 250주년 기념 강연, 보수 진영에 큰 반향

12:00 · 16 5월 2026

2026년 최고의 노트북 추천: 누구에게나 맞는 모델은?

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

11:00 · 16 5월 2026

미국, AI로 예측시장 내 내부자 거래 감시 강화

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 5월 2026

유튜브, AI 기반 딥페이크 감지 도구 전면 확대…18세 이상 이용자 대상

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 5월 2026

앤트로픽, 15억 달러 저작권 합의서 승인 연기…저작권자들 반발로

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 5월 2026

아카이브, AI로 생성된 ‘슬롭’ 논문 제출 연구자 제재 강화

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 5월 2026

아카이브 arXiv, AI 허위 생성물 제출자에 대해 제재 강화

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 5월 2026

OpenAI, AI 에이전트 경쟁력 강화 위해 조직 개편…브록먼 대표 제품 총괄

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 5월 2026

오픈AI, 애플의 ‘ChatGPT 통합’ 실패에 법적 대응 검토

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

기술

GPT-5.5와 Mythos Preview, AI 사이버 보안 테스트에서 유사한 성능 발휘

클리블랜드 브라운스 QB 경쟁 관련 ‘샤일로 샌더스’의 기자 비판 발언

클라렌스 토머스 대법관의 독립선언 250주년 기념 강연, 보수 진영에 큰 반...

기술

GPT-5.5와 Mythos Preview, AI 사이버 보안 테스트에서 유사한 성능 발휘

클리블랜드 브라운스 QB 경쟁 관련 ‘샤일로 샌더스’의 기자 비판 발언

클라렌스 토머스 대법관의 독립선언 250주년 기념 강연, 보수 진영에 큰 반...

관련 기사

2026년 최고의 노트북 추천: 누구에게나 맞는 모델은?

미국, AI로 예측시장 내 내부자 거래 감시 강화

유튜브, AI 기반 딥페이크 감지 도구 전면 확대…18세 이상 이용자 대상

앤트로픽, 15억 달러 저작권 합의서 승인 연기…저작권자들 반발로

아카이브, AI로 생성된 ‘슬롭’ 논문 제출 연구자 제재 강화

아카이브 arXiv, AI 허위 생성물 제출자에 대해 제재 강화

OpenAI, AI 에이전트 경쟁력 강화 위해 조직 개편…브록먼 대표 제품 총괄

오픈AI, 애플의 ‘ChatGPT 통합’ 실패에 법적 대응 검토