인공지능(AI) 기업 오픈AI(OpenAI)가 5일(현지시간) 최신 AI 모델 GPT-5.5를 발표했다. 이 모델은 코딩 에이전트 'Codex'의 성능을 한층 강화할 뿐만 아니라 과학 연구와 일반 디지털 업무까지 폭넓게 지원하는 '에이전트형 AI'로 주목받고 있다.

오픈AI는 공식 블로그를 통해 GPT-5.5가 복잡한 다단계 작업을 자율적으로 수행할 수 있는 능력을 갖추고 있다고 설명했다. 특히 과학 연구 분야에서 새로운 가설을 생성하고 검증하는 등 창의적 작업에서도 뛰어난 성능을 발휘한다고 밝혔다.

코딩·과학 연구·일반 업무에서 압도적 성능

GPT-5.5는 명령줄 기반 복잡한 워크플로우를 테스트하는 'Terminal-Bench 2.0'에서 82.7%의 정확도를 기록하며 기존 모델을 크게 앞섰다. 비교 대상으로는 GPT-5.4(75.1%), 앤트로픽의 'Opus 4.7'(69.4%), 구글의 'Gemini 3.1 Pro'(68.5%) 등이 있다.

또한 컴퓨터 조작 능력을 평가하는 'OSWorld-Verified'에서는 78.7%의 성적을 기록해 GPT-5.4(75.0%)를 제쳤다. 앤트로픽의 'Opus 4.7'은 78%로 GPT-5.5와 비슷한 수준을 보였다.

Codex 에이전트 성능 대폭 향상

오픈AI는 GPT-5.5가 코딩 에이전트 'Codex'의 성능을 한층 강화할 것이라고 강조했다. 현재 주간 약 400만 명의 개발자가 Codex를 사용하고 있으며, 오픈AI CEO 그렉 브록먼(Greg Brockman)은 GPT-5.5가 시니어 소프트웨어 엔지니어 수준의 코딩 능력을 제공할 수 있다고 설명했다.

실제GitHub 이슈 해결 능력을 평가하는 'SWE-Bench Pro'에서는 단일 통과로 58.6%의 문제를 해결했으며, 개발자들은 GPT-5.5가 소프트웨어 시스템의 구조를 더 잘 이해하고 오류 원인과 영향을 분석하는 능력이 뛰어나다고 평가했다.

경쟁사와의 경쟁 가속화

GPT-5.5는 불과 몇 주 전에 공개된 GPT-5.4에 이어 오픈AI가 내놓은 최신 모델이다. 특히 AI 코딩 에이전트 분야에서 경쟁사 앤트로픽과의 경쟁이 치열해지면서 AI 시스템 개발 속도도 빨라지고 있다. 오픈AI는 자체 AI가 AI 시스템 개발에 활용되면서 개발 속도가 가속화되고 있다고 밝혔다.

일각에서는 새로운 모델이 최대 10조 개의 파라미터를 보유할 수 있다는 추측이 제기됐지만, 브록먼 CEO는 이에 대해 명확한 답변을 피했다.

출시 일정 및 이용 가능 계층

GPT-5.5는 현재 오픈AI의 'Plus', 'Pro', 'Business', 'Enterprise' 구독자들을 대상으로 ChatGPT와 Codex에서 이용할 수 있다. 특히 'GPT-5.5 Pro'는 더 높은 정확도를 요구하는 'Pro', 'Business', 'Enterprise' 사용자들에게 제공된다.