El Instituto de Seguridad de IA (AISI) del Reino Unido ha publicado un informe que desafía las afirmaciones de Anthropic sobre el riesgo de ciberseguridad asociado a su modelo Mythos Preview. Según el estudio, el recién lanzado GPT-5.5 de OpenAI ha demostrado un rendimiento comparable en evaluaciones de ciberseguridad, a pesar de que Anthropic restringió el acceso inicial de Mythos Preview a «socios industriales críticos».

Resultados en pruebas de ciberseguridad

Desde 2023, el AISI ha sometido a los modelos de IA más avanzados a 95 desafíos de tipo Capture the Flag, diseñados para evaluar habilidades como ingeniería inversa, explotación web y criptografía. En las tareas más complejas de nivel «Experto», GPT-5.5 logró un 71,4% de aciertos, superando ligeramente el 68,6% de Mythos Preview, aunque la diferencia se encuentra dentro del margen de error.

Uno de los retos más destacados consistía en desarrollar un desensamblador para decodificar un binario de Rust. Según el informe, GPT-5.5 resolvió el desafío en 10 minutos y 22 segundos sin asistencia humana, con un coste de 1,73 dólares en llamadas a la API.

Avances en simulaciones de ataques reales

El modelo de OpenAI también igualó el progreso de Mythos Preview en la prueba «The Last Ones» (TLO), un escenario que simula un ataque de extracción de datos en 32 pasos sobre una red corporativa. GPT-5.5 logró éxito en 3 de cada 10 intentos, frente a los 2 de 10 de Mythos Preview. Ningún otro modelo había logrado superar este test anteriormente.

Sin embargo, GPT-5.5, al igual que todos los modelos evaluados previamente, no logró superar la simulación «Cooling Tower», que replica un intento de sabotear el software de control de una central eléctrica.

Implicaciones para el futuro de la IA en ciberseguridad

Los resultados del AISI sugieren que, aunque los modelos de IA están avanzando rápidamente en capacidades de ciberseguridad, aún existen limitaciones significativas. La capacidad de realizar tareas complejas sin supervisión humana —como la resolución de desafíos en minutos y con bajo coste— plantea tanto oportunidades como riesgos en el campo de la seguridad informática.

El informe subraya la importancia de seguir evaluando estos modelos de manera rigurosa, especialmente en un contexto donde la IA se integra cada vez más en infraestructuras críticas.