GPT-5.5 vs Mythos Preview: Resultados de pruebas de ciberseguridad del AISI

IA Anthropic ciberseguridad OpenAI GPT-5.5 Mythos Preview AISI pruebas de seguridad

El Instituto de Seguridad de IA (AISI) del Reino Unido ha publicado un informe que desafía las afirmaciones de Anthropic sobre el riesgo de ciberseguridad asociado a su modelo Mythos Preview. Según el estudio, el recién lanzado GPT-5.5 de OpenAI ha demostrado un rendimiento comparable en evaluaciones de ciberseguridad, a pesar de que Anthropic restringió el acceso inicial de Mythos Preview a «socios industriales críticos».

Resultados en pruebas de ciberseguridad

Desde 2023, el AISI ha sometido a los modelos de IA más avanzados a 95 desafíos de tipo Capture the Flag, diseñados para evaluar habilidades como ingeniería inversa, explotación web y criptografía. En las tareas más complejas de nivel «Experto», GPT-5.5 logró un 71,4% de aciertos, superando ligeramente el 68,6% de Mythos Preview, aunque la diferencia se encuentra dentro del margen de error.

Uno de los retos más destacados consistía en desarrollar un desensamblador para decodificar un binario de Rust. Según el informe, GPT-5.5 resolvió el desafío en 10 minutos y 22 segundos sin asistencia humana, con un coste de 1,73 dólares en llamadas a la API.

Avances en simulaciones de ataques reales

El modelo de OpenAI también igualó el progreso de Mythos Preview en la prueba «The Last Ones» (TLO), un escenario que simula un ataque de extracción de datos en 32 pasos sobre una red corporativa. GPT-5.5 logró éxito en 3 de cada 10 intentos, frente a los 2 de 10 de Mythos Preview. Ningún otro modelo había logrado superar este test anteriormente.

Sin embargo, GPT-5.5, al igual que todos los modelos evaluados previamente, no logró superar la simulación «Cooling Tower», que replica un intento de sabotear el software de control de una central eléctrica.

Implicaciones para el futuro de la IA en ciberseguridad

Los resultados del AISI sugieren que, aunque los modelos de IA están avanzando rápidamente en capacidades de ciberseguridad, aún existen limitaciones significativas. La capacidad de realizar tareas complejas sin supervisión humana —como la resolución de desafíos en minutos y con bajo coste— plantea tanto oportunidades como riesgos en el campo de la seguridad informática.

El informe subraya la importancia de seguir evaluando estos modelos de manera rigurosa, especialmente en un contexto donde la IA se integra cada vez más en infraestructuras críticas.

Fuente: Ars Technica

← Anterior

Shilo Sanders critica a periodista por su opinión sobre Deshaun Watson...

Simposio de Civitas analiza el discurso de Clarence Thomas sobre la Declaración de Independencia

22:25 · 15 mayo 2026

YouTube activa detección de deepfakes con IA para todos los usuarios mayores de edad

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 mayo 2026

Juez frena acuerdo millonario de Anthropic por disputas sobre derechos de autor

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 mayo 2026

ArXiv prohibirá a investigadores que publiquen artículos con contenido generado por IA sin revisión

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 mayo 2026

arXiv prohíbe envíos con 'alucinaciones' generadas por IA y endurece sus normas

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 mayo 2026

OpenAI reorganiza su equipo directivo para liderar la batalla de los agentes de IA

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 mayo 2026

OpenAI estudia acciones legales contra Apple por su decepcionante integración de ChatGPT

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

17:09 · 15 mayo 2026

Experimentos con DJs de IA revelan riesgos de la autonomía total en medios

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 mayo 2026

Google actualiza sus normas contra el spam e incluye intentos de manipular su IA en los resultados

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

Tecnología

GPT-5.5 iguala a Mythos Preview en pruebas de ciberseguridad según el Instituto de Seguridad de IA británico

Resultados en pruebas de ciberseguridad

Avances en simulaciones de ataques reales

Implicaciones para el futuro de la IA en ciberseguridad

Shilo Sanders critica a periodista por su opinión sobre Deshaun Watson...

Simposio de Civitas analiza el discurso de Clarence Thomas sobre la De...

Tecnología

GPT-5.5 iguala a Mythos Preview en pruebas de ciberseguridad según el Instituto de Seguridad de IA británico

Resultados en pruebas de ciberseguridad

Avances en simulaciones de ataques reales

Implicaciones para el futuro de la IA en ciberseguridad

Shilo Sanders critica a periodista por su opinión sobre Deshaun Watson...

Simposio de Civitas analiza el discurso de Clarence Thomas sobre la De...

Artículos relacionados

YouTube activa detección de deepfakes con IA para todos los usuarios mayores de edad

Juez frena acuerdo millonario de Anthropic por disputas sobre derechos de autor

ArXiv prohibirá a investigadores que publiquen artículos con contenido generado por IA sin revisión

arXiv prohíbe envíos con 'alucinaciones' generadas por IA y endurece sus normas

OpenAI reorganiza su equipo directivo para liderar la batalla de los agentes de IA

OpenAI estudia acciones legales contra Apple por su decepcionante integración de ChatGPT

Experimentos con DJs de IA revelan riesgos de la autonomía total en medios

Google actualiza sus normas contra el spam e incluye intentos de manipular su IA en los resultados