GPT-5.5 vs. Mythos Preview: Wer ist der bessere Cybersecurity-KI?

KI OpenAI Anthropic Cybersicherheit Cyberangriffe Mythos Preview KI-Tests GPT-5.5 AI Security Institute

Das britische AI Security Institute (AISI) hat in aktuellen Tests festgestellt, dass OpenAIs neues Modell GPT-5.5 in Cybersecurity-Aufgaben eine vergleichbare Leistung wie Anthropics Mythos Preview erbringt. Beide Modelle wurden im Rahmen von 95 sogenannten „Capture the Flag“-Herausforderungen geprüft, die Fähigkeiten wie Reverse Engineering, Web-Exploitation und Kryptographie umfassen.

Auf den höchsten Schwierigkeitsgraden („Expert“-Aufgaben) erreichte GPT-5.5 im Schnitt 71,4 % der Punkte – leicht über den 68,6 % von Mythos Preview. Die Differenz liegt jedoch innerhalb der Fehlergrenze. Besonders beeindruckend war die Leistung bei einer komplexen Aufgabe: GPT-5.5 entschlüsselte innerhalb von 10 Minuten und 22 Sekunden einen Rust-Binary-Code ohne menschliche Hilfe. Die Kosten für die API-Aufrufe beliefen sich dabei auf nur 1,73 US-Dollar.

Auch bei „The Last Ones“ (TLO), einem AISI-Test, der einen 32-stufigen Datenangriff auf ein Firmennetzwerk simuliert, zeigte GPT-5.5 vergleichbare Fortschritte. Das Modell gelangte in drei von zehn Versuchen zum Ziel – Mythos Preview schaffte dies in zwei von zehn Fällen. Kein anderes bisher getestetes KI-Modell hatte diese Aufgabe jemals erfolgreich bewältigt.

Allerdings stößt GPT-5.5 wie alle anderen getesteten Modelle an seine Grenzen, wenn es um die „Cooling Tower“-Simulation geht. Diese simuliert einen Angriff auf die Steuerungssoftware eines Kraftwerks und gilt als besonders anspruchsvoll. Bisher konnte kein Modell diese Herausforderung bestehen.

Quelle: Ars Technica

← Vorheriger

Shilo Sanders kritisiert Reporterin Mary Kay Cabot – „Mach lieber ein...

Symposium zu Clarence Thomas: Debatten um die Unabhängigkeitserklärung nach 250 Jahren

16:34 · 16 Mai 2026

OpenAI startet ChatGPT Plus in Malta – KI-Kurs als Pflicht für Nutzer

Residents will have to go through a course on artificial intelligence before activating the subscription.

12:00 · 16 Mai 2026

Die besten Laptops für fast jeden Nutzer – Empfehlungen 2026

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

11:00 · 16 Mai 2026

USA setzt auf KI, um Insiderhandel in Prognosemärkten zu bekämpfen

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 Mai 2026

YouTube startet KI-Tiefenfälschungserkennung für alle Erwachsenen

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 Mai 2026

Richter blockiert 1,5-Milliarden-Dollar-Vergleich von Anthropic wegen Urheberrechtsstreit

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 Mai 2026

ArXiv verhängt Sperre gegen Autoren mit KI-generierten Papers

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 Mai 2026

arXiv verbietet Einreichungen mit KI-Halluzinationen – harte Konsequenzen für Autoren

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 Mai 2026

OpenAI: Greg Brockman übernimmt Führung bei KI-Agenten-Strategie

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

Technologie

GPT-5.5 erreicht ähnliches Niveau wie Mythos Preview in Cybersecurity-Tests

Shilo Sanders kritisiert Reporterin Mary Kay Cabot – „Mach lieber ein...

Symposium zu Clarence Thomas: Debatten um die Unabhängigkeitserklärung...

Technologie

GPT-5.5 erreicht ähnliches Niveau wie Mythos Preview in Cybersecurity-Tests

Shilo Sanders kritisiert Reporterin Mary Kay Cabot – „Mach lieber ein...

Symposium zu Clarence Thomas: Debatten um die Unabhängigkeitserklärung...

Verwandte Artikel

OpenAI startet ChatGPT Plus in Malta – KI-Kurs als Pflicht für Nutzer

Die besten Laptops für fast jeden Nutzer – Empfehlungen 2026

USA setzt auf KI, um Insiderhandel in Prognosemärkten zu bekämpfen

YouTube startet KI-Tiefenfälschungserkennung für alle Erwachsenen

Richter blockiert 1,5-Milliarden-Dollar-Vergleich von Anthropic wegen Urheberrechtsstreit

ArXiv verhängt Sperre gegen Autoren mit KI-generierten Papers

arXiv verbietet Einreichungen mit KI-Halluzinationen – harte Konsequenzen für Autoren

OpenAI: Greg Brockman übernimmt Führung bei KI-Agenten-Strategie