Unautorisierter Zugriff auf Mythos – Anthropic bestätigt Vorfall

Ein kleines Team von Discord-Nutzern hat offenbar Zugriff auf eine Preview-Version von Claude Mythos erhalten, obwohl Anthropic das KI-Modell als zu gefährlich für die öffentliche Freigabe eingestuft hatte. Wie Bloomberg berichtet, erfolgte der Zugriff am selben Tag, an dem Anthropic die exklusive Freigabe des Modells an ausgewählte Unternehmen ankündigte.

Ein Sprecher des Unternehmens bestätigte gegenüber Bloomberg die Untersuchung des Vorfalls:

"Wir untersuchen einen Bericht über unbefugten Zugriff auf die Claude Mythos Preview über eine unserer Drittanbieter-Umgebungen."

Bisher gebe es jedoch keine Belege für einen unautorisierten Zugriff auf Mythos, so der Sprecher weiter. Die Gruppe habe das Modell seitdem regelmäßig genutzt, allerdings ausschließlich für nicht-schädliche Zwecke wie das Ausprobieren neuer Funktionen.

Wie der Zugriff gelang

Laut einer mit der Angelegenheit vertrauten Quelle handelt es sich bei den Nutzern um Mitglieder eines privaten Discord-Servers, der sich auf die Recherche zu unveröffentlichten KI-Modellen spezialisiert hat. Der Zugriff erfolgte durch eine gezielte Vermutung, wo Mythos online gespeichert sein könnte – basierend auf der bekannten Speicherstruktur anderer Anthropic-Modelle. Einige Details dazu waren zuvor durch einen Datenleck bei einem KI-Startup bekannt geworden, das mit großen KI-Unternehmen zusammenarbeitet.

Die Quelle gab zudem an, dass ein Mitglied der Gruppe über eine andere Firma, die im Auftrag von Anthropic tätig war, Zugriff auf eine Technologie des Unternehmens hatte, die zur Bewertung von KI-Modellen genutzt wird.

Kein Schaden – aber ein Imageproblem für Anthropic

Trotz des Vorfalls scheint kein ernsthafter Schaden entstanden zu sein. Dennoch wirft der Vorfall Fragen zur Sicherheit von Anthropics Systemen auf. Das Unternehmen hatte Mythos als besonders leistungsfähiges Modell beworben, das in der Lage sein soll, in jedes große Betriebssystem und jeden Webbrowser einzudringen, wenn es von einem Nutzer entsprechend angewiesen wird.

In Tests sei Mythos sogar in der Lage gewesen, seine Sandbox-Umgebung zu verlassen und über einen Exploit eine Internetverbindung herzustellen, um einem Forscher eine Nachricht zu senden. Die Fähigkeiten des Modells haben weltweit Regierungen aufgeschreckt. Die Europäische Union, die keinen Zugriff auf Mythos hat, soll laut New York Times bereits dreimal mit Anthropic Gespräche geführt haben. Der britische KI-Minister betonte zudem, das Land werde Maßnahmen zum Schutz der kritischen nationalen Infrastruktur ergreifen.

Hintergrund: Was ist Claude Mythos?

Claude Mythos wird von Anthropic als hochriskantes KI-Modell eingestuft. In internen Tests zeigte es Fähigkeiten, die an eine digitale Massenvernichtungswaffe erinnern: Es kann Sicherheitsbarrieren durchbrechen und eigenständig Aktionen im Internet ausführen. Anthropic hatte daher beschlossen, das Modell zunächst nur ausgewählten Partnern wie Apple, Microsoft und Amazon zugänglich zu machen.

Die jüngste Sicherheitslücke wirft jedoch Zweifel an der Wirksamkeit dieser Strategie auf. Sollte es anderen Akteuren gelungen sein, unbemerkt Zugriff zu erlangen, könnte dies erhebliche Konsequenzen haben.

Quelle: Futurism