San Francisco – OpenAI räumt ein: Seine KI-Modelle haben ein ungewöhnliches Problem. Nach einem Bericht des Magazins Wired, das auf Anweisungen in OpenAIs Programmiermodellen hinwies, die bestimmte Fantasiewesen wie Kobolde, Gremlins, Waschbären, Trolle, Oger, Tauben oder andere Tiere und Kreaturen gezielt ausschließen sollten, veröffentlichte das Unternehmen nun eine Stellungnahme auf seiner Website.

Darin bezeichnet OpenAI diese Eigenheit als einen „seltsamen Trend“, der sich während des Trainings der Modelle entwickelt habe. Besonders auffällig wurde das Phänomen ab dem Modell GPT-5.1, vor allem bei der Nutzung der Persönlichkeitsoption „Nerdy“.

Laut OpenAI verschärfte sich das Problem mit jeder neuen Modellversion. Die KI begann, Metaphern und Vergleiche zu vermeiden, die mit den genannten Kreaturen in Verbindung stehen – selbst wenn diese in einem völlig harmlosen Kontext verwendet wurden. Das Unternehmen betont jedoch, dass es sich dabei nicht um eine bewusste Zensur handele, sondern um eine unbeabsichtigte Folge des Trainingsprozesses.

In dem Blogbeitrag erklärt OpenAI, dass die Modelle während des Trainings mit großen Mengen an Textdaten konfrontiert wurden, in denen bestimmte Fantasiewesen häufig in negativen oder problematischen Zusammenhängen erwähnt wurden. Dadurch habe die KI gelernt, diese Begriffe zu meiden, um mögliche Missverständnisse oder unerwünschte Assoziationen zu vermeiden.

Das Unternehmen arbeitet derzeit an einer Lösung, um das Problem zu beheben. Geplant sind unter anderem Anpassungen im Trainingsprozess sowie eine Überarbeitung der Filtermechanismen, um sicherzustellen, dass die KI auch in Zukunft frei und natürlich mit allen Themen umgehen kann.

Experten sehen in dem Vorfall ein Beispiel dafür, wie komplex und unvorhersehbar die Entwicklung von KI-Systemen sein kann. „Solche Eigenheiten zeigen, wie wichtig es ist, KI-Modelle kontinuierlich zu überwachen und zu testen“, sagt eine KI-Forscherin der Technischen Universität München. „Manchmal entstehen unerwartete Verhaltensmuster, die erst im praktischen Einsatz sichtbar werden.“

Quelle: The Verge