OpenAI erklärt, warum seine KI keine Kobolde erwähnt

OpenAI künstliche Intelligenz Technologie KI-Modelle KI-Training GPT-5.5 KI-Zensur KI-Probleme

San Francisco – OpenAI räumt ein: Seine KI-Modelle haben ein ungewöhnliches Problem. Nach einem Bericht des Magazins Wired, das auf Anweisungen in OpenAIs Programmiermodellen hinwies, die bestimmte Fantasiewesen wie Kobolde, Gremlins, Waschbären, Trolle, Oger, Tauben oder andere Tiere und Kreaturen gezielt ausschließen sollten, veröffentlichte das Unternehmen nun eine Stellungnahme auf seiner Website.

Darin bezeichnet OpenAI diese Eigenheit als einen „seltsamen Trend“, der sich während des Trainings der Modelle entwickelt habe. Besonders auffällig wurde das Phänomen ab dem Modell GPT-5.1, vor allem bei der Nutzung der Persönlichkeitsoption „Nerdy“.

Laut OpenAI verschärfte sich das Problem mit jeder neuen Modellversion. Die KI begann, Metaphern und Vergleiche zu vermeiden, die mit den genannten Kreaturen in Verbindung stehen – selbst wenn diese in einem völlig harmlosen Kontext verwendet wurden. Das Unternehmen betont jedoch, dass es sich dabei nicht um eine bewusste Zensur handele, sondern um eine unbeabsichtigte Folge des Trainingsprozesses.

In dem Blogbeitrag erklärt OpenAI, dass die Modelle während des Trainings mit großen Mengen an Textdaten konfrontiert wurden, in denen bestimmte Fantasiewesen häufig in negativen oder problematischen Zusammenhängen erwähnt wurden. Dadurch habe die KI gelernt, diese Begriffe zu meiden, um mögliche Missverständnisse oder unerwünschte Assoziationen zu vermeiden.

Das Unternehmen arbeitet derzeit an einer Lösung, um das Problem zu beheben. Geplant sind unter anderem Anpassungen im Trainingsprozess sowie eine Überarbeitung der Filtermechanismen, um sicherzustellen, dass die KI auch in Zukunft frei und natürlich mit allen Themen umgehen kann.

Experten sehen in dem Vorfall ein Beispiel dafür, wie komplex und unvorhersehbar die Entwicklung von KI-Systemen sein kann. „Solche Eigenheiten zeigen, wie wichtig es ist, KI-Modelle kontinuierlich zu überwachen und zu testen“, sagt eine KI-Forscherin der Technischen Universität München. „Manchmal entstehen unerwartete Verhaltensmuster, die erst im praktischen Einsatz sichtbar werden.“

Quelle: The Verge

← Vorheriger

Seth Meyers: König Charles’ scharfer Humor prallte an Trump ab – wie S...

Retro-Computer als Handhelds: Commodore 64 und ZX Spectrum neu interpretiert

20:38 · 15 Mai 2026

ArXiv verhängt Sperre gegen Autoren mit KI-generierten Papers

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 Mai 2026

arXiv verbietet Einreichungen mit KI-Halluzinationen – harte Konsequenzen für Autoren

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 Mai 2026

OpenAI: Greg Brockman übernimmt Führung bei KI-Agenten-Strategie

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 Mai 2026

OpenAI verärgert über mangelhafte ChatGPT-Integration durch Apple

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

17:09 · 15 Mai 2026

KI-Radiomoderatoren scheitern spektakulär – warum Automatisierung allein nicht funktioniert

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 Mai 2026

Google verschärft Spam-Regeln: KI-Manipulation in Suchergebnissen wird bestraft

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

16:01 · 15 Mai 2026

ChatGPT bietet jetzt personalisierte Finanzberatung – mit Bankkonto-Anbindung

ChatGPT's new Plaid integration allows it pull information from more than 12,000 financial institutions.

16:00 · 15 Mai 2026

OpenAI: ChatGPT darf bald auf Bankkonten zugreifen

ChatGPT will even know how much credit card debt you have. | Image: OpenAI Your trust in AI is about to be put to the test: OpenAI will soon let you g...

Technologie

OpenAI erklärt, warum seine KI keine Kobolde erwähnt – und warum das ein Problem ist

Seth Meyers: König Charles’ scharfer Humor prallte an Trump ab – wie S...

Retro-Computer als Handhelds: Commodore 64 und ZX Spectrum neu interpr...

Technologie

OpenAI erklärt, warum seine KI keine Kobolde erwähnt – und warum das ein Problem ist

Seth Meyers: König Charles’ scharfer Humor prallte an Trump ab – wie S...

Retro-Computer als Handhelds: Commodore 64 und ZX Spectrum neu interpr...

Verwandte Artikel

ArXiv verhängt Sperre gegen Autoren mit KI-generierten Papers

arXiv verbietet Einreichungen mit KI-Halluzinationen – harte Konsequenzen für Autoren

OpenAI: Greg Brockman übernimmt Führung bei KI-Agenten-Strategie

OpenAI verärgert über mangelhafte ChatGPT-Integration durch Apple

KI-Radiomoderatoren scheitern spektakulär – warum Automatisierung allein nicht funktioniert

Google verschärft Spam-Regeln: KI-Manipulation in Suchergebnissen wird bestraft

ChatGPT bietet jetzt personalisierte Finanzberatung – mit Bankkonto-Anbindung

OpenAI: ChatGPT darf bald auf Bankkonten zugreifen