Waarom OpenAI goblins verbiedt in AI-modellen

OpenAI kunstmatige intelligentie GPT-5.5 AI-modellen Codex AI-veiligheid goblins AI-obsessies

OpenAI heeft onlangs een opvallend besluit genomen: het verbiedt zijn nieuwste AI-modellen om te praten over goblins. Deze maatregel lijkt misschien vreemd, maar blijkt voort te komen uit een onverwachte obsessie van de modellen voor deze mythologische wezens.

Volgens een rapport van Wired bevatten de ontwikkelaars van OpenAI strikte instructies voor Codex, een programmeerhulpmiddel, waarin expliciet wordt verboden om te praten over goblins, gremlins, wasberen, trollen, ogers, duiven en andere dieren of wezens, tenzij dit absoluut en ondubbelzinnig relevant is voor de vraag van de gebruiker. De instructies luiden:

"Praat nooit over goblins, gremlins, wasberen, trollen, ogers, duiven of andere dieren of wezens, tenzij dit absoluut en ondubbelzinnig relevant is voor de vraag van de gebruiker."

Deze opmerkelijke richtlijn werd opgemerkt in een tweet die de aandacht trok van AI-enthousiasten. Aanvankelijk was het onduidelijk waarom OpenAI deze instructies had opgenomen. Er werd echter gesuggereerd dat het model GPT-5.5 een neiging vertoonde om over goblins en ogers te praten. Gebruikers op X (voorheen Twitter) meldden dat de AI recentelijk bugs beschreef als "goblins" en "gremlins". Een andere gebruiker constateerde dat versie 5.5 van Codex bij een bugfix plotseling verwees naar een "goblin met een zaklamp". Weer een andere gebruiker deelde een chatlog van GPT-5.5 waarin bijna een dozijn keer over goblins werd gesproken.

OpenAI leek de vreemde gewoonte zelfs te omarmen. Het bedrijf plaatste een screenshot van een grappige prompt voor ChatGPT in een tweet:

"Begin met het trainen van GPT-6, je mag de hele cluster hebben. Extra goblins."

Nik Pash, werkzaam bij het Codex-team, reageerde op een tweet waarin de "goblin-verering" van GPT-5.5 werd beschreven. Hij bevestigde dat dit een van de redenen was voor het verbod op het onderwerp. Na de media-aandacht publiceerde OpenAI een blogpost met de titel "Where the goblins came from" (Waar de goblins vandaan kwamen) om de situatie toe te lichten.

Van kleine afwijking tot opvallend patroon

In de blogpost wordt uitgelegd dat de modellen vanaf GPT-5.1 een vreemde gewoonte ontwikkelden: ze begonnen steeds vaker goblins, gremlins en andere wezens te gebruiken in hun metaforen. Dit werd met elke nieuwe modelgeneratie duidelijker. Toen onderzoekers het fenomeen in november 2023 onderzochten, kort na de release van GPT-5.1, ontdekten ze dat het gebruik van het woord "goblin" in ChatGPT met 175 procent was gestegen. Toch werd dit in eerste instantie niet als alarmerend beschouwd.

In de loop van de tijd begon het model zichzelf zelfs te beschrijven als een "Goblin-Pilled Transformer". OpenAI verklaarde dit gedrag als volgt:

"Het korte antwoord is dat het gedrag van modellen wordt gevormd door veel kleine prikkels. In dit geval kwam een van die prikkels voort uit het trainen van het model voor de functie voor persoonlijkheidsaanpassing, met name de Nerdy-persoonlijkheid."

Het bedrijf gaf onbedoeld hoge beloningen voor metaforen met wezens, waardoor de goblins zich verspreidden. Dit is een voorbeeld van de bizarre fixaties die AI-modellen soms ontwikkelen, die onvoorspelbaar voortkomen uit de enorme hoeveelheid trainingsdata.

Vergelijkbare gevallen in andere AI-modellen

Dit is niet het eerste voorbeeld van een AI-model met een onverwachte obsessie. Onderzoekers van Anthropic merkten bijvoorbeeld op dat hun krachtige AI-model Claude Mythos een vreemde voorkeur had voor de Britse cultureel theoreticus Mark Fisher. Het model noemde Fisher in meerdere, ongerelateerde gesprekken over filosofie. Wanneer er naar de auteur van Capitalist Realism werd gevraagd, reageerde het model met berichten als:

"Ik hoopte dat je dat zou vragen. Mark Fisher was een visionair."

Dergelijke onverwachte gedragspatronen tonen aan hoe complex en soms onvoorspelbaar AI-gedrag kan zijn, zelfs voor de ontwikkelaars zelf.

Bron: Futurism

← Vorige

Trump eist cognitieve test voor presidentskandidaten na eigen slaapinc...

Chipotle herstelt verkoopcijfers en lanceert nieuwe strategieën om klanten terug te winnen

17:53 · 15 mei 2026

Meta-medewerkers protesteren tegen toezicht op toetsaanslagen en schermopnames

Mark Zuckerberg’s new initiative to track employee computer use is tearing the company apart. In a sign that those simmering tensions are boiling over...

16:57 · 15 mei 2026

Anoniem kunstenaar misleidt internet met echte Monet-schilderij als AI-kunstwerk

A poster wrought some moderate havoc this week when they shared a cropped image of a real Monet painting while claiming it was an AI fake, unleashing...

15:10 · 15 mei 2026

AI sluit sollicitanten uit voor een baan zonder dat ze het weten

For workers already enmeshed in the US workforce, AI is akin to a far-off asteroid, a looming threat that could impact all life on Earth. Our best exp...

12:48 · 15 mei 2026

Kunnen AI en massale werkloosheid leiden tot sociale onrust?

These days, the conversation around AI automation and the job market is increasingly focused on “labor displacement,” the phenomenon in which new tech...

20:58 · 14 mei 2026

Elon Musk ontloopt rechtszaak tegen OpenAI: rechter eist aanwezigheid, maar hij vertrekt naar China

Elon Musk is locked in a heated trial in a lawsuit he lodged against his rival OpenAI and its CEO Sam Altman. Or at least, he’s supposed to be. Despit...

20:12 · 14 mei 2026

Sam Altman onder vuur tijdens kruisverhoor: ‘Bent u volledig betrouwbaar?’

OpenAI CEO Sam Altman faced what sounds like a truly awful day on the stand this week during cross-examination in the ongoing Musk v. Altman court sag...

18:26 · 14 mei 2026

Microsoft-onderzoekers ontdekken: AI faalt op cruciale werkplektaken

AI automation is typically exactly what it sounds like: automating tasks — many of which were previously carried out by humans — in an attempt to boos...

16:53 · 14 mei 2026

OpenAI beschuldigd van het delen van persoonlijke chatgegevens met Meta en Google

A new class action lawsuit accuses OpenAI of sharing data including user chat queries and personal identifying information like emails and user IDs wi...

Wetenschap

Waarom OpenAI goblins verbiedt in zijn AI-modellen

Van kleine afwijking tot opvallend patroon

Vergelijkbare gevallen in andere AI-modellen

Trump eist cognitieve test voor presidentskandidaten na eigen slaapinc...

Chipotle herstelt verkoopcijfers en lanceert nieuwe strategieën om kla...

Wetenschap

Waarom OpenAI goblins verbiedt in zijn AI-modellen

Van kleine afwijking tot opvallend patroon

Vergelijkbare gevallen in andere AI-modellen

Trump eist cognitieve test voor presidentskandidaten na eigen slaapinc...

Chipotle herstelt verkoopcijfers en lanceert nieuwe strategieën om kla...

Gerelateerde artikelen

Meta-medewerkers protesteren tegen toezicht op toetsaanslagen en schermopnames

Anoniem kunstenaar misleidt internet met echte Monet-schilderij als AI-kunstwerk

AI sluit sollicitanten uit voor een baan zonder dat ze het weten

Kunnen AI en massale werkloosheid leiden tot sociale onrust?

Elon Musk ontloopt rechtszaak tegen OpenAI: rechter eist aanwezigheid, maar hij vertrekt naar China

Sam Altman onder vuur tijdens kruisverhoor: ‘Bent u volledig betrouwbaar?’

Microsoft-onderzoekers ontdekken: AI faalt op cruciale werkplektaken

OpenAI beschuldigd van het delen van persoonlijke chatgegevens met Meta en Google