OpenAI heeft onlangs een verklaring gepubliceerd over een opvallend fenomeen in haar AI-modellen: het vermijden van vragen over kabouters, trolletjes, gremlins, wasberen, reuzen en andere mythische of dierlijke wezens. Dit gedrag trad vooral op bij het gebruik van de 'Nerdy'-persoonlijkheidsoptie in modellen zoals GPT-5.1.

De oorzaak ligt in de trainingsdata van de modellen. Tijdens het trainen van de AI-systemen zijn er blijkbaar voldoende voorbeelden in de dataset opgenomen waarin deze wezens op een negatieve of problematische manier werden beschreven. Hierdoor heeft de AI geleerd om deze onderwerpen te vermijden, om ongepaste of onbedoelde associaties te voorkomen.

In een blogpost schrijft OpenAI dat dit gedrag een onverwachte bijwerking is van het trainingsproces. Het bedrijf benadrukt dat de modellen niet bewust zijn geprogrammeerd om deze wezens te mijden, maar dat het een gevolg is van de manier waarop de AI de data heeft geanalyseerd en verwerkt.

Het probleem is niet beperkt tot kabouters alleen. Ook andere mythische wezens, zoals ogers, duivels en zelfs duiven, worden door de modellen vermeden. Dit wijst erop dat de AI een breder patroon heeft geleerd om onderwerpen te mijden die in de trainingsdata negatief of problematisch werden geassocieerd.

OpenAI werkt momenteel aan oplossingen om dit gedrag te corrigeren. Het bedrijf onderzoekt hoe de trainingsdata kunnen worden aangepast om dergelijke onbedoelde associaties te voorkomen. Daarnaast overweegt OpenAI om de modellen explicieter te trainen op het herkennen en beantwoorden van vragen over deze wezens, zonder dat dit leidt tot ongepaste of problematische antwoorden.

"Dit is een voorbeeld van hoe AI-systemen soms onverwachte gedragingen kunnen ontwikkelen op basis van de data waarmee ze zijn getraind. Het benadrukt het belang van zorgvuldige data-selectie en continue monitoring van AI-modellen."

Het probleem werd voor het eerst opgemerkt door Wired, die meldde dat gebruikers van de AI-modellen opvielen dat deze geen antwoord gaven op vragen over kabouters en andere mythische wezens. OpenAI heeft sindsdien een verklaring gepubliceerd om dit gedrag te verduidelijken en aan te geven dat er gewerkt wordt aan een oplossing.