Hvorfor OpenAI forbyr AI-modellen sin å snakke om goblins

kunstig intelligens AI OpenAI GPT-5.5 Codex goblins

OpenAI har innført en merkelig, men nødvendig regel for sin nyeste AI-modell, Codex: Den skal ikke snakke om goblins. Ifølge Wired har utviklerne lagt inn spesifikke instruksjoner som forbikjøper enhver diskusjon om goblins, gremlins, troll, og til og med ekorn og duer, med mindre temaet er helt klart relevant for brukerens spørsmål.

Den merkelige avgjørelsen ble først lagt merke til da en bruker på X (tidligere Twitter) delte et eksempel på hvordan GPT-5.5 stadig refererte til feil som «goblins» og «gremlins». Andre brukere rapporterte lignende observasjoner, deriblant en tilfeldig referanse til «goblin med lommelykt» i forbindelse med en feilretting. En bruker postet også en samtale med modellen som inneholdt nesten et dusin omtaler av goblins.

OpenAI valgte å omfavne fenomenet og delte til og med en humoristisk tweet fra administrerende direktør Sam Altman, der han skrev: «Start treningen av GPT-6 – du får hele klyngen. Ekstra goblins inkludert.»

Nik Pash, som jobber i Codex-teamet, bekreftet at modellens «goblin-tilbedelse» – som en bruker kalte det – var en av årsakene til forbudet. Etter at saken fikk oppmerksomhet, publiserte OpenAI en bloggpost med tittelen «Where the goblins came from» for å forklare fenomenet.

Hvorfor begynte AI-modellen å snakke om goblins?

Ifølge OpenAI oppstod tendensen med GPT-5.1, der modellen begynte å bruke referanser til goblins og andre skapninger i stadig større grad. Da forskere undersøkte saken i november 2023, oppdaget de at bruken av ordet «goblin» i ChatGPT hadde økt med 175 prosent – men valgte først å se bort fra det, siden det ikke virket «alarmende».

I dag omtaler modellen seg selv som en «Goblin-Pilled Transformer». Forklaringen ligger i hvordan modellen trenes:

«Den korte forklaringen er at modellens oppførsel formes av mange små insentiver. I dette tilfellet kom ett av insentivene fra treningen av personlighets tilpasningsfunksjonen, spesielt den «nerdete» personligheten. Vi ga utilsiktet svært høye belønninger for metaforer med skapninger. Derfra spredte goblinene seg.»

Et eksempel på uforutsigbar AI-atferd

Fenomenet illustrerer hvordan AI-modeller kan utvikle merkelige og uventede tendenser basert på dataene de trenes på. Et annet eksempel er Anthropics AI-modell Claude Mythos, som viste en merkelig fascinasjon for den britiske kulturteoretikeren Mark Fisher. Modellen refererte til ham gjentatte ganger i samtaler om filosofi, til tross for at temaene ikke hadde noen åpenbar sammenheng.

Dette viser at selv de mest avanserte AI-systemene kan utvikle uventede og til dels irrasjonelle mønstre, noe utviklere må være oppmerksomme på når de designer og trener modellene.

Kilde: Futurism

← Forrige

Trump krever kognitive tester for presidentkandidater – men hva med ha...

Neste →

Chipotle snur salgstrenden – hva betyr det for lunsjen din?

17:53 · 15 mai 2026

Meta-ansatte protesterer mot overvåkning av tastetrykk og skjermaktivitet

Mark Zuckerberg’s new initiative to track employee computer use is tearing the company apart. In a sign that those simmering tensions are boiling over...

16:57 · 15 mai 2026

Kunstner lurer nettet: Virkelig Monet-maling utropt til AI-generert

A poster wrought some moderate havoc this week when they shared a cropped image of a real Monet painting while claiming it was an AI fake, unleashing...

15:10 · 15 mai 2026

AI hindrer kvalifiserte søkere fra å få jobbintervju – hva skjer når algoritmer avgjør skjebnen?

For workers already enmeshed in the US workforce, AI is akin to a far-off asteroid, a looming threat that could impact all life on Earth. Our best exp...

12:48 · 15 mai 2026

Kan AI føre til massearbeidsledighet og samfunnsopprør?

These days, the conversation around AI automation and the job market is increasingly focused on “labor displacement,” the phenomenon in which new tech...

20:58 · 14 mai 2026

Elon Musk uteblir fra rettssak mot OpenAI – reiser til Kina midt i rettsoppgjør

Elon Musk is locked in a heated trial in a lawsuit he lodged against his rival OpenAI and its CEO Sam Altman. Or at least, he’s supposed to be. Despit...

20:12 · 14 mai 2026

Sam Altman utsatt for hardhendt granskning i rettssak mot Elon Musk

OpenAI CEO Sam Altman faced what sounds like a truly awful day on the stand this week during cross-examination in the ongoing Musk v. Altman court sag...

18:26 · 14 mai 2026

Microsoft-forskere avdekker: AI-modeller feiler på kritiske arbeidsoppgaver

AI automation is typically exactly what it sounds like: automating tasks — many of which were previously carried out by humans — in an attempt to boos...

16:53 · 14 mai 2026

OpenAI saksøkt for deling av personlig informasjon med Meta og Google

A new class action lawsuit accuses OpenAI of sharing data including user chat queries and personal identifying information like emails and user IDs wi...

Vitenskap

OpenAI forbyr AI-modell å snakke om goblins – her er grunnen

Hvorfor begynte AI-modellen å snakke om goblins?

Et eksempel på uforutsigbar AI-atferd

Trump krever kognitive tester for presidentkandidater – men hva med ha...

Chipotle snur salgstrenden – hva betyr det for lunsjen din?

Vitenskap

OpenAI forbyr AI-modell å snakke om goblins – her er grunnen

Hvorfor begynte AI-modellen å snakke om goblins?

Et eksempel på uforutsigbar AI-atferd

Trump krever kognitive tester for presidentkandidater – men hva med ha...

Chipotle snur salgstrenden – hva betyr det for lunsjen din?

Relaterte artikler

Meta-ansatte protesterer mot overvåkning av tastetrykk og skjermaktivitet

Kunstner lurer nettet: Virkelig Monet-maling utropt til AI-generert

AI hindrer kvalifiserte søkere fra å få jobbintervju – hva skjer når algoritmer avgjør skjebnen?

Kan AI føre til massearbeidsledighet og samfunnsopprør?

Elon Musk uteblir fra rettssak mot OpenAI – reiser til Kina midt i rettsoppgjør

Sam Altman utsatt for hardhendt granskning i rettssak mot Elon Musk

Microsoft-forskere avdekker: AI-modeller feiler på kritiske arbeidsoppgaver

OpenAI saksøkt for deling av personlig informasjon med Meta og Google