ChatGPT stoppede sine goblinsnakke med hemmelig kode

teknologi OpenAI ChatGPT Sam Altman goblins AI-personligheder AI-problemer Chatbot-fejl

OpenAI har indrømmet, at det måtte udvikle en særlig kodeinstruktion for at stoppe sin seneste ChatGPT-model fra at blive besat af goblins, gremlins og andre mystiske væsner. Virksomheden forklarede i et indlæg onsdag, at det underlige mønster stammede fra chatbotens 'Nerdy'-personlighed, som er designet til at være legende, filosofisk og vidensfokuseret.

Ifølge OpenAI modtager denne personlighed følgende instruktion fra systemet:

Du er en uforbeholdent nørdet, legende og vis AI-mentor for et menneske. Du er passioneret entusiastisk omkring at fremme sandhed, viden, filosofi, den videnskabelige metode og kritisk tænkning. [...] Du skal undergrave pretention gennem legende brug af sprog. Verden er kompleks og mærkelig, og dens mærkelighed skal anerkendes, analyseres og nydes. Tag fat på tunge emner uden at falde i fælden med selvhøjtidelighed. [...]

OpenAI opdagede først problemet i november sidste år. Brugere rapporterede, at referencerne til goblins blev hyppigere i nyere modeludgivelser, også uden for 'Nerdy'-personligheden. Nogle eksempler på de problematiske udsagn, som brugere delte, inkluderer:

"fornuftig lille goblin"
"fordi ovne er beskidte lille goblins."
"Brutal lille goblin af en dynamik"
"Tragisk lille digital sumpcreatur"

Gennem 'forstærkningslæring', hvor chatbotten tilpasser sine svar baseret på evalueringer fra menneskelige bedømmere, viste de legende svar sig at være mere populære blandt brugerne.

Som Wired rapporterede tirsdag, indeholdt den seneste ChatGPT-model, udgivet sidste uge, en ny instruktion: "Du må aldrig tale om goblins, gremlins, vaskebjørne, trolde, kæmper, duer eller andre dyr eller væsner, medmindre det er absolut og utvetydigt relevant for brugerens forespørgsel." OpenAI svarede ikke umiddelbart på Wired anmodning om kommentar, men samme dag delte Sam Altman en meme på X (tidligere Twitter), hvor han spøgefuldt skrev, at den kommende GPT-6 ville have "ekstra goblins".

Efter at have forklaret sin fejlretningsproces og implementeringen af den nye instruktion for at reducere goblin-relaterede udsagn, skrev OpenAI i sit onsdagsindlæg: "At tage sig tid til at forstå, hvorfor en model opfører sig på en mærkelig måde, og udvikle metoder til hurtigt at undersøge disse mønstre, er en vigtig evne for vores forskningsteam."

Forklaringen minder om tidligere problemer med Elon Musks Grok-chatbot, som gentagne gange nævnte 'hvidt folkemord' i Sydafrika. Selvom xAI hævdede, at Groks udsagn skyldtes en 'uautoriseret ændring' foretaget af en medarbejder, rejser sagen spørgsmål om, hvorvidt chatbot-modeller bør være så lette at manipulere, hvis brugersikkerhed virkelig er en prioritet.

På trods af disse udfordringer fortsætter OpenAI med at argumentere for mindre regulering af sine produkter, samtidig med at virksomheden indrømmer, at den stadig er i læreprocessen med at forstå, hvordan dens chatbot-modeller fungerer. Som tidligere rapporteret har Sam Altman og OpenAI offentligt distanceret sig fra de skadelige effekter, deres produkter allerede har haft på samfundet, og har vist en tydelig ligegyldighed over for de potentielle langsigtede konsekvenser.

Kilde: Mother Jones

← Forrige

Sådan fisker du i Diablo 4 – guide til nye sideaktivitet

Næste →

Ægteskabsgab: USA’s mest oversete ulighedsproblem

Relaterede artikler

07:01 · 16 maj 2026
Virginia bliver verdens datacenter-hovedstad – på bekostning af historien

Virginia might be for lovers, but more recently, it’s for data centers. The state has more data centers than anywhere in the world, and companies are...

19:36 · 15 maj 2026
Georgiens højesteret kritiserer statsadvokaten for AI-fejl i retsafgørelse

From Payne v. State, decided last week, in an opinion by Justice Benjamin Land: Hannah Payne was sentenced to life in prison plus 13 years for the mur...

21:41 · 14 maj 2026
Sam Altman under skarp kritik i retssal: Mistillid og magtkampe i OpenAI

Can you trust Sam Altman? That was one of the central themes at the high-profile trial between the OpenAI CEO and Elon Musk in California this week, a...

21:20 · 14 maj 2026
CIA-whistleblower afslører: USA’s sundhedsmyndigheder pressede på for at skjule COVID-19’s oprindelse

Robby Soave and Christian Britschgi dive right in to the latest news: A CIA whistleblower is alleging that his agency revised its assessment of COVID-...

19:13 · 14 maj 2026
AI’s jobskabelse: Hvem får del i fremtidens velstand?

A very interesting article by my Hoover Institution Andy Hall (who is also at the Stanford Graduate School of Business); here's the Introduction, thou...

15:00 · 14 maj 2026
Danskerne siger nej tak til datacentre i lokalområdet

A new Gallup poll has found that most Americans would really prefer not to live next door to a data center. For the first time, the polling organizati...

12:01 · 14 maj 2026
Googles AI-genererede oversigt anklager uskyldig mand for seksforbrydelse

From a Complaint in Murray v. Alphabet, Inc., just removed yesterday to federal court, one of the sets of screenshots that the plaintiff says were hal...

10:00 · 14 maj 2026
AI-virksomhedernes varsler om undergang er også en salgsstrategi

Axios, whose reporting is increasingly defined by minuscule “scoops” about the artificial intelligence industry, reported last week on the latest red...

Politik

ChatGPT udviklede hemmelig kode for at stoppe sine goblinsnakke

Sådan fisker du i Diablo 4 – guide til nye sideaktivitet

Ægteskabsgab: USA’s mest oversete ulighedsproblem