OpenAI e il problema dei goblins: perché i suoi modelli AI evitano certe creature

OpenAI ha recentemente affrontato una questione insolita legata ai suoi modelli di intelligenza artificiale: l’evitamento di termini come goblins, gremlins, raccoons, trolls, ogres, pigeons e altre creature fantastiche o animali. La notizia è emersa dopo un report di Wired, che ha rivelato istruzioni interne ai modelli di codifica dell’azienda per non menzionare queste entità.

In risposta, OpenAI ha pubblicato una spiegazione sul proprio sito ufficiale, definendo questa tendenza una “strana abitudine” sviluppata durante l’addestramento dei modelli. Secondo la società, il fenomeno è stato osservato per la prima volta con il modello GPT-5.1, soprattutto quando veniva selezionata l’opzione di personalità “Nerdy”.

La tendenza si è poi accentuata con gli aggiornamenti successivi dei modelli, portando OpenAI a indagare sulle cause. L’azienda ha sottolineato che si tratta di un effetto collaterale dell’addestramento, in cui i dati utilizzati per l’apprendimento includono riferimenti a queste creature in contesti negativi o fuorvianti, spingendo i modelli a evitarle del tutto.

In un post sul blog ufficiale, OpenAI ha spiegato che i modelli di intelligenza artificiale apprendono non solo dai dati testuali, ma anche dai pattern di associazione che emergono durante l’addestramento. In alcuni casi, queste creature vengono menzionate in contesti umoristici, satirici o addirittura offensivi, portando i modelli a sviluppare una sorta di “fobia algoritmica” nei loro confronti.

La società ha rassicurato gli utenti che sta lavorando per risolvere il problema, sottolineando che si tratta di un fenomeno limitato a specifiche configurazioni e personalità dei modelli. Tuttavia, l’episodio solleva interrogativi più ampi sull’etica dell’addestramento dei modelli di AI e su come i dati utilizzati possano influenzare il comportamento degli algoritmi.

«I nostri modelli apprendono dai dati che ricevono, e in alcuni casi, queste creature vengono associate a contesti che non riflettono la realtà. Stiamo lavorando per migliorare la qualità dei dati e ridurre questi effetti indesiderati.»
— Dichiarazione di OpenAI

Il dibattito su come gestire questi “effetti collaterali” dell’intelligenza artificiale è in continua evoluzione. Mentre alcune aziende cercano di filtrare i contenuti in modo più rigoroso, altre puntano a una maggiore trasparenza, come nel caso di OpenAI. La questione rimane aperta: fino a che punto i modelli di AI possono essere “addestrati” per evitare bias o associazioni indesiderate?

Fonte: The Verge

← Precedente

Seth Meyers: Trump non ha capito l'umorismo intelligente di Re Carlo I...

Commodore 64 e ZX Spectrum diventano console portatili retrò-futuristiche

12:00 · 16 maggio 2026

I migliori laptop per ogni esigenza: guida all'acquisto 2026

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

22:25 · 15 maggio 2026

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maggio 2026

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maggio 2026

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maggio 2026

arXiv vieta la pubblicazione di contenuti generati da AI con errori

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maggio 2026

OpenAI riorganizza la leadership per accelerare lo sviluppo degli agenti AI

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 maggio 2026

OpenAI minaccia azioni legali contro Apple per l’integrazione deludente di ChatGPT

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

17:09 · 15 maggio 2026

AI alla conduzione radiofonica: quando l’automazione si rivela un disastro

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

Tecnologia

OpenAI ammette: i suoi modelli AI evitano di parlare di goblins e creature fantastiche

Seth Meyers: Trump non ha capito l'umorismo intelligente di Re Carlo I...

Commodore 64 e ZX Spectrum diventano console portatili retrò-futuristi...

Tecnologia

OpenAI ammette: i suoi modelli AI evitano di parlare di goblins e creature fantastiche

Seth Meyers: Trump non ha capito l'umorismo intelligente di Re Carlo I...

Commodore 64 e ZX Spectrum diventano console portatili retrò-futuristi...

Articoli correlati

I migliori laptop per ogni esigenza: guida all'acquisto 2026

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo

arXiv vieta la pubblicazione di contenuti generati da AI con errori

OpenAI riorganizza la leadership per accelerare lo sviluppo degli agenti AI

OpenAI minaccia azioni legali contro Apple per l’integrazione deludente di ChatGPT

AI alla conduzione radiofonica: quando l’automazione si rivela un disastro