OpenAI interdit les gobelins dans GPT-5.5 : pourquoi cette restriction ?

intelligence artificielle OpenAI GPT-5.5 Codex CLI biais des modèles goblin modération IA prompt engineering

Une restriction inhabituelle dans les instructions de GPT-5.5

OpenAI a récemment ajouté une consigne pour le moins surprenante dans le système de prompts de son modèle GPT-5.5, intégré à Codex CLI. Le géant de l'IA demande explicitement à son modèle de ne jamais évoquer les gobelins, gremlins, trolls, ogres, pigeons ou autres animaux et créatures, sauf si la demande de l'utilisateur le rend absolument indispensable.

Une mise à jour rendue publique sur GitHub

Cette directive, intégrée dans un ensemble de plus de 3 500 mots d'instructions de base, a été dévoilée la semaine dernière via une mise à jour open source du Codex CLI publiée sur GitHub. Elle s'ajoute à d'autres restrictions plus classiques, comme l'interdiction d'utiliser des emojis ou des tirets cadratins sans instruction explicite, ou encore l'interdiction d'exécuter des commandes destructrices comme git reset --hard sans validation claire de l'utilisateur.

Un problème spécifique à la dernière version du modèle

Contrairement aux instructions des versions antérieures du modèle, cette interdiction ciblée contre les gobelins et autres créatures n'apparaît pas dans les fichiers de configuration des anciennes versions. Cela suggère qu'OpenAI fait face à un nouveau défi avec GPT-5.5, où le modèle aurait tendance à aborder ces sujets de manière inappropriée, même dans des contextes totalement déconnectés.

Des retours d'utilisateurs confirmant le phénomène

Sur les réseaux sociaux, plusieurs utilisateurs ont partagé des exemples où GPT-5.5 s'égarait dans des discussions sans lien avec les gobelins ou les créatures fantastiques, évoquant ces thèmes de manière récurrente et parfois intrusive. Ces témoignages, bien que anecdotiques, semblent corroborer l'hypothèse d'un biais introduit dans la dernière version du modèle.

Pourquoi une telle restriction ?

Les raisons exactes de cette interdiction ne sont pas officiellement détaillées par OpenAI. Plusieurs hypothèses peuvent être avancées :

Un biais de réponse dans le modèle, entraînant des associations involontaires avec des thèmes fantastiques.
Une stratégie de modération renforcée pour éviter les dérives dans les conversations.
Un test de robustesse du système avant un déploiement plus large.

Implications pour les développeurs et utilisateurs

Cette restriction pourrait avoir des conséquences pratiques pour les développeurs utilisant Codex CLI dans leurs projets. Les utilisateurs devront désormais être plus précis dans leurs requêtes pour obtenir des réponses adaptées, sans risque de voir le modèle s'écarter du sujet principal. Par ailleurs, cette mesure illustre les défis persistants liés à la gestion des biais dans les modèles de langage, même pour un acteur comme OpenAI.

Source : Ars Technica

← Précédent

Steak ‘n Shake réduit de 50 % ses frais de paiement grâce au Bitcoin e...

Les prêts garantis par Bitcoin ouvrent la porte à la propriété immobilière pour une nouvelle génération

22:25 · 15 mai 2026

YouTube étend son outil de détection des deepfakes à tous ses utilisateurs adultes

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 mai 2026

Le règlement de 1,5 milliard de dollars d'Anthropic sur les droits d'auteur bloqué par un juge fédéral

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 mai 2026

ArXiv interdit aux chercheurs publiant des articles générés par IA sans vérification

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 mai 2026

arXiv interdit les soumissions contenant des hallucinations générées par IA

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 mai 2026

OpenAI réorganise ses dirigeants pour dominer la course aux agents IA

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 mai 2026

OpenAI envisage des poursuites contre Apple pour son intégration décevante de ChatGPT

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

17:09 · 15 mai 2026

Des DJ IA à l'antenne : quand l'IA échoue à gérer seule une station radio

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 mai 2026

Google renforce ses règles anti-spam pour lutter contre la manipulation de l’IA dans les résultats

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

Technologie

OpenAI interdit formellement les gobelins dans les réponses de son modèle GPT-5.5

Une restriction inhabituelle dans les instructions de GPT-5.5

Une mise à jour rendue publique sur GitHub

Un problème spécifique à la dernière version du modèle

Des retours d'utilisateurs confirmant le phénomène

Pourquoi une telle restriction ?

Implications pour les développeurs et utilisateurs

Steak ‘n Shake réduit de 50 % ses frais de paiement grâce au Bitcoin e...

Les prêts garantis par Bitcoin ouvrent la porte à la propriété immobil...

Technologie

OpenAI interdit formellement les gobelins dans les réponses de son modèle GPT-5.5

Une restriction inhabituelle dans les instructions de GPT-5.5

Une mise à jour rendue publique sur GitHub

Un problème spécifique à la dernière version du modèle

Des retours d'utilisateurs confirmant le phénomène

Pourquoi une telle restriction ?

Implications pour les développeurs et utilisateurs

Steak ‘n Shake réduit de 50 % ses frais de paiement grâce au Bitcoin e...

Les prêts garantis par Bitcoin ouvrent la porte à la propriété immobil...

Articles connexes

YouTube étend son outil de détection des deepfakes à tous ses utilisateurs adultes

Le règlement de 1,5 milliard de dollars d'Anthropic sur les droits d'auteur bloqué par un juge fédéral

ArXiv interdit aux chercheurs publiant des articles générés par IA sans vérification

arXiv interdit les soumissions contenant des hallucinations générées par IA

OpenAI réorganise ses dirigeants pour dominer la course aux agents IA

OpenAI envisage des poursuites contre Apple pour son intégration décevante de ChatGPT

Des DJ IA à l'antenne : quand l'IA échoue à gérer seule une station radio

Google renforce ses règles anti-spam pour lutter contre la manipulation de l’IA dans les résultats