Une restriction inhabituelle dans les instructions de GPT-5.5
OpenAI a récemment ajouté une consigne pour le moins surprenante dans le système de prompts de son modèle GPT-5.5, intégré à Codex CLI. Le géant de l'IA demande explicitement à son modèle de ne jamais évoquer les gobelins, gremlins, trolls, ogres, pigeons ou autres animaux et créatures, sauf si la demande de l'utilisateur le rend absolument indispensable.
Une mise à jour rendue publique sur GitHub
Cette directive, intégrée dans un ensemble de plus de 3 500 mots d'instructions de base, a été dévoilée la semaine dernière via une mise à jour open source du Codex CLI publiée sur GitHub. Elle s'ajoute à d'autres restrictions plus classiques, comme l'interdiction d'utiliser des emojis ou des tirets cadratins sans instruction explicite, ou encore l'interdiction d'exécuter des commandes destructrices comme git reset --hard sans validation claire de l'utilisateur.
Un problème spécifique à la dernière version du modèle
Contrairement aux instructions des versions antérieures du modèle, cette interdiction ciblée contre les gobelins et autres créatures n'apparaît pas dans les fichiers de configuration des anciennes versions. Cela suggère qu'OpenAI fait face à un nouveau défi avec GPT-5.5, où le modèle aurait tendance à aborder ces sujets de manière inappropriée, même dans des contextes totalement déconnectés.
Des retours d'utilisateurs confirmant le phénomène
Sur les réseaux sociaux, plusieurs utilisateurs ont partagé des exemples où GPT-5.5 s'égarait dans des discussions sans lien avec les gobelins ou les créatures fantastiques, évoquant ces thèmes de manière récurrente et parfois intrusive. Ces témoignages, bien que anecdotiques, semblent corroborer l'hypothèse d'un biais introduit dans la dernière version du modèle.
Pourquoi une telle restriction ?
Les raisons exactes de cette interdiction ne sont pas officiellement détaillées par OpenAI. Plusieurs hypothèses peuvent être avancées :
- Un biais de réponse dans le modèle, entraînant des associations involontaires avec des thèmes fantastiques.
- Une stratégie de modération renforcée pour éviter les dérives dans les conversations.
- Un test de robustesse du système avant un déploiement plus large.
Implications pour les développeurs et utilisateurs
Cette restriction pourrait avoir des conséquences pratiques pour les développeurs utilisant Codex CLI dans leurs projets. Les utilisateurs devront désormais être plus précis dans leurs requêtes pour obtenir des réponses adaptées, sans risque de voir le modèle s'écarter du sujet principal. Par ailleurs, cette mesure illustre les défis persistants liés à la gestion des biais dans les modèles de langage, même pour un acteur comme OpenAI.