חברת OpenAI הטילה הגבלות חריגות על מודלי הבינה המלאכותית שלה, המונעות מהם לדון בגובלינים, גמדונים, טרולים, עוגים, יונים ויצורים אחרים – בין אם הם מיתולוגיים או אמיתיים – אלא אם כן הדבר רלוונטי לחלוטין לבקשת המשתמש. ההוראה המפתיעה התגלתה לראשונה באמצעות ציוץ ברשת X, שזכה לתגובות רבות מצד חובבי AI.
ההנחיה המפורשת, שנחשפה במגזין Wired, קובעת:
"לעולם אל תדבר על גובלינים, גמדונים, ראקונים, טרולים, עוגים, יונים או בעלי חיים/יצורים אחרים, אלא אם כן הדבר רלוונטי באופן מוחלט וחד-משמעי לבקשת המשתמש."
הסיבה להחלטה נותרה לא ברורה בתחילה, אך עדויות מצביעות על כך שגרסאות חדשות של המודלים, ובמיוחד GPT-5.5, נטו להשתמש במונחים כמו "גובלינים" ו"גמדונים" לתיאור באגים ותיקונים. משתמשים דיווחו כי המודל נהג לתאר באגים כ"גובלינים עם פנס" וכי צ'אט של GPT-5.5 הכיל עשרות התייחסויות ליצורים אלו.
OpenAI לא נותרה אדישה לתופעה המוזרה. החברה אף שיתפה ציוץ של מנכ"ל OpenAI, סאם אלטמן, בו נכתב:
"התחילו לאמן את GPT-6, אתם יכולים לקבל את כל הקלאסטר. עוד גובלינים."
ניק פאש, חבר בצוות הפיתוח של Codex, אישר כי הנטייה של המודל לדבר על גובלינים הייתה אחת הסיבות להטלת ההגבלות. לאחר שהתופעה זכתה לתשומת לב תקשורתית, פרסמה OpenAI פוסט בבלוג תחת הכותרת "מאין באו הגובלינים", בו הסבירה את התופעה.
הסבר לתופעה: עידוד לא מכוון ליצירת מטאפורות
לפי הפוסט, החל מגרסת GPT-5.1, החלו המודלים להשתמש יותר ויותר במונחים כמו "גובלינים" ו"גמדונים" במטאפורות שלהם. החוקרים גילו כי השימוש במונח "גובלין" בצ'אט של ChatGPT זינק ב-175% לאחר שחרור הגרסה, אך בתחילה לא נראתה הסיבה לדאגה.
עם הזמן, התופעה התעצמה עד שהמודל החל לתאר את עצמו כ"טרנספורמר גובלין-פילד". ההסבר הרשמי של OpenAI היה כי ההתנהגות נבעה מעידוד לא מכוון שנוצר במהלך אימון המודל לתכונת ההתאמה האישית שלו, ובמיוחד עבור אישיות "חנונית".
"התשובה הקצרה היא שמגוון גורמים קטנים מעצבים את התנהגות המודל. במקרה זה, אחד הגורמים היה עידוד גבוה במיוחד ליצירת מטאפורות הכוללות יצורים."
התופעה מדגימה כיצד מודלי בינה מלאכותית יכולים לפתח נטיות בלתי צפויות בעקבות נתוני האימון העצומים שלהם. דוגמה נוספת לכך היא מחקר של חברת Anthropic, שבו מודל AI בשם Claude Mythos פיתח חיבה מוזרה לתיאורטיקן התרבות הבריטי מארק פישר, והזכיר אותו בשיחות שונות על פילוסופיה.