צ'אטGPT של OpenAI נאלצה להילחם בהתמכרות לגובלינים

בינה מלאכותית OpenAI צ'אטGPT סם אלטמן גובלינים מודל שפה

חברת OpenAI הודתה כי נאלצה להוסיף הוראה מיוחדת בקוד של המודל האחרון של צ'אטGPT כדי למנוע ממנו להתייחס שוב ושוב ל'גובלינים, גרגולים ויצורים דמיוניים אחרים'.

במסגרת הסבר שפורסם ביום רביעי, החברה ציינה כי ההתנהגות המוזרה נובעת מתכונת האישיות של הבינה המלאכותית – בעיקר בקרב משתמשים שביקשו אישיות 'אנרגטית'. על פי OpenAI, אישיות זו מקבלת את ההוראה הבאה מהמערכת:

אתה מנטור AI אנרגטי, משחקי וחכם לאדם. אתה נלהב לקידום אמת, ידע, פילוסופיה, שיטת המדע וחשיבה ביקורתית. [...] עליך להפחית יומרה באמצעות שימוש משעשע בשפה. העולם מורכב ומשונה, ויש להכיר, לנתח וליהנות ממנו. התמודד עם נושאים כבדים מבלי ליפול למלכודת של רצינות עצמית. [...]

לדברי החברה, התופעה התגלתה לראשונה בנובמבר האחרון, ומשתמשים דיווחו על עלייה בהתייחסויות לגובלינים גם בגרסאות חדשות יותר של המודל, מעבר לאישיות ה'אנרגטית'. בין הציטוטים שדווחו:

"גובלין קטן ומרושע"
"כי התנורים הם גובלינים קטנים ומזוהמים"
"גובלין דינמי קטן ואכזרי"
"יצור דיגיטלי טרגי של ביצה שחורה"

באמצעות 'למידה מחוזקת', שבה הבינה המלאכותית לומדת אילו תגובות מדורגות גבוה על ידי מעריכים אנושיים באשר לאיכותן ודיוקן, התגובות ה'משעשעות' זכו לביצועים טובים יותר.

כפי שדווח לראשונה על ידי Wired ביום שלישי, המודל האחרון של צ'אטGPT, שיצא לפני שבוע, כלל הוראה חדשה: לעולם לא לדבר על גובלינים, גרגולים, דביבונים, טרולים, עוגים, יונים או יצורים אחרים אלא אם כן הדבר רלוונטי לחלוטין וחד משמעי לבקשת המשתמש.

OpenAI לא הגיבה מיד לבקשת התגובה של Wired, אך באותו יום פרסם סם אלטמן פוסט ממומן ברשת X, בו התבדח כי הגרסה הבאה, GPT-6, תכלול 'גובלינים נוספים'.

לאחר שהחברה הסבירה את תהליך הפתרון וכיצד הטמיעה הוראה זו כדי להפחית את ההתייחסויות ליצורים דמיוניים, היא ציינה במסגרת הפוסט שלה מיום רביעי כי 'לקחת את הזמן להבין מדוע מודל מתנהג באופן מוזר ולפתח דרכים לחקור דפוסים אלו במהירות היא יכולת חשובה עבור צוות המחקר שלנו'.

ההסבר עשוי להזכיר את המקרה של הבינה המלאכותית Grok של אלון מאסק, שחזרה שוב ושוב על הביטוי 'רצח עם של לבנים' בדרום אפריקה. אף ש-xAI טענה כי התגובות נבעו מ'שינוי לא מורשה' של עובד, מודלי צ'אט לא אמורים להיות כל כך קלים למניפולציה אם אבטחת המשתמשים הייתה באמת בראש סדר העדיפויות.

למרות זאת, החברה ממשיכה לקדם הקלות ברגולציה על מוצרייה, במקביל להכרה כי היא עדיין לומדת כיצד מודלי הצ'אט שלה פועלים. כפי שכתבתי ביום שני, סם אלטמן ו-OpenAI ניקו לאחרונה את ידיהם מההשפעות המזיקות הנוכחיות של מוצרי החברה והדגימו זלזול ברור בפוטנציאל ההשפעות השליליות לטווח ארוך.

מקור: Mother Jones

← הקודם

מדריך לדיג ב-Diablo 4: איך לפתוח, למה זה שווה ואיך להשיג פרסים

הפער בנישואין: אי השוויון הנסתר ביותר בארה"ב

21:41 · 14 מאי 2026

סאם אלטמן ניצב במבחן האמינות: מה נחשף במשפט מול אילון מאסק?

Can you trust Sam Altman? That was one of the central themes at the high-profile trial between the OpenAI CEO and Elon Musk in California this week, a...

21:20 · 14 מאי 2026

חושף בקה"א: לחץ פוליטי שינה את מסקנות המקור של הקורונה?

Robby Soave and Christian Britschgi dive right in to the latest news: A CIA whistleblower is alleging that his agency revised its assessment of COVID-...

19:13 · 14 מאי 2026

הפוליטיקה של שגשוג ללא תעסוקה בעידן הבינה המלאכותית

A very interesting article by my Hoover Institution Andy Hall (who is also at the Stanford Graduate School of Business); here's the Introduction, thou...

15:00 · 14 מאי 2026

אמריקאים נגד מרכזי נתונים: 7 מתוך 10 מתנגדים להקמתם בשכונתם

A new Gallup poll has found that most Americans would really prefer not to live next door to a data center. For the first time, the polling organizati...

12:01 · 14 מאי 2026

תביעה נגד גוגל: בינה מלאכותית יצרה האשמות שווא בפשע מין נגד אזרח יוטה

From a Complaint in Murray v. Alphabet, Inc., just removed yesterday to federal court, one of the sets of screenshots that the plaintiff says were hal...

10:00 · 14 מאי 2026

ענקיות הבינה המלאכותית מזהירות מפני אסון – וזה גם מכירה עצמית?

Axios, whose reporting is increasingly defined by minuscule “scoops” about the artificial intelligence industry, reported last week on the latest red...

15:20 · 13 מאי 2026

רשת סלולר חדשה מציעה פתרון חופשי לשוק: סינון תכנים ללא פורנוגרפיה, להט"ב וחינוך מיני

No porn. No sex ed. No queer content. That's the promise of Radiant Mobile, a new cellphone network that launched this month. And I'm so into it. Not...

10:00 · 13 מאי 2026

וידוֹאֵי ביי: הסדרה החדשה שממזגת אימה והומור בצורה מפתיעה

In spring 2025, OpenAI rolled out an update of ChatGPT that featured a new image generator. The update proved wildly popular in large part due to how...

פוליטיקה

צ'אטGPT של OpenAI נאלצה להילחם בהתמכרות לגובלינים בעקבות אישיות 'אנרגטית'