OpenAI מסבירה מדוע הדגמים שלה נמנעים מלדבר על גובלינים

בינה מלאכותית חדשות טכנולוגיה OpenAI GPT-5.5 מודלי שפה גובלינים

OpenAI חשפה לאחרונה תופעה מוזרה שבה הדגמים שלה, ובמיוחד גרסאות מתקדמות של GPT, נמנעים מלדבר על גובלינים, טרולים, שדונים, בעלי חיים ויצורים אחרים. הדבר התגלה לראשונה בדו"ח של Wired, שחשף הוראות פנימיות שניתנו למודלים של החברה להימנע מלהתייחס ליצורים אלו.

בחברה הסבירו כי מדובר ב"הרגל מוזר" שהתפתח במהלך תהליך האימון של המודלים. הבעיה החלה להתבלט לראשונה בגרסת GPT-5.1, בעיקר כאשר המשתמשים בחרו באפשרות "אישיות מלומדת". לדברי OpenAI, התופעה החמירה עם עדכוני המודלים הבאים, עד שהחברה נאלצה להתייחס אליה באופן רשמי.

בחברה הדגישו כי אין מדובר בהחלטה מכוונת או בצנזורה מכוונת, אלא בתוצאה לא צפויה של תהליכי למידה עמוקה. המודלים, שלמדו מטקסטים רבים ברשת, פיתחו באופן עצמאי אסוציאציות מסוימות ליצורים אלו, מה שהוביל להימנעות מהם בשיחות.

OpenAI ציינה כי היא עובדת על פתרון לבעיה, אך הדגישה כי מדובר באתגר מורכב בשל אופיים הלא צפוי של מודלי שפה גדולים. החברה הבטיחה להמשיך ולחקור את התופעה כדי להבטיח שהדגמים שלה יפעלו באופן הטבעי ביותר האפשרי.

מקור: The Verge

← הקודם

סת' מאיירס: ההומור הערמומי של המלך צ'ארלס עבר מעל ראשו של טראמפ – 'כמו...

מחשבי קומודור 64 וספקטרום הפכו למכשירי גיימינג רטרו-פוטוריסטיים ניידים

22:25 · 15 מאי 2026

יוטיוב מרחיבה כלי זיהוי דיפייק AI לכל משתמשי האתר הבוגרים

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 מאי 2026

הסכם זכויות היוצרים של Anthropic בסכום 1.5 מיליארד דולר נתקל בקשיים בעקבות עיכוב של שופטת

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 מאי 2026

ArXiv מטיל איסור על חוקרים המעלים מאמרים מלאי 'AI slop'

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 מאי 2026

שרת המאמרים המדעיים arXiv תאסור הגשות של תוכן מלאכותי שגוי

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 מאי 2026

OpenAI מבצעת שינויים ארגוניים נוספים בניסיון להאיץ את פיתוח סוכני הבינה המלאכותית

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 מאי 2026

OpenAI מאוכזבת מהשילוב הגרוע של ChatGPT באפל – שוקלת צעדים משפטיים

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

17:09 · 15 מאי 2026

תחנות רדיו בינה מלאכותית נכשלו – והראו מדוע אי אפשר לסמוך על AI לבדו

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 מאי 2026

גוגל מעדכנת את כללי הספאם: ניסיונות להשפיע על תוצאות הבינה המלאכותית ייחשבו כספאם

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

טכנולוגיה