צ'אטGPT, המודל הלשוני המוביל מבית OpenAI, ידוע בהתנהגויות יוצאות דופן בשפה האנגלית. אך מסתבר שגם בשפה הסינית, שבה מדברים למעלה ממיליארד בני אדם ברחבי העולם, הוא מציג התנהגויות שגורמות למשתמשים המקומיים להרים גבה. דיווח מיוחד שפורסם בוויירד חושף כיצד צ'אטGPT נוקט בביטויים חוזרים ונשנים, שלעיתים נתפסים כמוזרים או אף מעצבנים על ידי דוברי סינית.
הביטויים שמטרידים את המשתמשים הסינים
אחד הביטויים החוזרים של צ'אטGPT בסינית הוא "我会稳稳地接住你", שמשמעותו המילולית היא "אחזק אותך באופן יציב". הביטוי, שיכול להיתרגם גם ל"אחזק אותך לאורך כל הדרך" או "אני כאן בשבילך בכל מצב", נתפס על ידי חלק מהמשתמשים כרגשני או לא טבעי. אחרים מציינים כי הוא מזכיר את סיסמת הפרסום של פינדואודו, פלטפורמת המסחר האלקטרוני הסינית, "砍一刀" ("חתוך פעם אחת" או "הנחה"), אשר אף היא מופיעה לעיתים בתגובותיו של המודל.
תופעות אלו הפכו כה נפוצות עד שהן הפכו למם אינטרנטי בקרב גולשים סינים. חלק מהמשתמשים אף מדמים את צ'אטGPT לכרית אוויר ענקית שתפקידתה ללכוד אותם בנפילה – בדיוק כמו הביטוי "אחזק אותך באופן יציב".
מקור הבעיה: אימון מוטה של מודלי שפה
לפי הדיווח בוויירד, הבעיה עשויה לנבוע מתופעה המכונה "קריסה של מצב" (mode collapse), אשר נגרמת כתוצאה מאימון מוטה של מודלי שפה גדולים. כאשר אנשים מאמנים את המודלים, הם נוטים להעדיף ביטויים מוכרים ומועדפים על פני ביטויים יוצאי דופן או פחות שכיחים. כתוצאה מכך, המודל מאמץ את הביטויים הללו כחלק מהתגובות האופייניות שלו, גם אם הם אינם מתאימים בהקשר מסוים.
Max Spero, מייסד ומנכ"ל חברת Pangram, העוסקת בזיהוי טקסטים שנוצרו על ידי בינה מלאכותית, הסביר לוויירד: "אנחנו לא יודעים להגיד: 'זהו טקסט טוב, אבל אם נעשה את זה עשר פעמים, הוא כבר לא יהיה טוב'." כלומר, המודל מתקשה להבין מתי שימוש חוזר בביטוי הופך אותו ללא טבעי או מעצבן.
האם יש פתרון לבעיה?
למרות שהבעיה מוכרת, קשה מאוד לתקנה לאחר שהמודל כבר אומן. מפתחי הבינה המלאכותית יכולים להדריך את המודל להשתמש בביטויים מסוימים במצבים מסוימים, אך קשה יותר לאלץ אותו "לשכוח" ביטויים שכבר נקלטו. בנוסף, קשה לאזן בין הצורך בשימוש בביטויים מוכרים לבין הצורך במגוון ובטבעיות של התגובות.
למרות הביקורת, ישנה נקודה אחת שבה דוברי אנגלית וסינית יכולים להסכים: שנאתם המשותפת לביטויים המוזרים והלא טבעיים של צ'אטGPT.