אקסיוס פרסמה תיקון מביך: הסקר שלה התבסס על נתונים שנוצרו על ידי בינה מלאכותית

בחודש שעבר נאלצה חברת החדשות אקסיוס לפרסם תיקון חריג לבלוג שלה שעסק במשבר הבריאות האמהית בארצות הברית. הכתבה ציטטה ממצאים חדשים של חברת Aaru, והציגה אותם כנתוני סקר המבוססים על תשובות של מבוגרים אמריקאים. אלא שהתיקון חשף כי הנתונים לא נאספו כלל מאנשים אמיתיים, אלא נוצרו על ידי מודל שפה גדול. למעשה, מדובר ב"סימולציה" של תשובות אנושיות – שיטה המכונה "סיליקון סמפלינג".

מהו "סיליקון סמפלינג" ולמה הוא מסוכן?

השיטה החדשה מאפשרת לחברות סקרים ליצור תשובות מדומות באמצעות בינה מלאכותית, במקום לאסוף נתונים מאנשים אמיתיים. היתרון לכאורה: עלות נמוכה ומהירות גבוהה. אך מומחים מזהירים כי השיטה פוגעת באמינות הסקרים ומערערת את אמון הציבור במידע.

"הנתונים בעלי ערך רק אם הם מסכמים את האמונות והדעות של בני אדם אמיתיים. שימוש בסימולציות במקום במציאות רק יחמיר את משבר המידע ויגביר את חוסר האמון", כתבו לייף וות'רבי, מנהל מעבדת Digital Theory Lab, ובנג'מין רכט, פרופסור למדעי המחשב באוניברסיטת קליפורניה בברקלי, במאמר אורח בניו יורק טיימס.

הסכנות הטמונות בשיטה

סקרי דעת קהל מסתמכים לרוב על מודלים סטטיסטיים כדי לפצות על מספר מצומצם של משיבים. אך יצירת תשובות בדרך מלאכותית היא אלטרנטיבה גרועה, שעלולה להכניס הטיות ולהשפיע על דעת הקהל עצמה במקום לדווח עליה.

מחקר שנערך ב-2025 על ידי חוקרים מאוניברסיטת נורת'איסטרן גילה כי "סיליקון סמפלינג" אינו מהימן כתחליף לבני אדם, במיוחד בנושאים מדיניים. "המודלים מתקשים ללכוד דעות מורכבות ונוטים לסטריאוטיפים בשל הטיות בנתוני האימון ומנגנוני הבטיחות הפנימיים", נכתב במחקר.

מחקר נוסף, שעדיין לא עבר ביקורת עמיתים, מצא כי יצירת "סיליקון סמפלינג" כרוכה ב"החלטות אנליטיות רבות" שיכולות להשפיע באופן משמעותי על איכות הנתונים. גם החלטות מעטות בלבד יכולות לשנות באופן דרמטי את ההתאמה בין הסימפולים הסינתטיים לנתונים אנושיים.

האם יש פתרון?

המומחים ממליצים על גישה היברידית: שימוש בבינה מלאכותית לשיפור עיצוב המחקר, אך שמירה על דגימות אנושיות כסטנדרט הזהב לנתונים. למרות החששות הרבים, חברות כמו Aaru ממשיכות להשתמש בשיטה, ומסכנות את אמינות הסקרים בעידן שבו אמון הציבור במידע נמצא במשבר.

מקור: Futurism