בינה מלאכותית במשימות עבודה: כשלים חמורים במערכות המובילות

חוקרי מיקרוסופט חשפו במחקר חדש כי מערכות בינה מלאכותית מתקדמות נכשלות באופן ניכר בביצוע משימות מורכבות בעולם התעסוקה. הממצאים, שטרם עברו ביקורת עמיתים, מצביעים על כשלים חמורים במערכות מובילות כמו GPT 5.4 של OpenAI, Claude Opus 4.6 של Anthropic ו-Gemini 3.1 Pro של גוגל.

במהלך בדיקת ביצועים במשימות מורכבות, מערכות אלו גרמו לשחיתות של עד 25% מהתוכן במסמכים. מערכות ישנות יותר נכשלו אף יותר. החוקרים הסיקו כי "המודלים אינם מוכנים להטמעה בעבודה בתחומי ידע רבים", מסקנה מפתיעה במיוחד לנוכח ההשקעות העצומות של מיקרוסופט בתחום הבינה המלאכותית והניסיונות להטמיע אותה במערכת ההפעלה Windows 11.

השקעות ענק מול כשלים חמורים

מיקרוסופט השקיעה מיליארדי דולרים בפיתוח בינה מלאכותית ומנסה להטמיע אותה בכל היבטי המערכת שלה. עם זאת, המחקר החדש מצביע על כך שמערכות אלו אינן מוכנות לשימוש עצמאי בעבודה. למרות הניסיונות להחליף עובדים אנושיים במערכות AI, המחקר מראה כי הסתמכות עיוורת על בינה מלאכותית עלולה להוביל לטעויות חמורות, מחיקת נתונים ועד לאובדן מידע קריטי.

חשוב לציין כי המחקר לא כלל בדיקה של מערכת Copilot של מיקרוסופט עצמה, מה שמעלה שאלות נוספות לגבי מוכנותה של החברה לאמץ את הטכנולוגיה באופן מלא.

"וורקסלופ": כשעובדים מטילים עבודה על AI, והיא חוזרת אליהם

המחקר מצטרף לגוף הולך וגדל של מחקרים על תופעה המכונה "וורקסלופ" (Workslop) – מצב שבו עובדים מטילים עבודה על מערכות בינה מלאכותית, אך התוצאות אינן מושלמות ודורשות תיקון נוסף על ידי עובדים אנושיים. מחקר של אוניברסיטת סטנפורד הראה כי תופעה זו גורמת לקרע בתוך חברות, כאשר עובדים מנסים להאיץ תהליכים באמצעות AI, אך בסופו של דבר יוצרים עומס נוסף על עמיתיהם.

"המודלים הנוכחיים אינם מוכנים להטמעה בעבודה עצמאית. הסתמכות עליהם ללא פיקוח אנושי עלולה להוביל לטעויות חמורות ולנזקים בלתי הפיכים."

השלכות על עולם התעסוקה

הממצאים מעלים שאלות קשות לגבי העתיד של הבינה המלאכותית בעולם התעסוקה. למרות הלחץ להחליף עובדים אנושיים במערכות AI, המחקר מראה כי המערכות הנוכחיות אינן מוכנות לקחת על עצמן משימות מורכבות ללא פיקוח אנושי. הדבר מעמיד בפני חברות כמו מיקרוסופט אתגר משמעותי: כיצד לאזן בין ההשקעות העצומות בתחום לבין הצורך להבטיח שהטכנולוגיה תהיה מוכנה לשימוש מעשי.

בעוד שמערכות בינה מלאכותית ממשיכות להתפתח בקצב מהיר, המחקר של מיקרוסופט מזכיר כי עדיין קיימים פערים משמעותיים בין יכולות המערכות לבין הצרכים האמיתיים של עולם התעסוקה.

מקור: Futurism