חברות טכנולוגיה שפשטו רגל מגלות דרך חדשה להפיק רווחים מהכישלון שלהן: מכירת נתוני העובדים שלהן – הודעות סלאק, מיילים וארכיוני קוד – לאימון מודלי בינה מלאכותית. על פי דיווחי פורבס, נוצר אקוסיסטם שלם של חברות המתמחות בהפיכת "שאריות דיגיטליות" אלו למקור הכנסה נוסף למייסדים.
הצורך בנתוני אימון איכותיים למודלי AI גדל, אך מקורות מידע נקיים הופכים לנדירים יותר בעקבות השימוש הנרחב בהם ברשת. נתוני סביבת עבודה דיגיטלית כמו סלאק הם בעלי ערך רב, שכן הם מאפשרים לפתח סביבות למידה מציאותיות עבור סוכני AI שיבצעו משימות תעסוקתיות. עלי אנסארי, מייסד חברת micro1, המספקת חברות מדומות לאימון סוכני AI, מסביר: "חברות מודל מבינות כי רעש בסביבות עבודה אמיתיות חיוני לבדיקת דיוק המודלים".
סביבות אלו מכונות "חדרי כושר למידה מחוזקת" (RL gyms), והן הופכות לתעשייה עצמאית. הביקוש כה גבוה עד שאנתרופיק שוקלת להשקיע מיליארד דולר בפיתוחן השנה, על פי דיווחי The Information. מספר סטארטאפים בתחום, בהם Prime Intellect ו-Fleet, מגיעים כבר להערכות שווי דומות.
מייסדי חברות שנסגרו נוטים לראות בעסקה זו הזדמנות להחזר חלקי של ההשקעה, ובמקביל צצו מתווכים שמקלים על העסקאות. חברת SimpleClosure, המתארת עצמה כ"טורבו-טקס לסגירת חברות", השיקה לאחרונה כלי בשם Asset Hub המאפשר לחברות גוססות למכור ארכיוני סלאק, מיילים וספריות קוד. לדברי מנכ"לית החברה, דורי יונה, החברה טיפלה ב-100 עסקאות מסוג זה בשנה האחרונה והחזירה למעלה ממיליון דולר למייסדי החברות הנסגרות.
עם זאת, העסקאות מעוררות מתחים מוסריים ופרטניים. האם מודל AI יכול ללמוד מהכישלונות של חברה שנסגרה? ומה בדבר הסיכונים האתיים והפרטניים הכרוכים במכירת נתוני עובדים?
"שאלות הפרטיות כאן הן משמעותיות ביותר. פרטיות העובדים נותרה דאגה מרכזית, במיוחד לאור התלות הגוברת בכלי תקשורת פנימיים כמו סלאק."
— מארק רוטנברג, מייסד מרכז המדיניות לאתיקה דיגיטלית ובינה מלאכותית
רוטנברג מוסיף: "מדובר בנתונים לא גנריים. אלו נתונים של אנשים מזוהים". מומחים מטילים ספק גם בטענות בדבר אנונימיזציה של הנתונים הנמכרים. "אם אנונימיזציה לא מבוצעת כראוי, קיים סיכון שחברות שירכשו את הנתונים יוכלו לזהות את העובדים המקוריים".