תפיסת האינטרנט על ידי הבינה המלאכותית: מה באמת קורה מאחורי הקלעים

מחקר חדש שפורסם לאחרונה על ידי צוות חוקרים מובילים מ-Stanford, Imperial College London ו-Internet Archive חושף תמונה מטרידה: מאז השקת ChatGPT בסוף 2022, כשליש מהאתרים החדשים באינטרנט נוצרים באמצעות בינה מלאכותית. הממצאים, שפורסמו במאמר בשם "The Impact of AI-Generated Text on the Internet", מצביעים על שינוי מהותי באופן שבו האינטרנט מתפתח – תוך זמן קצר יחסית.

החוקרים, בראשות חוקר הבינה המלאכותית יונאס דולז'אל מ-Stanford, בחנו את השפעת הטקסטים שנוצרו על ידי בינה מלאכותית על האינטרנט. הם גילו כי הטקסטים הללו הופכים את הרשת ליותר מרומזת ופחות מורכבת, תוך כדי שהם מעלים חששות מפני ירידה במגוון התוכן, הגברת הדיסאינפורמציה וסגנון כתיבה אחיד ומנוכר.

מתודולוגיה: איך נמדדה התופעה?

החוקרים השתמשו בנתונים מארכיון האינטרנט (Internet Archive) כדי לנתח אתרי אינטרנט שנוצרו בין אוגוסט 2022 למאי 2025. הם אספו דגימות מאתרים באמצעות ה-Wayback Machine, והפעילו עליהן כלי לזיהוי טקסטים שנוצרו על ידי בינה מלאכותית בשם Pangram v3, אשר נמצא כמדויק ביותר מבין הכלים שנבדקו.

לאחר זיהוי האתרים שנוצרו על ידי בינה מלאכותית, החוקרים בדקו שש השערות מרכזיות:

  • האם הבינה המלאכותית מצמצמת נקודות מבט?
  • האם היא מגבירה את הדיסאינפורמציה?
  • האם הטקסטים הופכים ליותר מרומזים ומרוממים?
  • האם הבינה המלאכותית מצטטת מקורות בצורה נאותה?
  • האם הטקסטים בעלי צפיפות סמנטית נמוכה?
  • האם היא יוצרת מונוקולטורה כתיבה, בה קולות ייחודיים נעלמים?

לצורך בדיקת ההשערות, החוקרים השתמשו בשיטות שונות: הם בדקו טענות עובדתיות באתריהם באמצעות בודקי עובדות אנושיים, בחנו האם האתרים מקשרים למקורות חיצוניים, וניתחו את סגנון הכתיבה לאורך זמן.

ממצאים מטרידים: מה באמת קורה ברשת?

המחקר חשף מספר תופעות מטרידות:

  • ירידה במגוון התוכן: הבינה המלאכותית נוטה לייצר תוכן דומה, מה שמצמצם את המגוון הסגנוני והענייני באינטרנט.
  • הגברת הדיסאינפורמציה: למרות שהבינה המלאכותית יכולה לייצר טקסטים נראים אמינים, היא עלולה ליצור גם מידע שגוי או מטעה.
  • סגנון כתיבה אחיד ומרומם: הטקסטים הופכים לפחות מורכבים ויותר מרומזים, מה שמקשה על הקוראים להבחין בין עובדות לדעות.
  • חוסר ציטוט מקורות: רבים מהאתרים שנוצרו על ידי בינה מלאכותית אינם מקשרים למקורותיהם, מה שמקשה על אימות המידע.
  • צפיפות סמנטית נמוכה: הטקסטים נוטים להיות פחות עשירים מבחינה עניינית, מה שמקשה על הקוראים להפיק מהם ערך.

"המהירות שבה הבינה המלאכותית תופסת את האינטרנט היא מדהימה", אמר דולז'אל בראיון ל-404 Media. "לאחר עשרות שנים שבהן בני אדם עיצבו את הרשת, חלק ניכר ממנה הפך מוגדר על ידי בינה מלאכותית תוך שלוש שנים בלבד. אנחנו עדים, לדעתי, לשינוי משמעותי בנוף הדיגיטלי – שינוי שמתרחש בקצב מהיר בהרבה מזה שבו נבנתה הרשת מלכתחילה."

השלכות עתידיות: מה צפוי לנו?

המחקר מעלה שאלות חשובות לגבי עתיד האינטרנט. אם המגמה הנוכחית תימשך, עלולים להיווצר מספר תרחישים:

  • ירידה באיכות המידע: הגברת הדיסאינפורמציה והחוסר בציטוט מקורות עלולים לפגוע באמינות האינטרנט כמקור מידע.
  • היעלמות קולות ייחודיים: אם הבינה המלאכותית תמשיך לייצר תוכן אחיד, קולות ייחודיים של יוצרים אנושיים עלולים להיעלם.
  • צורך ברגולציה: ייתכן שיהיה צורך בהטלת תקנות על השימוש בבינה מלאכותית ליצירת תוכן, כדי להבטיח שקיפות ואמינות.

החוקרים קוראים להמשך מחקר בתחום ולפיתוח כלים שיאפשרו לזהות ולהפחית את ההשפעות השליליות של הבינה המלאכותית על האינטרנט. הם מדגישים כי חשוב להבין את ההשלכות של הטכנולוגיה החדשה על החברה ועל הדרך שבה אנו צורכים מידע.

מקור: 404 Media