מחקר חדש של חברת Graphite חושף כי שיעור המאמרים המקוונים שנוצרו בעיקר על ידי בינה מלאכותית (AI) הגיע למגבלה של כ-50% מכלל המאמרים החדשים, ומאז תחילת 2025 הוא כמעט ולא גדל. ממצאים אלה סותרים את החששות מפני הצפת הרשת בתוכן ממוחשב.

הנתונים המרכזיים

על פי הניתוח של Graphite, שיעור המאמרים שנוצרו בעיקר על ידי AI עלה מ-35.9% בשנתיים הראשונות לאחר השקת ChatGPT בנובמבר 2022, ל-48% בשנת 2024. אולם מאז תחילת 2025, השיעור נשאר יציב סביב 50% מכלל המאמרים החדשים שנוצרו ברשת.

המחקר התבסס על דגימה אקראית של 55,400 כתובות URL בשפה האנגלית מארכיון Common Crawl, שכלל מאמרים ומקטעי רשימות שפורסמו בין ינואר 2020 למרץ 2026. כל המאמרים שנבדקו היו באורך של לפחות 100 מילים ונבדקו באמצעות שלושה כלים לזיהוי תוכן AI: Pangram, GPTZero ו-Copyleaks.

הסיבות למגבלה

חוקרים מזהירים כי אם מודלי AI יתחילו להתאמן על תוכן שנוצר על ידי AI, הרשת עלולה להפוך למעגל חוזר של תוכן באיכות נמוכה. דן קליין, פרופסור מאוניברסיטת ברקלי ו-CTO של מודל AI, מסביר: "מודלים אלה חכמים בזכות כל המידע שאנו מפרסמים ברשת ללא שימוש בהם. אם נפסיק ליצור ידע עצמאי, מה יניע את המודלים הללו?".

האתגר בזיהוי תוכן AI

זיהוי תוכן שנוצר על ידי AI הוא מורכב, שכן רבים מהמאמרים אינם נוצרים באופן מוחלט על ידי בני אדם או AI. לעיתים בני אדם משתמשים ב-AI לתכנון, כתיבה מחדש או עריכה, מה שמטשטש את הגבולות בין תוכן אנושי לתוכן ממוחשב. Graphite מסווגת מאמר כ'נוצר בעיקר על ידי AI' רק כאשר רוב הטקסט מזוהה כתוכן שנוצר או נעזר ב-AI.

איכות התוכן והעתיד

"איכות התוכן שנוצר על ידי AI משתפרת במהירות. במקרים רבים, תוכן שנוצר על ידי AI טוב או אפילו טוב יותר מתוכן שנכתב על ידי בני אדם. לעיתים קשה מאוד להבחין בין השניים", נכתב בניתוח של Graphite.

לסיכום, נכון להיום, AI כותב כמעט כמות מאמרים כמו בני אדם, אך נראה כי ישנה מגבלה לכמות התוכן הממוחשב שניתן לייצר. הממצאים מעידים כי למרות החששות, הרשת עדיין לא מוצפת לחלוטין בתוכן AI, וייתכן כי מגבלה זו תימשך גם בעתיד הנראה לעין.

מקור: Axios