בשנת 1996, עם כונן הבזק בנפח 2 טרה-בייט, ניתן היה לאחסן בו את כל תוכני הרשת העולמית. אולם באותה תקופה, טכנולוגיה כזו לא הייתה קיימת, והאתגר של שמירת ההיסטוריה הדיגיטלית היה מורכב הרבה יותר. ארכיון האינטרנט, ארגון ללא מטרות רווח שהוקם לפני שלושה עשורים, התחיל את דרכו בהעתקת דפי אינטרנט על גבי סרטי מגנטיים והגיע כיום לאחסון של מעל טריליון דפי אינטרנט במרכזי נתונים ברחבי העולם.

באמצעות מכונת הזמן (Wayback Machine), המשתמשים יכולים לחזור אחורה ולראות כיצד נראו דפי אינטרנט בעבר. כך ניתן לגלוש באתריהם הישנים של GeoCities, לקרוא את קוד ההתנהגות המקורי של גוגל (כשהיא עוד כללה את הסיסמה 'אל תהיו רשעים'), או לעיין בדו"חות שינויי האקלים של הסוכנות להגנת הסביבה האמריקאית – לפני שנמחקו בתקופת ממשל טראמפ. בנוסף, הארכיון כולל הקלטות של הופעות חיות, ספרים ברשות הציבור ומאות משחקי DOS נשכחים. מדי יום, כ-2 מיליון אנשים ניגשים למשאביו של הארגון.

מייסד הארגון ויו"רו, ברוסטר קאהל, הצהיר: 'אנו רוצים הכל. אנו רוצים את כל היצירות הציבוריות של בני האדם. אם אין לנו אותן, אנחנו רוצים להשיג אותן'. אולם למרות שהארכיון עצמו לא השתנה רבות לאורך השנים, הרשת עצמה עוברת טרנספורמציה שמאיימת על משימתו.

כיום, מפרסמים ברשת חוסמים את גישת מכונת הזמן מחשש שחברות בינה מלאכותית 'גוזלות' את התכנים. כמו כן, תביעה משפטית מול הוצאות ספרים הסתיימה בפשרה שבה נאלץ הארכיון להסיר מעל 500 אלף ספרים מהאוסף שלו. במקביל, עלות אחסון הנתונים של המין האנושי ממשיכה לעלות, כאשר הביקוש ממרכזי הנתונים של הבינה המלאכותית דוחף כלפי מעלה את מחירי האחסון והזיכרון. כל אלו גורמים לקאהל להביט בעבר עם געגועים: 'עלינו להמשיך ולנסות להפעיל ספרייה, למרות התקופה הקשה שבה אנו נמצאים', הוא אומר.

מדוע זה חשוב?

ארכיון האינטרנט אינו רק כלי לגישה לדפי אינטרנט ישנים – הוא מהווה מאגר מידע ותרבות נגיש לכל אדם. בעולם שבו תוכן דיגיטלי מוגן ברישיונות ולא בבעלות, חשיבותו של הארכיון גדולה מתמיד.

איך הכל התחיל

ברוסטר קאהל חלם על הקמתו של ארכיון כזה עוד לפני שהדבר היה אפשרי. בשנות ה-80 המוקדמות, הוא למד בינה מלאכותית ב-MIT והיה מהנדס מוביל במחשבי-על ב-Thinking Machines. באותה תקופה, האינטרנט המודרני עדיין לא היה קיים, אך הוא דמיין כיצד מחשבים עתידיים יאפשרו גישה מיידית לחומרי עיון מכל מקום. 'עבורו, בשנת 1980, הרעיון היה לבנות את מה שהבטחנו מזה זמן רב: ספריית הקונגרס על שולחנך', הוא נזכר.

האתגרים הנוכחיים

  • חסימות מצד מפרסמים: בעלי אתרים חוסמים את גישת מכונת הזמן מחשש שהבינה המלאכותית תנצל את התכנים לצורך אימון מודלים.
  • תביעות משפטיות: תביעה מצד הוצאות ספרים הובילה להסרת מאות אלפי ספרים מהאוסף.
  • עלויות אחסון גבוהות: הביקוש למרכזי נתונים של בינה מלאכותית מעלה את מחירי האחסון והזיכרון, ומקשה על הארכיון להמשיך ולפעול.

'עלינו להמשיך ולנסות להפעיל ספרייה, למרות התקופה הקשה שבה אנו נמצאים'. — ברוסטר קאהל, מייסד ויו"ר ארכיון האינטרנט

מקור: Fast Company