Stellen Sie sich vor, Sie reisen mit einem 2-Terabyte-USB-Stick ins Jahr 1996 zurück – damit ließe sich das gesamte World Wide Web speichern. Doch damals gab es solche Speichermedien nicht. Das Internet Archive, eine gemeinnützige Organisation, die in diesem Jahr ihr 30-jähriges Jubiläum feiert, hat diese Herausforderung gemeistert: Von Magnetbändern bis zu globalen Rechenzentren bewahrt das Projekt heute über eine Billion Webseiten und unzählige digitale Schätze.

Mit der Wayback Machine können Nutzer historische Webseiten aufrufen – von vergessenen GeoCities-Seiten über Googles ursprünglichen Verhaltenskodex („Don’t Be Evil“) bis hin zu Klimadaten der US-Umweltschutzbehörde EPA, die unter der Trump-Administration gelöscht wurden. Daneben bietet das Archiv Live-Mitschnitte von Konzerten, gemeinfreie E-Books und eine Sammlung alter DOS-Spiele. Täglich greifen rund zwei Millionen Menschen auf diese Ressourcen zu.

„Wir wollen alles“, sagt Brewster Kahle, Gründer und Vorsitzender des Internet Archive. „Alle öffentlichen Werke der Menschheit. Wenn wir sie nicht haben, holen wir sie uns.“ Doch die Mission des Archivs wird zunehmend bedroht: Immer mehr Webverlage blockieren die Wayback Machine, aus Sorge, dass KI-Unternehmen ihre Inhalte unkontrolliert auslesen. Ein Rechtsstreit mit Buchverlagen endete mit einer hohen Vergleichszahlung und der Entfernung von über 500.000 Titeln aus dem Archiv. Gleichzeitig treiben die wachsenden Anforderungen der KI-Datenzentren die Speicherkosten in die Höhe – eine weitere Hürde für das Projekt.

Kahle blickt wehmütig auf die Anfänge zurück, als das Internet Archive noch ohne rechtliche und wirtschaftliche Widerstände arbeiten konnte. „Wir müssen versuchen, eine Bibliothek am Laufen zu halten, obwohl die Zeiten für Bibliotheken extrem schwierig sind“, erklärt er. Doch das Internet Archive ist mehr als nur ein digitales Archiv: Es ist ein frei zugänglicher Wissensschatz, den Nutzer herunterladen und weiterverwenden können. In einer Welt, in der digitale Inhalte zunehmend lizenziert statt besessen werden, ist diese Unabhängigkeit von unschätzbarem Wert.

Die Anfänge: Eine Vision wird Wirklichkeit

Brewster Kahle träumte schon lange vor der Gründung des Internet Archive von einer digitalen Bibliothek. In den frühen 1980er-Jahren studierte er KI am MIT und arbeitete als leitender Ingenieur bei Thinking Machines, einem Pionier der Supercomputer. Damals existierte das moderne Internet noch nicht, doch Kahle hatte eine klare Vision: „Für mich war es 1980 die Idee, etwas zu schaffen, das wir längst versprochen hatten – die Library of Congress auf Ihrem Schreibtisch.“

Herausforderungen der Gegenwart

  • KI-Scraping: Verlage und Websites blockieren zunehmend die Wayback Machine, um ihre Inhalte vor automatisierter Datensammlung zu schützen.
  • Rechtliche Konflikte: Ein Vergleich mit Buchverlagen zwang das Archiv zur Löschung Hunderttausender Titel.
  • Steigende Kosten: Die Nachfrage nach Speicherplatz durch KI-Projekte treibt die Preise für Server und Datenspeicherung in die Höhe.
  • Zugang vs. Kontrolle: In einer lizenzgetriebenen digitalen Welt bleibt das Internet Archive ein seltener Ort der freien Verfügbarkeit.

„Wir müssen versuchen, eine Bibliothek am Laufen zu halten, obwohl die Zeiten für Bibliotheken extrem schwierig sind.“ – Brewster Kahle, Gründer des Internet Archive