Un géant du web qui défie le temps

Imaginez un voyage dans le temps en 1996 avec une clé USB de 2 To : vous pourriez alors stocker l'intégralité du World Wide Web. Une utopie à l'époque, où les bandes magnétiques étaient la norme. Pourtant, c'est ce défi que relève depuis 30 ans l'Internet Archive, une organisation à but non lucratif qui a transformé la préservation du web en une mission vitale.

Initialement limitée à des copies sur bandes, l'organisation gère aujourd'hui plus d'un billion de pages web stockées dans des centres de données répartis à travers le monde. Grâce à sa Wayback Machine, chacun peut explorer l'évolution des sites web : des pages GeoCities disparues aux premiers codes de conduite de Google (« Don't Be Evil »), en passant par les rapports climatiques de l'EPA avant leur censure sous l'administration Trump. Mais l'Archive ne se limite pas à cela : concerts enregistrés, livres du domaine public, jeux DOS oubliés… Son catalogue regorge de trésors numériques.

Avec près de 2 millions de visiteurs quotidiens, l'organisation incarne une bibliothèque universelle du numérique. « Nous voulons tout », déclare Brewster Kahle, son fondateur et président. « Tous les travaux publics de l'humanité. Si nous ne les avons pas, nous les cherchons. »

Des menaces grandissantes pour une mission essentielle

Pourtant, l'Internet Archive fait face à des défis sans précédent. Les éditeurs de contenu bloquent désormais l'accès à la Wayback Machine, craignant que les entreprises d'IA n'exploitent illégalement leurs données. Une bataille juridique avec des éditeurs de livres s'est soldée par un règlement coûteux, entraînant le retrait de plus de 500 000 ouvrages de sa collection. Parallèlement, la hausse des coûts de stockage, alimentée par la demande des centres de données pour l'IA, met à rude épreuve ses finances.

« Nous devons continuer à faire fonctionner une bibliothèque, alors que c'est une période extrêmement difficile pour les bibliothèques », confie Kahle, nostalgique d'une époque où les obstacles juridiques et économiques étaient moins nombreux. L'Archive ne se contente pas d'archiver le web : elle préserve un accès universel à l'information et à la culture, une mission d'autant plus cruciale dans un monde où le contenu numérique est souvent sous licence plutôt qu'en possession.

Les origines d'une vision ambitieuse

L'idée de l'Internet Archive germe bien avant sa création. Dans les années 1980, Brewster Kahle, alors étudiant en IA au MIT et ingénieur en chef chez Thinking Machines, imagine un futur où les supercalculateurs rendraient les ressources de référence accessibles à tous. « En 1980, mon rêve était de construire une bibliothèque comparable à celle du Congrès, mais sur votre bureau », explique-t-il.

Avec le lancement officiel de l'Archive en 1996, Kahle pose les bases d'un projet colossal : créer une mémoire collective du web, accessible à chacun, sans restriction. Aujourd'hui, alors que l'ère de l'IA redéfinit l'accès à l'information, cette vision reste plus pertinente que jamais… mais aussi plus menacée.

« Nous voulons tous les travaux publics de l'humanité. Si nous ne les avons pas, nous les cherchons. »
— Brewster Kahle, fondateur de l'Internet Archive

Ce qu'il faut retenir

  • Une mission historique : L'Internet Archive conserve plus d'un billion de pages web et des millions de ressources numériques, offrant un accès gratuit à l'histoire du web.
  • Des défis majeurs : Blocages par les éditeurs, coûts de stockage en hausse et batailles juridiques menacent son avenir.
  • Un patrimoine à protéger : Dans un monde où le contenu numérique est souvent sous licence, l'Archive joue un rôle clé dans la préservation de la culture et de l'information.