La «machine à remonter le temps» est ouverte au grand public depuis quelques semaines. Dix milliards de pages, sauvegardées depuis 1996, y sont disponibles.
La principale faiblesse du Web tient à sa volatilité. L’internaute n’est jamais assuré d’y retrouver intactes les pages qui l’ont intéressé. Comment connaître les sujets qui faisaient les gros titres du site de CNN à une date précise? A quoi ressemblait le site de la Confédération en 1999?
A l’exception de la Suède, qui archive ses pages Web depuis 1998, aucune institution publique ne s’est sérieusement souciée de son cyberhéritage. Jusqu’ici, seuls quelques particuliers comme Steve Baldwin ont manifesté une réelle conscience archivistique. Ce journaliste américain a lancé en 1996 Ghostsites.com, un répertoire des sites disparus, véritable mausolée en ligne où il conserve les pages d’accueil des sites abandonnés par leurs créateurs, leurs clients ou leurs financiers.
Ainsi, les historiens de demain sauront «que nous étions obsédés par le sexe, l’argent et le sport, relève-t-il sur son site. Ils sauront que des sociétés avec des noms loufoques étaient prêtes à nous livrer n’importe quoi, n’importe quand, n’importe où.»
Dans le même genre, le site Afterlife.org collecte les pages personnelles d’internautes décédés – comme pour donner une résonance cyber à la fameuse phrase du poète malien Amadou Hampaté Bâ qui disait qu’«en Afrique, quand un vieillard meurt, c’est une bibliothèque qui brûle».
Beaucoup plus ambitieuse, la Wayback Machine (la machine à remonter le temps) a été ouverte au public le 24 octobre dernier à l’adresse Archive.org. Avec ce site, les internautes détiennent enfin un sérieux gardien de leur mémoire. Dix milliards de pages sauvegardées depuis 1996, en consultation gratuite, permettent de remonter la brève mais passionnante histoire du réseau. Le projet a été lancé il y a cinq ans par Brewster Kahle, un entrepreneur américain ayant fait fortune avec son navigateur Alexa. C’est dans une ancienne baraque militaire de San Francisco qu’il a lancé sa première Wayback Machine, alors accessible aux seuls chercheurs et journalistes. Depuis qu’il a été ouvert au grand public, son nouveau site Archive.org est véritablement pris d’assaut.
Les internautes qui ne souhaitent pas que leurs pages Web soient archivées peuvent activer des filtres, mais, estime Kahle, «90% des gens dont le site fait partie de la collection se disent flattés». Les enregistrements sont confiés à des robots qui parcourent le Web de manière aléatoire, en prenant des sortes de «photos instantanées» des sites détectés. «Nous avons la technologie pour créer à moindre frais un énorme fonds, accessible de partout dans le monde. Les archives du Net et leurs 100 teraoctets, ça a l’air gros, mais cela coûte seulement 400 000 dollars à stocker», affirme Kahle.
Faut-il vraiment archiver tout le Net? Et si une sélection est nécessaire, qui définira les critères? Des questions de copyright ne vont-elles pas se poser? Les mêmes règles que pour l’archivage du papier s’appliquent-elles? Comment assurer la conservation des documents? Les archivistes du Web devront répondre à toutes ces questions.
Dans une société qui fait du devoir de mémoire une nouvelle religion laïque, il serait surprenant qu’un pan de la mémoire collective disparaisse dans l’indifférence générale. L’accès à la Wayback Machine va sans aucun doute activer le débat sur ces archives.
——-
Cet article de Largeur.com a été publié le 25 novembre 2001 dans l’hebdomadaire Dimanche.ch.
Retrouvez Largeur.com chaque semaine dans la page Néoculture de
![]()
