Passer au contenu

La plus grande bibliothèque du Web succombe à la curiosité des internautes

Construit patiemment depuis cinq ans, le projet d’archivage du Web ” Wayback Machine ” vient d’ouvrir. Mais la ruée des internautes, curieux de remonter le temps, sature le site.

Baptisé la ” machine à remonter le temps ” ( Wayback Machine), ce projet est l’?”uvre d’un entrepreneur de San Francisco, Brewster Kahle, diplômé du MIT et fondateur de la société Alexa (utilitaires Internet), rachetée depuis par Amazon.com.Brewster Kahle a patiemment archivé depuis cinq ans des échantillons représentatifs, surprenants ou cocasses de la production pléthorique d’Internet. Il utilise pour cela des robots (crawlers) qui parcourent le Web et ramènent des exemplaires des sites auxquels ils ont eu accès. Il leur faut en moyenne deux mois pour faire un tour complet du Web
.Wayback Machine n’est pas le premier site à proposer à l’internaute de se replonger dans ses souvenirs de surf. Ainsi, Ghostsites archive lui aussi le Web, mais en se consacrant uniquement aux start-up disparues. La caractéristique de Wayback Machine, c’est qu’il s’agit du premier site à procéder à un archivage systématique et à cette échelle. L’ensemble des sites archivés représente ainsi 10 milliards de pages, soit 100 teraoctets de données.La cyberbibliothèque peut servir à de nombreux usages, d’ordre utilitaire ?” par exemple, retrouver le mode d’emploi d’un vieil ordinateur ?”, ou moins avouables, comme parcourir les pages de sites pornographiques désormais introuvables.La machine à remonter le temps de Kahle contient des exemplaires de nombreux journaux disparus depuis. De façon plus cocasse, elle permet de retracer l’évolution des politiques des entreprises. Par exemple, celle de la régie publicitaire Doubleclick, qui a changé au fil des ans ses règles concernant le respect de la vie privée.” Si vous ne gardez aucune trace des contenus numériques, ils disparaissent, explique Brewster Kahle. C’est comme une immense collection. Un hommage au Web. “Kahle a créé quatre dossiers thématiques pour illustrer son propos : les attentats du 11 septembre, les élections présidentielles de 2000, les sites gouvernementaux et les pionniers du Web (Yahoo!, IMDB, the Well…).L’accès aux archives est gratuit (le créateur est à la recherche de fonds et de matériel). La Wayback Machine se présente comme un moteur de recherche : l’internaute indique l’adresse Internet du site qu’il souhaite consulter. Le site lui propose alors une liste des dates pour lesquelles il dispose d’échantillons.Malheureusement, depuis son ouverture vendredi dernier, les internautes se sont rués sur la cyberbibliothèque et les archives sont devenues inaccessibles. Brewster Kahle n’avait pas prévu un tel succès et les serveurs du site n’ont pas supporté la surcharge.
Aucune date nest donnée officiellement pour la réouverture.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Karine Solovieff (avec Reuters)