Passer au contenu

Wayback Machine, l’archéologue du Web

A quoi ressemblait le Web il y a une dizaine d’années ? Dans quel volume Internet peut-il tenir ? Toutes les réponses se trouvent sur le site Archive.org.

Un site Web pour remonter le temps… d’Internet. C’est l’idée de Wayback Machine. Lancé en 1996 par l’association californienne Internet Archive, il permet d’effectuer un tour d’horizon des sites depuis cette date. A ce jour, 150 milliards de pages, issues de 65 millions de sites, dans 37 langues différentes, sont proposées ! Soit, selon Wayback Machine, plus que l’ensemble des plus grandes bibliothèques du monde, dont celle du Congrès américain et ses 135 millions de documents. Tout un symbole : une copie des fichiers archivés se trouve sur l’ancien site de la bibliothèque d’Alexandrie, en Egypte. D’ailleurs, outre-Atlantique, nombre d’entre elles soutiennent ? notamment financièrement ? cet ambitieux projet. Mais aussi des universités, des musées, des institutions fédérales…La finalité ? “ Apporter tous les savoirs, dont ceux diffusés sur Internet, à ceux qui désirent les lire ”, explique son fondateur, Brewster Kahle, un informaticien américain, mélange de Steve Jobs et du professeur Tournesol, mais sorti des rangs du prestigieux Massachusetts Institute of Technology (MIT). La vocation du projet est de contrer le caractère éphémère d’Internet, sachant que la durée de vie d’une page Web, selon Internet Archive, n’est en moyenne que de 77 jours. Si le site capte des instantanés de l’intégralité des pages des sites tous les deux mois, il faut attendre entre six et douze mois avant de pouvoir les consulter sur Wayback Machine. Et certains sont archivés de façon aléatoire, avec des “ trous ” dans le calendrier. La faute à un volume croissant de données à sauvegarder, en augmentation de 20 téraoctets par mois. Car depuis 2002, Internet Archive ne se cantonne pas aux pages Web, il sauvegarde également des documents audio, vidéo et logiciels. Autant de documents qui tiennent dans un container de stockage, un Sun Modular Datacenter, d’une capacité de 3 pétaoctets (soit à peu près 3 millions de gigaoctets). Le tout étant complètement gratuit pour ceux qui consultent. Un choix qui, comme l’indique Brewster Kahle, est en accord avec l’inscription ornant le fronton de la bibliothèque de Boston : Free to all (Libre à tous).

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Joly