Passer au contenu

La face cachée du Web

BrightPlanet révèle dans une étude que les profondeurs du Web seraient non seulement 500 fois plus vastes que la partie visible du Net, mais aussi beaucoup plus intéressantes.

Une étude réalisée par la société BrightPlanet estime que tous les calculs effectués jusqu’à présent pour évaluer la taille du Web sont bien en dessous de la vérité.Cette sous-estimation du volume réel du Web proviendrait de l’incapacité des moteurs de recherche traditionnels à indexer les documents archivés dans les bases de données. Ces derniers se contentant des pages statiques du Web.BrightPlanet estime que près de 100 000 bases de données recelant un contenu particulièrement riche et à 95 % gratuit sont disponibles sur Internet. L’étude cite, à titre d’exemple, les bases de données contenant les brevets déposé par IBM ou celles sur le génome. Donc, si la partie visible du Web permet d’accéder à 1 milliard de documents individuels, la partie cachée en contiendrait quelque 555 milliards et s’accroîtrait à un rythme très rapide.BrightPlanet, qui entend résoudre ce problème, propose sur un site baptisé CompletePlanet un moteur de recherche qui répertorie 20 000 bases de données du Web. Ce moteur n’offre pas d’accès direct vers les bases de données, mais fourni les liens pour y accéder. Seul problème, la version proposée sur le site de CompletePlanet s’avère surtout pertinente pour les recherches en langue anglaise.


Isabelle Dumonteil