01net. web avec Google
Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique
Logiciel
Matériel
FAI
Sécurité
Médias
Droit et conso
Techno
Société
Vu sur le Web
Business
Chat
[ MOTEURS DE RECHERCHE ]
(Mise à jour) Google cherche trop loin ?
Les fichiers Word, Excel et PowerPoint sont, depuis la fin du mois d'octobre, indexés par Google. Une fonction qui permet la consultation de documents confidentiels mal protégés.

Isabelle Dumonteil , 01net., le 08/11/2001 à 20h30

Mise à jour

D'après Eric Baillargeon, spécialiste canadien du référencement qui a réalisé l'enquête aux côtés de Michel Dumais, les capacités de Google à aller fouiner dans des documents vont bien au-delà des documents Word, Excel ou PowerPoint.

Ainsi, lorsque l'on effectue une recherche sur un format de fichier particulier, Word par exemple, Google affiche dans le champ recherche un paramètre de type filetype:doc. Il suffit alors de remplacer le doc par n'importe quelle extension de fichiers (txt [texte], rtf [texte enrichi]...) pour obtenir des résultats. Cela fonctionne également avec les extensions dbf et mdb utilisées par les bases de données.

Cette découverte aurait donc permis à Eric Baillargeon de trouver avec Google des bases de données contenant des numéros de téléphone, de carte de crédit ou de sécurité sociale. Une découverte d'autant plus inquiétante si l'"  on suppose que le processus d'indexation des nouveaux fichiers a débuté uniquement la semaine dernière. Il est donc logique de conclure que ce n'est que dans plusieurs mois que Google livrera un maximum d'informations confidentielles  ", déclare Eric Baillargon au journal Le Devoir .


C'est un journaliste canadien du journal Le Devoir qui a mis le feu aux poudres. Alors qu'il testait les nouvelles fonctionnalités du moteur de recherche Google , il est tombé sur des documents " sensibles " stockés sur des serveurs militaires (.mil) ou encore émanant du gouvernement québécois. Prévenu, ce dernier a d'ailleurs reconnu sa négligence et s'est empressé de nettoyer ses serveurs.

En effet, depuis le 31 octobre, Google indexe les documents Word, Excel et PowerPoint. Jusqu'alors, il se contentait des pages HTML et des fichiers PDF.

En utilisant la recherche avancée , il est possible de limiter ses recherches aux documents Word, par exemple, ou à certains serveurs en particulier. Quelques mots-clés judicieusement choisis peuvent alors effectivement permettre de trouver des documents inattendus.

La plupart des réseaux privés sont inaccessibles

Toutefois, la plupart des entreprises stockent leurs données dans des réseaux inaccessibles aux robots des moteurs de recherche. Pour être exhumé par Google, un document doit donc être archivé sur un serveur public, c'est-à-dire connecté au Web, sans aucune protection particulière. Seuls les plus négligents devraient donc se faire surprendre.

De plus, sur son site , Google met à la disposition de tous les webmasters des éléments permettant d'interdire l'accès d'un serveur aux robots utilisés par les moteurs de recherche.

Cette histoire devrait sans doute inciter les entreprises à vérifier que leur données sont bien en lieu sûr.


Kaspersky Anti-virus:
La protection ultime de votre quotidien numérique.

publicité
Skype
La messagerie gratuite la plus utilisée dans le monde.

classement FAI
Retrouvez chaque semaine le classement des fournisseurs d'accès avec ip-label 1 Numericable2 Darty câble 30Mbps3 Orange > Plus de détails
Espace Emploi

Recherche express

> Les Incontournables :
Web Creator Pro 5
Montez vous-même un site Web de qualité.