D'après Eric Baillargeon, spécialiste canadien du référencement qui a réalisé l'enquête aux côtés de Michel Dumais, les capacités de Google à aller fouiner dans des documents vont bien au-delà des documents Word, Excel ou PowerPoint.
Ainsi, lorsque l'on effectue une recherche sur un format de fichier particulier, Word par exemple, Google affiche dans le champ recherche un paramètre de type filetype:doc. Il suffit alors de remplacer le doc par n'importe quelle extension de fichiers (txt [texte], rtf [texte enrichi]...) pour obtenir des résultats. Cela fonctionne également avec les extensions dbf et mdb utilisées par les bases de données.
Cette découverte aurait donc permis à Eric Baillargeon de trouver avec Google des bases de données contenant des numéros de téléphone, de carte de crédit ou de sécurité sociale. Une découverte d'autant plus inquiétante si l'" on suppose que le processus d'indexation des nouveaux fichiers a débuté uniquement la semaine dernière. Il est donc logique de conclure que ce n'est que dans plusieurs mois que Google livrera un maximum d'informations confidentielles ", déclare Eric Baillargon au journal Le Devoir .
C'est un journaliste canadien du journal Le Devoir qui a mis le feu aux poudres. Alors qu'il testait les nouvelles fonctionnalités du moteur de recherche Google , il est tombé sur des documents " sensibles " stockés sur des serveurs militaires (.mil) ou encore émanant du gouvernement québécois. Prévenu, ce dernier a d'ailleurs reconnu sa négligence et s'est empressé de nettoyer ses serveurs.
En effet, depuis le 31 octobre, Google indexe les documents Word, Excel et PowerPoint. Jusqu'alors, il se contentait des pages HTML et des fichiers PDF.
En utilisant la recherche avancée , il est possible de limiter ses recherches aux documents Word, par exemple, ou à certains serveurs en particulier. Quelques mots-clés judicieusement choisis peuvent alors effectivement permettre de trouver des documents inattendus.
La plupart des réseaux privés sont inaccessibles
Toutefois, la plupart des entreprises stockent leurs données dans des réseaux inaccessibles aux robots des moteurs de recherche. Pour être exhumé par Google, un document doit donc être archivé sur un serveur public, c'est-à-dire connecté au Web, sans aucune protection particulière. Seuls les plus négligents devraient donc se faire surprendre.
De plus, sur son site , Google met à la disposition de tous les webmasters des éléments permettant d'interdire l'accès d'un serveur aux robots utilisés par les moteurs de recherche.
Cette histoire devrait sans doute inciter les entreprises à vérifier que leur données sont bien en lieu sûr.
![]() |
Photo
Canon EOS-450D. Reflex 12.2 Megapixels. Comparez les prix !
|
|
![]() |
Poker : LiveTheDream
Le rêve de devenir joueur pro est devenu réalité.
|
|
1 Numericable
2 Free
3 Bouygues Telecom
> Plus de détails

![]() |
Logiciel : Avira Antivir Premium
Une protection complète pour surfer tranquille.
|
|
















