01net    Web


Entretien du PC
Optimisez facilement les performances et la stabilité de votre ordinateur.






Nouveau !



Découvrez l'annuaire de tous les podcasts video et audio

www.touslespodcasts.com













Découvrez 01men, le net masculin : sports, automobile, high-tech, loisirs, style de vie...


sonneries


jeux

entreprise
Quand la ToIP se met au courant sur Ethernet
produits et tests
Onze GPS grand écran avec info trafic, MP3 et photos
trucs et astuces
Un PC de poche dans votre clé USB
NEWSLETTERS
Abonnez-vous gratuitement !
 

Ces tricheurs qui polluent Google Amaury Mestre de Laroque

écrire à l'auteur imprimer
envoyer par mail
Cet article est extrait de : L'Ordinateur Individuel

Aide les utilisateurs avertis à mieux choisir et mieux utiliser les nouvelles technologies. Depuis sa nouvelle formule (janvier 2004), existe aussi en petit format.

Découvrez le magazine
Contactez la rédaction
Abonnez vous
[ MOTEUR DE RECHERCHE ]
Ces tricheurs qui polluent Google
Pour tromper les moteurs de recherche et apparaître en premier dans leurs pages de résultats, certains sites ont recours à des techniques malhonnêtes.

Amaury Mestre de Laroque , L'Ordinateur Individuel, le 17/02/2005 à 07h00

Surprise ! Il y a quelques mois, les internautes qui tapaient le mot « magouilleur » dans Google étaient invités à se rendre sur le site de... Jacques Chirac. Le célèbre moteur de recherche avait-il perdu la tête ? Non, il était tout simplement victime de l'une des nombreuses techniques qui permettent d'en trafiquer les résultats.

Si ce détournement était immédiatement perceptible par les internautes, il en existe beaucoup d'autres, plus sournois, qui passent totalement inaperçus. Ainsi, une recherche dans Google portant sur un appareil photo numérique aboutit à des pages de résultats squattées par les sites marchands. « En général, un internaute ne s'aventure pas au-delà de la deuxième page de résultats, explique un spécialiste des moteurs de recherche, d'où la nécessité d'apparaître devant ses concurrents en employant toutes les techniques d'optimisation imaginables » .

Certaines de ces « optimisations » sont acceptées par les moteurs de recherche, notamment celles qui consistent à inclure dans une page Web des codes (les tags HTML) contenant les mots-clés caractérisant au mieux son contenu. Des entreprises, appelées sociétés de référencement, en ont même fait leur fonds de commerce. Si les professionnels ne manquent pas, les abus non plus...

Car il existe aussi de multiples techniques déloyales, interdites par les moteurs de recherche, permettant d'apparaître en première position dans les pages de résultats. Elles sont réunies sous l'appellation « spamdexing » , un anglicisme qui désigne tous les moyens pour tromper les robots des moteurs de recherche chargés d'indexer et de classer les sites par pertinence.

La mafia des faux parrains

En France comme ailleurs, Google, utilisé par 70 % des internautes, est devenu une cible de choix pour les propriétaires de sites en mal de notoriété. Au palmarès de la triche figure en bonne place l'abus de « parrainage ». Pour définir la pertinence d'une page par rapport à un mot-clé saisi par l'internaute, le moteur analyse son contenu, mais également le nombre de sites qui pointent (proposent un lien) vers elle. Plus une page est ainsi « parrainée », mieux elle est notée. Et si, en plus, ses parrains jouissent d'une bonne notation, le filleul est assuré de grimper rapidement dans la liste des résultats proposés par le moteur.

Pour obtenir une place de choix dans les pages de Google, les webmestres peu scrupuleux créent donc une constellation de sites Web renvoyant les uns vers les autres. Le robot d'indexation du moteur leur attribue alors une bonne note, ce qui leur garantit théoriquement un bon classement dans les résultats. En exploitant cette technique au maximum, on peut tromper complètement Google : c'est ce que l'on appelle le GoogleBombing (lire l'encadré ci-après), utilisé par exemple pour associer le mot « magouilleur » à Jacques Chirac.

Autre technique très utilisée : celle des « pages satellites ». Ces pages Web sont souvent des reproductions de la page d'accueil du site tricheur, spécialement « optimisées » pour un mot-clé précis. Ainsi, un vendeur de DVD-vidéo peut créer des dizaines de milliers de pages satellites, une par film... y compris pour ceux qu'il ne vend pas.

Lorsque l'internaute tape le nom d'un film dans un moteur de recherche, les premiers résultats obtenus pointent vers la page satellite correspondante. Pour l'internaute, c'est une perte de temps : contrairement à ce que Google lui avait laissé croire, le marchand ne dispose pas du film convoité, il tente de lui vendre d'autres films de son catalogue. Certains sites préfèrent utiliser la technique du cloacking, qui consiste à identifier leurs visiteurs grâce à leur adresse IP.

Dès qu'ils repèrent un moteur de recherche qui « vient » les indexer, ils n'affichent pas leurs pages normales, mais des pages spéciales contenant uniquement des mots-clés, ce qui leur permet d'être mieux référencés. « Cette technique est souvent utilisée pour mieux positionner un site en fonction de mots-clés n'ayant rien à voir avec son contenu réel » , précise Olivier Andrieu, un spécialiste des moteurs de recherche. « Il y a des secteurs d'activités qui usent et abusent du spamdexing. Surtout ceux où la concurrence est la plus forte, comme le tourisme, le téléchargement de logos ou de sonneries, les rencontres et le charme », explique David Degrelle, fondateur de l'IPEA ( Internet Positioning European Association ), l'une des associations qui regroupent les professionnels français en matière de référencement.

Mais depuis peu, le spamdexing n'intéresse plus seulement les webmestres de sites de commerce électronique désireux de se faire connaître : il attire également tous ceux qui veulent gagner de l'argent avec la publicité. En effet, à l'initiative de Google, un nouveau type de liens s'est développé sur le Web : les liens sponsorisés. Ils apparaissent sur les pages de résultats des moteurs de recherche, au-dessus ou à côté des liens « classiques ».

Ces liens sont vendus aux enchères par les moteurs de recherche. Ainsi, tout un chacun peut acheter le mot-clé « voiture » sur Google. Il lui en coûtera 1,80 euro chaque fois qu'un internaute cliquera sur le lien sponsorisé. Pour optimiser l'impact de ces annonces payantes, les moteurs ont développé des programmes d'affiliation qui permettent à des propriétaires de sites Web de diffuser des liens sponsorisés. « A chaque fois que quelqu'un clique sur l'un de ces liens à partir de votre site perso, vous êtes rémunéré, et ce jusqu'à 60 % du montant payé par l'annonceur » , explique Olivier Guillo, président de l'IPEA.

Résultat, « on assiste à une inflation du nombre de pages Web vides de tout contenu, créées seulement pour afficher des liens publicitaires et monétiser l'audience » , déplore Jean-Michel De Sousa, responsable du trafic chez Nocreditcard.com , un site américain spécialisé dans le charme. Pour gagner de l'argent avec les liens sponsorisés, la plupart des webmestres pratiquent donc le spamdexing à outrance. « Certains webmestres obstinés parviennent ainsi à encaisser quelques milliers d'euros tous les mois. Le jour où les moteurs souhaiteront en finir avec le spamdexing, ils feront le ménage dans leurs programmes d'affiliation », poursuit Olivier Guillo. Et ce n'est pas pour demain, puisque Yahoo comme Google engrangent près d'un milliard d'euros par an, grâce aux seuls liens sponsorisés.

La triple menace des resquilleurs

Pour autant, il ne faudrait pas croire que les moteurs de recherche tolèrent que l'on exploite impunément les failles de leurs systèmes d'indexation. Il leur arrive même de taper du poing sur la table : en septembre 2004, l'un des clients de la société française de référencement Netbooster a été purement et simplement radié des bases de données de Google - la sanction maximale.

Car pour un moteur, les resquilleurs représentent une triple menace. Tout d'abord, ils nuisent à la pertinence des résultats, et par conséquent à la réputation du moteur, ce qui, à moyen terme, a pour effet de réduire son audience. De plus, le spamdexing entraîne une augmentation du nombre de pages Web à indexer, donc un surcoût matériel important.

Mais surtout, les moteurs ne peuvent pas indéfiniment fermer les yeux sur les pratiques anticoncurrentielles. « Le référencement abusif a souvent pour finalité de privilégier la position d'un site par rapport à celui d'un concurrent, et détourner ainsi une clientèle qui devrait en principe lui être attribuée. Le spamdexing est donc susceptible de créer un préjudice à l'égard des titulaires de sites Web concurrents. Il s'agira alors d'un acte de concurrence déloyale, qui pourra être condamné comme tel par les tribunaux de commerce  », estime Thibault Verbiest, avocat spécialisé dans le domaine.

Aux Etats-Unis, la Federal Trade Commission (FTC), l'autorité américaine chargée de la concurrence et de la répression des fraudes, a rappelé aux principaux moteurs de recherche qu'ils doivent être transparents sur l'origine des résultats qu'ils affichent ». Mais en Europe, les moteurs n'ont pas réellement à s'inquiéter, puisque la Commission européenne étudie actuellement la possibilité d'étendre le régime d'irresponsabilité conditionnelle qui prévaut déjà pour les fournisseurs d'accès à Internet en France. Autrement dit, ils ne pourraient être tenus pour responsables du contenu illicite des sites qu'ils référencent...

Quatre moteurs de recherche moins sensibles à la triche
Google-filter.com

Ce site propose les mêmes pages de résultats que Google, la personnalisation en plus. L'internaute, après avoir rempli un formulaire d'inscription gratuite, peut créer sa propre liste noire dans laquelle il ajoute au fur et à mesure les sites qu'il ne juge pas pertinents. Quant à l'éditeur, il poursuit la chasse aux spammeurs en excluant d'office 112 adresses de fraudeurs qu'il considère comme nuisibles.

Meceoo.fr

Deuxième outil de recherche le plus utilisé, le moteur de Yahoo remporte un franc succès. Pourtant, il ne propose pas de fonction de filtrage des résultats. Une lacune comblée avec Meceoo. Cette « surcouche logicielle » permet de créer des listes noires personnalisées et de rechercher des infos, à partir d'une sélection de sites définie au préalable par l'utilisateur. Très pratique.

Ujiko.com

Ujiko propose une panoplie d'outils de personnalisation du moteur de Yahoo, permettant d'en filtrer les résultats en excluant certains noms de domaines (les parents peuvent supprimer tous les noms de sites terminés par.tv), des pages Web ou des sites entiers. En outre, l'internaute peut attribuer des notes aux sites qui l'intéressent. Mémorisées par Ujiko, celles-ci détermineront le classement des résultats de recherches futures.

Fooxx.com

La pertinence des résultats de ce moteur n'est pas fondée sur la présence de mots-clés dans une page, mais sur l'appréciation des internautes. Chacun peut recommander des pages aux autres, rendre publics ses favoris, bloquer des pages. A la croisée du forum, de l'annuaire et du moteur de recherche, Fooxx gagnerait à accroître sa communauté pour devenir réellement indispensable.



Suite de l'article
GoogleBombing : qui s'amuse à tromper Google ?
Comment les moteurs de recherche contre-attaquent



Nous contacter | Charte de confiance | Voir notice légale


Tous droits réservés © 1999 - 2008 Internext - 01net.


Sites du réseau 01net Network : 01net. - 01men - RMC - BFM - BFM TV - La Tribune - Micro Achat - TousLesPodcasts