Passer au contenu

Les outils de recherche

Comment fonctionne un moteur de recherche ? Comment formuler sa requête ? Quelles différences y a-t-il entre un annuaire et un moteur de recherche ? Quels sont les meilleurs outils actuellement ? Et demain ?

Bonjour à toutes et à tous, nous sommes heureux de recevoir Olivier Andrieu !

A qui la première question ?

Journaliste 01net. : y a-t-il beaucoup de moteurs de recherche ?

On dénombre plusieurs centaines, voire milliers, d’outils de recherche, mais il y a plus d’annuaires que de moteurs. Et moins de 20 sont considérés comme majeurs pour un public francophone.

Ptit-troll : quels conseils donneriez-vous à un utilisateur novice quant à l’utilisation des outils de recherche ?

D’abord, bien définir sa recherche. Puis utiliser l’outil de recherche adéquat en fonction de la recherche : annuaire, moteur, expert, etc. Et enfin, bien connaître la syntaxe d’interrogation de l’outil utilisé : ET, OU, SAUF, etc.

isa : quel est le secret d’un bon référencement pour un site ? Est-ce que cela peut booster significativement le trafic ?

La nécessité d’un référencement est inversement proportionnelle à la notoriété d’un site. Une PME en a besoin, mais ça dépend de sa cible. En tout cas, ça ne peut être l’unique méthode de promotion d’un site Web.

Yann Solo : quel est, pour toi, le meilleur moteur de recherche ?

Je crois que le meilleur moteur, aujourd’hui, est Google pour beaucoup de gens. Et je pense qu’ils ont raison.

bertrand : quel est, à votre avis, le moteur de recherche le plus efficace pour une recherche sur un contenu français ?

Meilleurs moteurs pour un contenu français : Voila et Google. Meilleurs annuaires : Yahoo.fr et Nomade.fr, à mon avis. Mais il y a de nombreux challengers (Looksmart, Altavista.fr).

thom : que pensez-vous de Google ?

Google est sans conteste un excellent moteur de recherche, basé sur la popularité des pages (le nombre de liens vers elles). Mais popularité est-elle égale à pertinence ? C’est là le grand challenge de Google à l’avenir.

simon : à quel annuaire faites-vous confiance et pourquoi ? Merci de votre réponse !

Annuaire : j’utilise personnellement Yahoo.fr et Nomade.fr, parfois l’open directory et Looksmart france, car ils me semblent les plus complets.

Journaliste de 01net. : qu’est-ce qui fait exactement que Google est meilleur que les autres ?

Google a un très gros index (nombre de pages), l’un des plus importants, et il est, je pense, le plus pertinent sur des requêtes à un ou deux mots. Il a compris que c’était à l’outil de s’adapter à l’internaute et non le contraire.

LaRegie : mis à part Google, existe-t-il aujourd’hui un autre moteur de recherche qui émerge ?” c’est-à-dire utilisé par le grand public ?

Il existe, grosso modo, assez peu de moteur très utilisés : Altavista, Hotbot, Voila en France, Lycos, Fast, qui est peut-être le plus efficace actuellement. Globalement, je pense que Google écrase un peu la concurrence actuellement, mais il s’agit-là d’un monde assez mouvant, donc rien n’est fait.

SVP : comment Altavista, qui était le leader incontesté il y a quelques années, s’est-il fait dépasser par Google ?

C’est vrai, Altavista est aujourd’hui un peu dépassé et j’en suis le premier déçu. Je pense qu’ils ont un peu raté le coche en ne sachant pas choisir une stratégie claire : moteur simple ? Portail ? Revente de la technologie ? Ils ont toujours navigué entre deux eaux. Dommage !

JPhilippe : bonjour, j’aimerais que vous me parliez du Web caché : quels sont les outils les plus performants sur le marché ?

Vous voulez parler du Web invisible (les pages Web non disponibles sur les moteurs). Je pense que des outils comme Strategic Finder sont pas mal dans ce cadre. Ou des sites comme Invisibleweb.com. La plupart du temps, on utilisera les sites qui proposent directement leurs propres bases de données, comme celui de 01net., par exemple.

Laurent : comment évalue-t-on la pertinence et la qualité d’un moteur de recherche ou d’un annuaire ? Qui les mesure ?

Je prépare une étude sur le sujet qui devrait paraître la semaine prochaine si tout va bien : 10 moteurs et 10 annuaires testés sur de nombreux critères et en fonction des populations d’Internet. Grosso modo, les critères : quantitatif, qualitatif, fonctionnel, etc.

Fred : existe-t-il des moteurs de recherche spécifique ?

Il existe de très nombreux moteurs de recherche spécifiques, on peut en trouver beaucoup sur des sites comme www.enfin.com. C’est même une tendance très forte sur le Web.

simon : est-ce qu’il vous arrive parfois d’échouer dans une recherche ?

Très souvent heureusement :-). On ne trouve pas tout sur l’Internet, on trouve de tout, c’est différent :-). Souvent, d’ailleurs, j’ai encore le réflexe Internet alors que par téléphone j’aurais eu réponse à ma question en 10 secondes :-). Classique, mais je me soigne !

pol : quel est le meilleur moteur de recherche d’images ?

Outil de recherche d’images : avez-vous essayé ceux d’Altavista et, depuis peu, celui de Google : ils me semblent excellents.

Delf : qu’est-ce qu’un métamoteur ?

Un métamoteur est un outil (site Web ou logiciel) qui interroge plusieurs outils de recherche en simultané sur les même mots-clés et qui en synthétise les résultats en les dédoublonnant. Un métamoteur est bon, à mon avis, pour avoir une idée très rapide de ce qu’on peut trouver sur un domaine sur le Web. Il est moins adapté, je pense, à une recherche très précise.

Journaliste 01net. : qu’est-ce qu’un moteur en langage naturel ?

Par exemple sur www.infoclic.fr, vous tapez une question du type ” Quel temps fait-il aujourd’hui à Strasbourg ? ” et l’outil de recherche vous renvoie directement sur le site de la Météo, à la rubrique Alsace. PS : aujourd’hui, il fait très chaud à Strasbourg :-)).

Ptit-troll : Fast n’est-il pas plus intéressant et fonctionnel comme moteur de recherche d’images ?

Oui, c’est vrai, mais la fonctionnalité est nouvelle chez Fast, et je ne l’ai pas testée encore vraiment.

pat : quels sont les métamoteurs les plus utilisés en France et à l’étranger, à part Copernic ?

A part Copernic, on peut parler de Strategic Finder et Bullseye comme logiciel. En site, c’est Ixquick, qui semble être très utilisé actuellement. Il est également intéressant de bien voir la différence entre annuaire et moteur. Un annuaire est une sélection de sites (par exemple 140 000 sur Yahoo France). Un moteur est un index de pages Web (620 millions sur Google, par exemple). Un annuaire est bâti par des humains (documentalistes), tandis qu’un moteur est bâti par des logiciels (appelés crawlers, spiders). On utilisera un annuaire pour trouver un site et un moteur pour trouver une page spécifique à l’intérieur d’un site.

simon : que pensez-vous d’Ask Jeeves ?

Ask jeeves : je trouve l’idée géniale, surtout pour un site thématique ou une fonction de type SAV. Il s’agit d’une base de données de questions-réponses sur un sujet donné. Lorsque vous posez une question en langage naturel, Ask jeeves va rapprocher la question posée d’une parmi celles dont il détient déjà la réponse. Ça marche très bien pour le SAV car, très souvent, les clients d’une société posent les mêmes questions au service après-vente. On peut donc y répondre très vite avec ce type d’outil. Voir également en français www.infoclic.fr comme je l’ai dit précédemment.

b.Gates : y a-t-il des moteurs de recherche qui font annuaire ?

La tendance est aux outils de recherche : annuaire et moteur. Voila.fr est un bon exemple : il donne d’abord les résultats de l’annuaire (le guide) puis ceux du moteur. On dégrossit la recherche sur l’annuaire et on l’affine sur le moteur. Bien vu ! C’est une tendance forte. Il n’existe quasiment plus d’outil de recherche qui ne soit pas mixte.

marge : est-ce vraiment important d’utiliser les AND ou OR, etc. pour les recherches ?

Sur un annuaire, pas vraiment, car, sur plusieurs dizaines de milliers de résultats potentiels, on s’en sort bien. Mais, sur les moteurs, ça me semble indispensable si on veut être efficace. Les gens se plaignent souvent qu’ils ont trop de résultats, mais ils n’utilisent pas les fonctions fournies par le moteur pour affiner leur requête.

fox265948 : existe-t-il des solutions de recherches totalement paramétrables en fonction de ses besoins (sources, mots-clés, etc.) ?

Non, pas vraiment, mais je ne suis pas sûr de comprendre la question. Voila avait testé les TSE (Thematic Search Engine) qui s’en rapprochaient, mais je ne sais pas où en est le projet. Il manque à mon avis, un outil de ce type, sur lequel on pourrait dire ” Tu recherches tel mot-clé sur tous les sites de tourisme “, par exemple. C’est techniquement possible sans problème. Ça me revient : il me semble que Northern Light propose quelque chose comme ça dans sa recherche avancée. A voir !

simon : que pensez-vous des moteurs de recherche humains comme Webhelp ? C’est sérieux ? Vous avez testé ?

J’ai testé Webhelp et je trouve ce type d’outil très bon pour les utilisateurs débutants qui ne veulent pas s’embêter avec les syntaxes d’interrogation des annuaires et moteurs. Mais pour les questions précises et pointues, ce n’est pas adapté.

Journaliste 01net. : combien les internautes utilisent-ils en moyenne de mots-clés pour lancer une recherche ?

Les internautes utilisent en majorité un mot-clé (40 % environ des requêtes) ou deux mots-clés (40 % également) et, dans ce cas, ce sont des expressions la plupart du temps (loft story, new york…). Voir : www.abondance.com/docs/top10.html pour avoir la liste des mots-clés le plus souvent demandés sur les outils francophones. Au fait, le premier mot-clé tapé dans le monde est : … suspense… abondance ! Non, je rigole : c’est sexe, bien sûr.

lisou : Olivier, pourriez-vous me dire comment faire pour que les pages de mon site apparaissent dans le moteur Google ? Merci de votre aide et de vos précieux conseils.

Pour être dans Google : il faut soumettre, mais il semble être en panne en ce moment. En fait, ils testent un système d’indexation quotidienne en ce moment et ça semble ralentir l’indexation ” nature “.

b.Gates : est-ce que les moteurs gagnent de l’argent ? Car c’est un service gratuit qui nécessite un gros de développement pour son créateur.

Pour les outils de recherche, jusqu’à maintenant, le modèle économique était la publicité. Mais ils testent d’autres modes de revenus : soumisison payante, référencement payant, positionnement… Et peut-être bientôt, recherche payante. Allez savoir ! ;-).

ephistao : quand on lance une recherche, le moteur, parcourt-il vraiment tout le Net ?

Aucun moteur de recherche ne parcourt TOUT le Web. Mais est-ce vraiment nécessaire ? Il faut parcourir et indexer toutes les pages ” utiles “, contenant une info pertinente. Et ce tri n’est pas simple à faire. Le plus gros index est celui de Fast avec 625 millions de pages, alors qu’on estime que le Web ” visible ” contient plus de deux à trois milliards de pages. Mais dans ces milliards, il y a beaucoup de doublons, de pages de spam et d’infos obsolètes. Il faut séparer le bon grain de l’ivraie. Pas si simple pour un moteur.

Greuh : c’est quoi la soumission payante ?

Soumission payante = je paie pour que mon site soit pris en compte par les documentalistes d’un annuaire (Yahoo, Looksmart…). Le site n’est pas accepté, juste évalué. Mais on paie un délai garantie (2 à 5 jours) et une réponse assurée (oui ou non) et la possibilité de soumettre à nouveau une fois, en cas de refus du site dans l’annuaire. Tous les annuaires américains le pratiquent. En France, tous proposeront cette offre d’ici à la fin de l’année (les majeurs bien sûr : Yahoo, Nomade, Lycos, Voila, etc.).

gbelloir : que pensez-vous des moteurs offrant d’affiner une recherche sur la base du nombre d’occurrences de certaines unités sémantiques sur les pages trouvées (Exalead ou Kartoo.com) ?

C’est une bonne vision, je pense. Exalead a été créé par Francois Bourdoncle, qui avait créé à l’époque la fonction ” refine ” d’Altavista qui fonctionnait sur le même schéma. Le but est d’essayer de comprendre de quoi parle une page Web, d’en ressortir un thème général pour le proposer à l’internaute. C’est pour cela qu’une page courte et traitant d’une seule chose est souvent très efficace sur un moteur de recherche. Altavista a lancé des travaux pour aller dans ce sens également.

Lisou : comment je fais alors avec mon site perso pour être référencé si je ne veux pas payer ?

La situation est la suivante : pour l’instant et pour quelques mois, on aura une double possibilité pour les outils : soit on paie (et on a une réponse rapidement) soit on soumet gratuitement. Deuxième phase (2002) : les sites Web d’entreprises devront payer obligatoirement, toujours possibilité de soumission gratuite pour les autres. Troisième phase (à partir de 2003) : soumission payante pour tous ? A voir ! Rien n’est décidé, heureusement !!!

bison : Bonjour, à part Infoclic.fr, existe-t-il d’autres moteurs de recherche en langage naturel ?

Le terme ” interrogation en langage naturel ” est très vaste et regroupe plusieurs idées et technologies. Il existe de nombreuses offres (Sinequa, etc.) mais elles sont parfois différentes. Envoyez-moi un mail si vous voulez des adresses, pas de problème.

Journaliste 01net. : est-ce que je peux utiliser des mots en français dans un moteur anglais ? Et des accents ?

Les outils de recherche, en règle générale, traitent bien les lettres accentuées car… ils les ignorent : bébé = bebe. Mais Altavista est plus fin : si vous tapez bebe, il trouvera bebe, bébé ou bebé. Mais si vous tapez bébé, il ne trouvera QUE bébé. Dès qu’il trouve un caractère accentué (diacritique pour être plus précis), il recherche l’occurrence exacte. Donc, si vous n’êtes pas sûr de l’orthographe du mot (jérôme, par exemple, je ne sais jamais comment l’écrire), tapez le non accentué pour avoir toutes les occurrences. Sinon, tapez-le en ” accentué “, vous enlèverez de votre recherche les pages qui le contiennent avec une faute d’orthographe. Une espèce de tri naturel, quoi.. :-).

Ptit-Troll : y a-t-il une différence entre soumission payante et liens sponsorisé (sur Google notamment) ?

La même qu’entre information et publicité ;-). La frontière est parfois étroite :-). Les liens sponsorisés sur Google sont des bandeaux publicitaires au format textuel, pas si éloignés que cela du lien acheté de type Goto ( www.goto.com), à mon avis.

ebusiness : l’avenir du référencement est-il forcément payant ? Quel avenir pour le travail de référenceur ? Est-ce un métier d’avenir ?

L’avenir du référencement passe, pour moi, par la notion plus vaste de promotion de site Web, en utilisant de nombreuses techniques et stratégies, et notamment, mais pas uniquement, le référencement. La question pourrait être traitée longuement. Les connaissances techniques ont encore un intérêt pour l’avenir. Mais il faudra payer, je pense, au moins la présence des pages dans l’index du moteur. Pour les annuaires, l’avenir est, à mon avis, clairement du côté de l’épaisseur du porte-monnaie.

fox265248 : la veille de sites entier par mots-clés est-elle possible et quels sont les outils ?

Euh, la veille de sites ? C’est-à-dire ?

Lisou : est-ce qu’il y a des logiciels de moteurs de recherche ? J’aimerais en avoir un sur mon site perso.

Moi j’utilise www.atomz.com : génial et gratuit jusqu’à 500 pages, sans installation, puisque tout tourne sur leurs serveurs, de façon déportée. À tester absolument. Je suis un aficionado à 100 %.

lilian : quelles vont être les prochaines grandes évolutions des moteurs de recherche ?

Présentation graphique des résultats grâce au haut débit, par exemple. Thématisation des outils. Régionalisation des outils (Alsace, PACA, Bretagne, etc.). Voilà quelques directions. Mais il est étonnant de voir que, finalement, s’il existe quelques pionniers actuellement, il y a assez peu d’innovations encore dans ce domaine pourtant majeur du Web. Alors que, pourtant, il existe plein de choses à faire ! Alors, qu’y s’y colle dans la salle ? ;-))).

Journaliste 01net. : quel sera le meilleur moteur demain ?

Je peux dire jusqu’à ce soir, pour demain c’est de la science-fiction :-)… et la semaine prochaine de la prospective :-)) Mais disons que Google est excellent et a une bonne vision du domaine. Mais de nouveaux acteurs peuvent arriver. Google en est d’ailleurs la preuve !

Merci Olivier Andrieu, le mot de la fin ?

Merci à tous pour vos questions. Si vous en avez d’autres : [email protected] ou : www.abondance.com. Merci à 01net. et à Canalchat pour leur aide !


La rédaction