S'abonner :  Newsletters    Magazines

écrire à l'auteur imprimer
envoyer par mail
Indexation
Production de l'index informatique d'un ensemble de données permettant d'accéder directement à la partie voulue de l'ensemble par l'intermédiaire de mots-clefs.

Lionel Lumbroso , 01net., le 03/09/2002 à 05h40

L'index d'un livre est une liste de mots-clefs qui font gagner du temps dans la recherche d'informations en dirigeant le lecteur directement à une page du livre.

L'index d'un ensemble de données informatiques obéit à un principe quasi identique, dans le même but.

En informatique classique (traitement de listes de données), un fichier contient des fiches nommées " enregistrements " (une liste de produits, par exemple), toutes structurées de façon identique en un certain nombre de " champs " (par exemple, référence sur 15 caractères, nom sur 25 caractères, etc.).

L'indexation consiste à sélectionner un ou plusieurs champs qui serviront à la recherche et à créer pour chacun d'eux un fichier index contenant une entrée d'index pour chaque enregistrement. Si nécessaire, l' algorithme d'indexation assure l'unicité de chaque clef d'index. Le fichier index ne contient, pour chaque entrée, que le contenu d'un champ réduit à son minimum nécessaire par l'algorithme et un pointeur de quelques octets qui indique précisément à quel endroit, dans le fichier de données complet, se trouve l'enregistrement recherché.

En informatique moderne structurée autour d' Internet , le principe d'indexation prend encore plus d'importance et doit être toujours amélioré, car il s'agit désormais de faciliter l'accès non plus à un nombre relativement limité de grands fichiers listes, mais à des contenus de toutes sortes (texte, images, sons, etc.), dont la structure est plus souple que celle des fichiers classiques, et présents en quantité faramineuse sur Internet et les intranets (plusieurs milliards de documents).

L'indexation et la recherche sont alors dites " documentaires ". Ce n'est plus tel ou tel champ qui fait l'objet d'une indexation, ou plus seulement, mais potentiellement tous les mots d'un texte, par exemple, ou un sous-ensemble de mots pertinents dans le domaine considéré ou représentatifs de tout le contenu du document.

Dans les moteurs de recherche d'Internet, les fonctionnalités de recherche sont ainsi conditionnées par la qualité et la stratégie d'indexation.

L'indexation est donc un principe et une pratique dont la pérennité est garantie et qui devrait connaître constamment des améliorations à mesure que les contenus à indexer se rapprocheront de plus en plus de la totalité du savoir et de l'information universels.


> EasyRecovery
Un logiciel simple et efficace pour récupérer des données perdues.

publicité
> avast! Antivirus Gratuit
La nouvelle version est à télécharger en exclusivité sur Telecharger.com

classement FAI
Retrouvez chaque semaine le classement des fournisseurs d'accès avec ip-label 1 Numericable 2 Free 3 Bouygues Telecom > Plus de détails
offres d'emploi
Logiciel : Avira Antivir Premium
Une protection complète pour surfer tranquille.

Service 01net
Newsletters 01net
abonnez vous gratuitement !
  
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2010 Groupe 01 - 01net.