Passer au contenu

L’indexation en langage naturel

Les moteurs d’indexation en langage naturel s’appuient sur le sens des mots pour fournir des résultats pertinents.

Les moteurs d’indexation en langage naturel effectuent une analyse sémantique des pages web pour dégager les principaux concepts qu’elles contiennent. Ils s’appuient pour cela sur un corpus de concepts associés les uns aux autres, quelle que soit la langue utilisée. Par exemple, ” internet ” sera associé à ” navigateur “, alors que l’étymologie de ces deux mots n’a rien à voir. En scrutant la page à indexer, le ” crawler ” dresse une carte de la densité des différents concepts présents, et, surtout, du poids des liens qui les unissent. Ainsi, une page qui associe fortement des concepts comme ” internet “, ” navigateur ” et ” mer ” sera plutôt classée dans la catégorie ” internet “. Si la densité des concepts ” mer ” et ” navigateur ” était plus importante, la page serait classée dans la catégorie ” nautisme “. La requête de l’utilisateur est traitée de la même façon afin d’extraire le sens de la question et de fournir à l’internaute les textes comportant les concepts qui l’intéressent.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Frédéric Bordage