Passer au contenu

OCR

Reconnaissance et recodage de caractères existant sous forme graphique sur un support papier ou fichier.

Sigle de Optical Character Recognition (reconnaissance optique de caractères).La reconnaissance optique de caractères permet de convertir, sous forme de texte informatique, des documents qui n’existent à l’origine que sur papier ou support graphique analogue.Cette opération exige, en général, deux phases : la numérisation de l’image du document, à l’aide d’un scanner ; puis, dans cette image graphique, la reconnaissance des formes des caractères.Ce sont des logiciels spécialisés d’OCR qui se chargent de cette tâche. Pour cela, ils s’appuient d’abord sur des centaines de formes de caractères auxquelles ils comparent les caractères du document à traiter.Ils exploitent ensuite des règles syntaxiques et des lexiques propres à chaque langue traitée afin de résoudre les incertitudes planant sur certains caractères du document, en examinant les caractères environnants.A l’issue du traitement d’OCR, le contenu du document dorigine est disponible sous forme de fichier texte codé en ASCII ou Unicode et manipulable comme les autres fichiers texte.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Lionel Lumbroso