Passer au contenu

L’OCR en pratique avec OmniPage 4 SE

OmniPage 4 SE est un logiciel d’OCR offert lors de l’achat de certains scanners et imprimantes multifonctions et qu’on ne peut trouver seul dans le commerce….

OmniPage 4 SE est un logiciel d’OCR offert lors de l’achat de certains scanners et imprimantes multifonctions et qu’on ne peut trouver seul dans le commerce. C’est une version allégée d’OmniPage limitée surtout au niveau des langues reconnues et du type de document supporté.Tous les OCR fonctionnent peu ou prou de la même façon et sont comparables jusque dans leur interface. Les grands principes que nous allons développer dans cette partie pratique pourront donc être appliqués avec d’autres OCR sans aucun problème.

Étape 1 : importation d’un document

Plusieurs types de documents peuvent être reconnus par les logiciels d’OCR. Des images issues d’un scanner au format Tiff, Jpeg ou BMP, des images issues d’un appareil photo numérique ou encore des fichiers PDF dans le cas de logiciels payants.Dans OmniPage SE, seules les images (Jpeg, Tiff, Png, etc.) sont gérées. Vous pouvez les importer dans le logiciel directement depuis un répertoire ou via l’interface de votre scanner compatible Twain via le menu Fichier>importer pages, en cliquant sur Charger des fichiers (dans) la Barre de menu. Vous pouvez aussi déposer tout simplement vos fichiers dans l’interface OmniPage par glisser-déposer.

Étape 2 : aperçu des documents

Les documents apparaissent dans la colonne de gauche sous la forme de miniatures. Cliquez simplement dessus pour vous déplacer d’une page à une autre et pour afficher l’aperçu de la page en grand format dans la fenêtre principale.

Étape 3 : reconnaissance automatique

Sélectionnez le ou les documents à reconnaître en mettant les miniatures en surbrillance (maintenez la touche Ctrl en cliquant pour ajouter des pages à votre sélection). Puis cliquez sur Exécuter l’OCR. Les pages sont analysées automatiquement. Dans la plupart des cas, ce mode automatique suffit amplement.

Étape 4 : vérification

A la fin de l’analyse, OmniPage lance son interface de vérification. Cette étape permet de réparer d’éventuelles erreurs de reconnaissance. En haut de cette boîte de dialogue, l’image du document original. Au centre, une fenêtre d’édition avec le texte tel qu’OmniPage l’a reconnu. En bas, des suggestions de remplacement. Lorsque le programme a un doute sur un mot ou un caractère, il l’affiche en rouge. Plusieurs solutions sont alors possibles. S’il ne s’est pas trompé, vous pouvez cliquer sur Ignorer ou Ignorer toujours (cela évite que la même erreur soit signalée ailleurs dans le texte). S’il s’est effectivement trompé, il pourra vous proposer des suggestions de remplacement. Si la bonne est dans la liste, sélectionnez-la, puis cliquez sur Remplacer ou Remplacer tout pour appliquer la correction à l’ensemble du document. Vous pouvez enfin corriger manuellement l’erreur : dans la fenêtre d’édition, sélectionnez le texte en rouge et saisissez à la place le bon mot ou caractère, puis cliquez sur Remplacer ou Remplacer tout.

Étape 5 : apprentissage

Les logiciels d’OCR sont capables de progresser. Lors de la vérification du texte, vous pouvez en effet enrichir leur bibliothèque de mots ou de caractères pour éviter qu’un même signalement d’erreur ne se reproduise. Pour apprendre un nouveau mot (un nom propre, par exemple) à OmniPage, il faut cliquer sur Ajouter lorsque vous êtes dans la fenêtre de vérification. Dans la fenêtre qui s’ouvre, cliquez sur Nouveau pour ajouter un dictionnaire personnalisé, nommez-le, puis fermez. Pour des modifications ultérieures de ce dictionnaire, il faudra se rendre au menu Outils > dictionnaire utilisateur.

Étape 6 : exportation

Une fois vos documents corrigés, il ne vous reste qu’à les exporter au format de votre choix. Cliquez sur Enregistrer dans un fichier. Dans le menu déroulant, choisissez votre format (attention, certains sont indisponibles car réservés à la version complète d’OmniPage). Sélectionnez la mise en page “ true page ” pour garder une mise en page proche du document d’origine. Pour que toutes les pages soient exportées dans un même document, sélectionnez-les toutes dans la colonne de gauche (Ctrl + A )avant d’enregistrer.

Étape 7 : l’OCR manuel

Sur certains documents aux mises en page complexes, mêlant texte, images et tableaux (page de magazine par exemple), il se peut qu’OmniPage commette des erreurs dès l’étape de reconnaissance des blocs. Dans ce cas, il faudra les définir manuellement avec la Barre d’outils verticale située dans la fenêtre d’image.Pour tracer un bloc, munissez-vous de l’outil symbolisé par la lettre “ a ”. Une fois les contours du bloc définis, faites un clic droit, puis, dans le menu Type de zone, indiquez s’il contient du texte, un tableau ou une image (graphique). Rendez-vous ensuite dans le menu Exécuter l’OCR, choisissez Personnalisé puis, relancez l’analyse de la page.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


La rédaction