Passer au contenu

OmniPage Pro 12 Office : de bons résultats après réglages

Le logiciel de ScanSoft offre des performances convenables, une fois les paramètres de mise en forme ou de numérisation affinés.

Le logiciel d’OCR OmniPage Pro 12 Office de ScanSoft offre bon nombre de nouvelles fonctions et, selon l’éditeur, un taux de reconnaissance supérieur de 35 % à celui de la version précédente. Pour évaluer l’apport de ces améliorations, nous avons testé l’application sur un PC doté d’un processeur Athlon à 1,2 GHz avec Windows XP, associé à un scanner HP psc 2210 configuré pour numériser en 300 p/p.S’agissant d’un document Word en noir et blanc sans mise en forme particulière, le logiciel atteint une qualité de reconnaissance parfaite. Il n’en va pas de même pour le tableau Excel numérisé que nous lui avons soumis. Si le taux de reconnaissance des caractères en noir fut convenable, celui des chiffres en rouge s’est révélé assez faible et quasiment nul pour ceux en vert. En outre, la mauvaise retranscription de certaines bordures du tableau a, par exemple, entraîné le débordement d’une cellule remplie de noir sur l’ensemble de la ligne. Le recalage des bordures par la fonction ” Insérer séparation de rangées ” a toutefois permis d’y remédier.

L’affinage passage obligé

L’analyse d’un document publicitaire, à la mise en forme plus libre, s’est révélée ardue. Celui que nous avons soumis à OmniPage Pro 12 Office comportait un tableau dont le contenu n’a pas été reconnu. Là encore, il a fallu passer par les outils d’affinage du logiciel pour obtenir une reconnaissance des caractères convenable. Nous avons achevé nos tests en soumettant une photocopie d’article de presse à l’application. Dans ce cas, l’analyse dépend largement de la qualité de la reproduction. À preuve, les caractères situés dans les zones les plus claires du document ont été mal reconnus, et, pour une raison moins bien identifiée, les caractères en italique aussi. Une seconde numérisation avec un contraste supérieur nous a permis d’augmenter la qualité de la reconnaissance en conservant toutefois des erreurs.La deuxième partie de nos évaluations portait sur les nouvelles fonctions d’OmniPage Pro 12 Office. Parmi elles, une fonction permet de conserver l’enchaînement du texte inséré dans différentes colonnes d’une même page. Ainsi, l’enrichissement du texte d’une première colonne entraîne le déplacement du contenu de la deuxième. Pour gagner du temps, la fonction de numérisation en vis-à-vis permet de reconnaître comme deux éléments distincts deux pages d’un livre dont la taille autorise une numérisation en un seul passage. De même, la fonction ” Zone en direct ” vise à relancer la reconnaissance sur une zone d’un document sélectionnée par l’utilisateur, alors que la version 11 du logiciel impliquait de relancer une analyse intégrale.

De nombreux formats d’enregistrement

Nous avons achevé nos tests par la mise en oeuvre de la fonction ” OCR automatique et continu “. Celle-ci consiste à déclencher automatiquement la reconnaissance des caractères de tout document numérisé inséré dans un dossier préalablement indiqué au logiciel. Le procédé est destiné avant tout à une utilisation en réseau. Notons enfin que ScanSoft a allongé la liste des formats d’enregistrement de documents passés à l’OCR avec, notamment, XML et PDF Édité. Ce dernier permet aux utilisateurs de créer un document PDF non verrouillé sur lequel ils pourront apporter des enrichissements à partir d’Acrobat d’Adobe.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Fabrice Alessi