01net. web avec Google
Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique
Quatre logiciels d'OCR Coralie Cathelinais

[ DES PROGRAMMES QUI ONT DU CARACTÈRE ]
Quatre logiciels d'OCR
Pour changer un document imprimé sur papier en fichier texte sur un PC, il faut un scanner et un bon logiciel de reconnaissance optique des caractères.

Coralie Cathelinais , Micro Hebdo, le 16/05/2005 à 07h00

Vous désirez obtenir, à partir d'un livre ou de tout autre document papier, un fichier de texte que vous pourrez facilement éditer et modifier sur votre PC ? Il existe heureusement un moyen qui évite de devoir tout retaper au clavier. Il faut, tout d'abord, numériser le document avec un scanner. Et faire ensuite appel aux talents d'un logiciel d'OCR (Optical Character Recognition), c'est-à-dire de reconnaissance optique des caractères. A charge pour ce logiciel d'identifier les lettres et symboles présents sur l'image numérisée, puis de les convertir en texte, en tentant de respecter la mise en page et les éléments graphiques.

En général, un logiciel d'OCR d'entrée de gamme est livré avec votre scanner. Si ce n'est pas le cas ou si vous souhaitez un logiciel plus évolué, il faudra investir. Car... le seul logiciel gratuit de notre sélection ne nous a vraiment pas convaincus.

La transcription automatique mise à l'épreuve

Pour déceler points les forts et faibles de ces quatre logiciels, nous leur avons soumis plusieurs documents numérisés avec un scanner. Les tests ont été effectués en mode de transcription automatique, sans avoir recours aux outils de traçage destinés notamment à isoler images et zones d'écritures manuscrites.

Le premier document de test possède une mise en page assez simple réalisée avec Word. Il contient du texte découpé en multiples paragraphes, dans lesquels nous avons pris soin de varier les justifications, de jouer sur les polices et la taille des caractères et d'alterner du texte en gras, italique et surligné. Il comporte aussi un petit tableau. Le deuxième document soumis à l'acuité des logiciels est une page de Micro Hebdo , tirée de la rubrique Logiciels Pas à pas. Sa mise en page, conçue autour de modules de texte enrichis d'images, est plus complexe, donc plus difficile à interpréter.

Dernière épreuve : la retranscription d'une page de petites annonces d'un quotidien. En plus des multiples pavés de texte à la mise en page variée et d'un tableau important, vient s'ajouter une difficulté supplémentaire : une qualité d'impression médiocre, qui peut gêner l'interprétation des caractères.



Recyclez votre mobile
Revendez votre ancien portable pour en acheter un nouveau.

publicité
> Anti-Hacks:
Protège votre ordinateur des hackers et autres tentatives d'intrusion !

classement FAI
Retrouvez chaque semaine le classement des fournisseurs d'accès avec ip-label 1 Numericable2 Darty câble 30Mbps3 Orange > Plus de détails
Espace Emploi

Recherche express

> Les Incontournables :
Web Creator Pro 5
Montez vous-même un site Web de qualité.