Passer au contenu

Apprenez à lire à votre scanner

Extraire le texte d’un document numérisé, cela peut se faire avec un logiciel… ou un service en ligne ! La rédaction de Micro Hebdo en a testé quatre. Verdict.

La reconnaissance optique de caractères, ou OCR en anglais, est une technique qui consiste à extraire au format texte le contenu de pages numérisées. L’image (au format Jpeg, BMP ou Tif) générée par le scanner ou, à défaut, prise avec un appareil photo numérique est analysée par le logiciel d’OCR pour en identifier les lettres et donc le texte. Ainsi le fichier résultant peut être retravaillé avec un traitement de texte.De nombreux programmes d’OCR existent, performants mais coûteux (Omnipage, Abby Fine Reader, etc.). On les trouve souvent en version basique ou limitée dans le temps avec un scanner ou une imprimante multifonction que l’on vient d’acquérir. L’idée, c’est de vous pousser à passer à la version complète payante. Mais, depuis quelques années, des services en ligne commencent à leur faire concurrence. Ils s’avèrent relativement efficaces, même s’ils ne sont pas tout à fait du même niveau que les logiciels achetés dans le commerce. Si vous avez besoin d’éditer rapidement un texte imprimé (lettre, article de presse, document au format PDF, ou bien pages d’un livre) pour l’envoyer par mail, le modifier ou l’inclure dans une thèse ou un rapport, les logiciels en ligne présentés ici vous rendront un fier service.

Le choix de l’OCR selon vos exigences

Leur utilisation très simple est à la portée d’un débutant, même si leur interface est en anglais (lire l’encadré). Leur faire une confiance aveugle serait néanmoins une erreur. En effet, il n’est pas rare qu’ils butent sur quelques caractères accentués (qu’ils soient français ou pas). De plus, ils ne sont associés à aucun dictionnaire grammatical (comme leurs grands frères), ce qui les prive ainsi d’une garantie supplémentaire pour un travail de qualité. Surtout, tous n’identifient pas les images en tant que telles et vont jusqu’à les traduire en caractères !Si vous utilisez ces services ponctuellement, ces inconvénients ne seront pas trop gênants. En revanche, si vos besoins sont bien plus importants et que vous souhaitez vous lancer dans la gestion électronique de documents, dans la numérisation de toutes vos archives personnelles ou de documents particulièrement volumineux, ces services se révéleront un peu justes. Dans ce cas, un logiciel OCR digne de ce nom s’avérera vraiment indispensable

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Cyril Valent