Au vu des résultats obtenus avec SimpleOCR 3.1, on peut se demander s’il n’est pas plus rapide d’avoir recours à… la saisie des documents. Il est en effet difficile de trouver une ressemblance entre le document original
et celui obtenu après analyse. SimpleOCR ne conserve rien de la mise en page originale. Il ignore les paragraphes, la taille des caractères, les polices, sans compter les nombreuses erreurs de reconnaissance de lettres qui conduisent à une
déformation du sens des mots.Le summum est atteint avec les tableaux : incapable d’identifier les cellules, il les transforme en une suite illogique de lettres, sigles et chiffres. Et les documents ne peuvent être enregistrés qu’en. txt ou
.doc.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

