Passer au contenu

Comment le système de reconnaissance déchiffre le texte

1. L’impulsion de départLa reconnaissance d’écriture commence par une étape purement ‘ morphologique ‘ : la perception des formes. Ces dernières sont celles tracées au stylet…

1. L’impulsion de départ

La reconnaissance d’écriture commence par une étape purement ‘ morphologique ‘ : la perception des formes. Ces dernières sont celles tracées au stylet par l’utilisateur sur l’écran tactile du Palm ou du Pocket PC, ou sur la partie de l’écran réservée à cela.L’appui de la pointe du stylet crée en fait une petite impulsion électrique de très faible voltage détectée par l’écran, plus précisément par deux de ses couches supérieures : les couches ‘ résistives ‘. Grâce à quatre petits circuits électriques situés sur les côtés, elles évaluent la position verticale puis horizontale du point d’impulsion. Ces mesures représentent les coordonnées des différents points du tracé. Elles sont effectuées plusieurs dizaines de fois par seconde, puis transmises à un convertisseur analogique-numérique qui les transmet au circuit de reconnaissance.

2. Du geste au vecteur

Les coordonnées des différents points d’impulsion sont analysées par un petit logiciel spécifique qui les ‘ vectorise ‘ ­ c’est-à-dire qui retrace le cheminement du stylet depuis son point de départ grâce à des repères. Cette analyse se fait au travers d’une grille de points, un peu comme les cases de la bataille navale. Par exemple, si le programme détecte que l’impulsion débute dans la case ‘ A1 ‘, puis continue en ‘ B2 ‘, puis en ‘ C3 ‘, il va en conclure que l’utilisateur est en train de tracer une ligne diagonale à 45?’ vers le bas. S’il détecte ensuite que l’impulsion remonte en ‘ D2 ‘ puis en ‘ E1 ‘, il conclura que l’utilisateur vient de tracer le symétrique du premier trait, vers le haut :En fait, à chaque fois que le stylet ‘ croise ‘ une case, le programme note l’information. A ce stade, il s’agit de données brutes qui sont les mêmes quel que soit le système. Elles ne sont pas encore converties en caractères. Le logiciel les analyse ensuite selon ses subtilités propres, telles que les ont voulues ses concepteurs. Le dessin que nous venons d’effectuer forme certes un angle à 90?’, peut être vu comme un chapeau renversé, mais dans le cadre d’un programme de reconnaissance d’écriture, il y a de fortes chances pour qu’il soit analysé comme la lettre V.

3. L’analyse et la retranscription

Le moteur de reconnaissance examine les différents vecteurs ou chaînes de vecteurs détectés. Il les compare alors à sa base de données, de manière différente selon qu’on lui demande d’effectuer de la reconnaissance de blocs ou d’écriture manuscrite.Le mouvement du stylet est la clé de la reconnaissance. Dans le cadre d’une reconnaissance de blocs, comme avec le système Graffiti des Palm, il est demandé à l’utilisateur de se conformer au standard d’écriture du logiciel. Ce dernier attend des vecteurs précis et limités. Peu de place est laissée à l’approximation, un T doit être tracé de telle manière, un E de telle autre et c’est tout. Cela nécessite donc un temps d’apprentissage plus ou moins long. Avec Graffiti, c’est généralement assez rapide.Avec la reconnaissance manuscrite, c’est le logiciel qui a auparavant dû apprendre la façon d’écrire des humains. Sa base de données peut regrouper plusieurs centaines de manières de dessiner chaque lettre ou chaque signe de ponctuation. Il y a des écritures droites ou penchées, arrondies ou anguleuses, séparant bien ou mal les mots, laissant ou non des espaces à l’intérieur des mots, etc. Le logiciel en tire une sorte de ‘ moyenne ‘, et y compare le tracé de l’utilisateur. Bien sûr, un peu d’application est nécessaire. Mieux vaut, par exemple, écrire plus gros que la normale, en utilisant toute la zone réservée à cet effet. Plus la forme est grande, moins les erreurs de reconnaissance sont possibles.Si le moteur de reconnaissance est bien conçu, il doit également être capable de mémoriser la façon dont vous écrivez, afin de limiter le risque d’erreurs par la suite. Transcriber, le système de reconnaissance d’écriture manuscrite des Pocket PC, soumet à l’utilisateur lors de sa première utilisation plusieurs exemples de tracé de chacune des lettres. L’utilisateur peut alors indiquer au logiciel lequel de ces tracés est le plus proche de sa façon d’écrire.

4. Les spécificités françaises

Les particularités de la langue française rendent le travail des systèmes de reconnaissance plus complexe qu’avec des langues comme l’anglais, notamment à cause des accents. Aujourd’hui, la reconnaissance d’écriture manuscrite intègre très bien ces subtilités, mais c’est moins le cas pour la reconnaissance de blocs. Que ce soit avec Graffiti ou la reconnaissance de blocs des Pocket PC, il faut écrire les caractères accentués de façon spéciale. Cela consiste à d’abord saisir le tracé correspondant à la lettre souhaitée, puis, à côté ou au même endroit sur la zone de tracé, à saisir un tracé particulier indiquant l’accent que vous souhaitez voir placé sur cette lettre. Le principe est le même pour la ponctuation ou pour basculer de minuscules en majuscules

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Emmanuel Genty