Passer au contenu

Reconnaissance optique et réalité augmentée

Reconnaissance optique : œil de lynxLa reconnaissance optique n’est pas une technologie récente. Sa mise en œuvre dans le cadre de la transformation de documents en…

Reconnaissance optique : œil de lynx

La reconnaissance optique n’est pas une technologie récente. Sa mise en œuvre dans le cadre de la transformation de documents en textes informatiques grâce à un logiciel spécifique et un scanner, appelée reconnaissance optique de caractères (ou OCR), est connue depuis longtemps du grand public. Dès les années 1960-1970, les services postaux américains utilisaient cette technique pour accélérer le tri du courrier.

En pratique, les documents sont tout d’abord numérisés, puis le logiciel analyse les formes des lettres et des chiffres, et les compare avec ceux d’une base de données pour reconstituer le texte. Ce principe de reconnaissance de formes a pu être transposé aux images, que l’on peut identifier par analyse de leur forme, mais aussi de leur couleur. Grâce à l’intégration de cette technologie et à l’évolution des capteurs photo des smartphones, ceux-ci se transforment désormais en lecteur de codes-barres ou de flashcodes, en scanner OCR ou même en moteur de recherche visuelle. Pour vous en convaincre, il suffit de taper ces mots-clés dans le champ de recherche de l’AppStore ou de l’Android Market.

Réalité augmentée : le sixième sens ?

La réalité augmentée, c’est la superposition d’images virtuelles à des images bien réelles, dans le but d’apporter un supplément d’information. Pour que l’œil humain ait la sensation que les deux mondes ne font qu’un, les images superposées doivent respecter les conditions de prise de vue des images réelles, notamment en ce qui concerne la distance et la position des objets, l’angle de la prise de vue, l’éclairage et la perspective de l’image. 

Pour y arriver, les logiciels proposant de la réalité augmentée utilisent différentes techniques. Par exemple, des repères placés dans la scène réelle qui permettent de positionner l’objet virtuel, ou la mémorisation à l’avance de tous les paramètres de la caméra (points de départ et d’arrivée, vitesse, distance focale, etc. ). Les publicités incrustées dans la pelouse des terrains lors de retransmissions sportives en sont peut-être la meilleure illustration. Pour en revenir au mobile, les développeurs ont eu l’idée géniale de combiner les instruments de géolocalisation et de positionnement dans l’espace des smartphones (GPS, boussole et accéléromètre) avec l’image réelle fournie par le capteur de l’appareil photo pour créer tout un tas d’applications plus étonnantes les unes que les autres. Retrouver sa voiture, une station de métro ou un restaurant, non plus grâce à un plan mais en regardant l’écran de votre téléphone est désormais chose possible !

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Benjamin Gourdet