Sous la responsabilité du directeur du Computer Human Interaction Center (Chic) au SRI, Luc Julia, une petite équipe de chercheurs a mis au point un système appelé Multimedia Annotation and Enhancement via Synergy of Technology and Reviewing Operators (Maestro). Lequel Maestro fait intervenir séparément différentes techniques, tout en permettant des analyses croisées des données indexées.
Parmi les techniques utilisées, on retrouve la reconnaissance vocale, la reconnaissance de l’écriture (OCR), la reconnaissance de formes, de sons ou l’analyse de l’image. La reconnaissance de la parole identifie par exemple un certain nombre de mots-clés prononcés, puis un analyseur de texte répertorie tous les textes ou sous-titres apparaissant à l’image. L’analyse de l’image permet d’identifier des personnes ou des objets.
Il faut environ six heures pour analyser une séquence vidéo d’une heure, à partir dune dizaine de critères. Toutes les données sont indexées et peuvent être retrouvées à la demande, en croisant les critères de sélection.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

