Passer au contenu

Blinkx.TV, le moteur de recherche qui prend télé et radio aux mots

Son système de reconnaissance vocale lui permet d’effectuer des recherches en texte intégral sur des émissions de télé et de radio.

L’audiovisuel s’ouvre vraiment à la recherche d’informations. La société américaine Blinkx vient de lancer le moteur de recherche Blinkx.TV, qui permet aux internautes de retrouver des émissions de télé ou de radio durant lesquelles un mot ou une phrase précise a été prononcé.

Chercher ‘ Lance Armstrong ‘ renvoie, par exemple, aux derniers reportages télé de CNN, ABC, Fox News ou Reuters évoquant, ne serait-ce qu’un instant, le nom du champion cycliste. Derrière ce moteur se cache un système de reconnaissance automatique de la parole, capable de transcrire en texte intégral les commentaires associés à des reportages télé ou radio.

‘ La parole est d’abord identifiée et filtrée sur la bande-son de l’émission avant d’être décodée de façon phonétique, explique Suranga Chandratillake, ancien responsable technique du spécialiste anglais de la recherche d’information Autonomy, qui a créé Blinkx en 2003. Lors du traitement du signal, nous parvenons déjà à extraire des voix de mauvaise qualité [des auditeurs témoignant au téléphone par exemple, NDLR]. Ensuite, une succession de technologies brevetées permet de déduire quels sont les mots, puis les phrases qui ont le plus de chance d’avoir été prononcés. Cela fait appel non seulement à des lexiques mais également à des répertoires contenant des séquences de mots fréquemment prononcées. ‘

La qualité de la reconnaissance est renforcée par une autre technologie maison ?” la Context Clustering Technology ?” qui, à partir du contenu textuel tente de déduire le sujet et, par rebond, d’améliorer la reconnaissance. Le texte reconnu est immédiatement indexé par le moteur de recherche et peut ainsi être demandé par les internautes.

Une technologie qui a permis à Blinkx.TV de nouer des partenariats avec nombre de grands diffuseurs anglo-saxons (ABC, CNN, BBC…). Des accords particulièrement nécessaires puisque, au vu de tests rapides, seuls 60 % des requêtes permettent d’obtenir une vidéo de l’émission recherchée, le reste renvoyant soit vers le site de la chaîne de télévision, soit vers des captures d’écran de lémission. A noter que le ‘ monde souterrain ‘ d’Internet n’a pas été oublié. ‘ Nous indexons quelque 150 000 podcasts et videoblogs ‘, affirme Suranga Chandratillake.

Et pour aller au-delà de la recherche d’information, Blinkx.TV a développé parallèlement un service gratuit appelé Smartfeed. A partir de la page de réponse à une requête, un clic sur le bouton Smartfeed permet d’obtenir une adresse Web particulière. Cette adresse est celle d’un fil RSS qui pourra être exploité par n’importe quel internaute. A partir de là, il sera alerté à chaque fois qu’un nouveau reportage indexé par Blinkx répondra à sa requête.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Serge Courrier