Passer au contenu

Bientôt les caméras de surveillance prédiront l’avenir

Des chercheurs américains ont mis en place un système cognitif capable d’analyser les actions filmées par une caméra et d’en prédire les conséquences. Un outil qui pourrait être utilisé par l’armée et par la société civile.

Quand la science-fiction s’invite dans les recherches universitaires, les yeux électroniques des caméras de surveillance sont non seulement capables de suivre tous vos faits et gestes mais peuvent également déterminer quelles seront vos actions à venir.

Des chercheurs en psychologie de la Carnegie Mellon University en Pennsylvanie ont mis en place un logiciel qui analyse et classe les différentes actions filmées par une caméra de surveillance. Il est parti intégrante du programme DARPA Mind’s Eye, destiné à créer des caméras intelligentes capables de décrire par des mots un environnement hostile ou d’indiquer pourquoi elle ne peut pas filmer.

Un projet du Darpa

L’objectif de ce nouveau programme est « de démêler le contexte d’une scène, de faire la différence entre les différents types d’actions humaines pour, en définitive, en prédire les conclusions », lit-on dans compte-rendu du rapport publié (PDF) par les deux chercheurs, Alessandro Oltramari et Christian Lebiere.

Leurs recherches, financées par l’armée, sont concentrées sur la création d’un moteur cognitif pour permettre à une intelligence artificielle d’automatiquement détecter et interpréter les actions d’une personne. Ce qui permettrait de répondre à un des principaux reproches fait aux caméras de surveillance – outre celui d’observer nos moindres déplacements – à savoir qu’elles ne servent pas à prévenir mais sont seulement utiles une fois qu’il est trop tard.

Elements principaux d'une action
Elements principaux d’une action – Elements principaux d’une action

Prédire l’avenir, à la croisée des chemins

Pour autant, la tâche n’est pas simple. « Le domaine de “l’intelligence visuelle” doit être exploré avec une approche interdisciplinaire, qui réunit la psychologie cognitive, la linguistique et la sémantique. Dans ces conditions seulement pourrons nous espérer découvrir la variété des opérations dues à l’intelligence visuelle », écrivent-ils dans le résumé de leur rapport.

Par ailleurs, l’ontologie est au cœur de cette technologie prédictive. Elle est l’un des trois piliers de leur étude. Elle donne même son nom à l’HOMinE, l’Hybrid Ontology for the Mind’s Eye, qui sert à comparer des modèles ontologiques, des événements similaires ou ayant des points communs avec la situation filmée. Chaque séquence est alors décomposée en micro-actions, micro-états et micro-poses. Grâce à ce découpage, il est possible de faire la différence entre quelqu’un qui creuse un trou et quelqu’un qui enterre quelque chose, même si les actions et mouvements requis sont apparemment proches. Vient ensuite ce que les chercheurs appellent le « packaging conceptuel », à savoir l’explicitation de l’action en fonction du ou des rôles joués par les différents éléments à l’écran et leur trajectoire. Enfin, troisième élément, la sélectivité causale, point capital qui permet au système de ne se concentrer que sur l’essentiel et d’éviter le « bruit parasite » des actions qui n’ont pas d’importance.

Utilisations militaires et civiles

Pour les auteurs du document, cette technologie pourrait avoir des répercussions aussi bien militaires que civiles. Elle pose également la question du flagrant délit et de la présomption d’innocence, même si la détection par une caméra d’un événement en amont n’impliquera pas forcément que ce dernier puisse être empêché. Le temps de l’intervention étant toujours irréductible. Autrement dit, la prédiction causale ne revient pas à lire dans une boule de cristal ou à avoir des pouvoirs de précognition. En ce cas, Philip K. Dick aurait, une fois encore, vu juste.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Pierre Fontaine