Passer au contenu

MPEG-7 donne de la mémoire aux contenus multimédias

MPEG-7 définit une norme de description des contenus audiovisuels afin d’en simplifier l’indexation et la recherche.

Accéder plus simplement et plus rapidement par le biais des réseaux aux contenus audiovisuels disponibles sous forme numérique au sein de bases de données. Tel est, en substance, un des multiples objectifs poursuivi par le Moving Picture Expert Group (MPEG) depuis 1996, sous l’égide de l’ISO/IEC. Le groupe de travail devrait publier dans ce sens, courant juillet, la version finale du standard MPEG-7.À la différence des autres standards précédemment mis au point par le MPEG (MPEG-1, MPEG-2 et MPEG-4), MPEG-7, ou encore Multimedia Content Description Interface, ne définit pas la manière dont sont codées les informations. Il normalise un ensemble d’outils de description permettant de définir et d’identifier le contenu de données audiovisuelles : images fixes, vidéo, graphiques, modèles 3D, musique, combinaison de plusieurs de ces éléments, etc. Normalisées et intimement liées au contenu, les descriptions doivent faciliter l’indexation et la recher-che dans les environnements multimédias. Cette norme de description, qui devrait être prise en compte par un certain nombre de logiciels et d’équipements de la chaîne multimédia, propose d’aller bien au-delà des systèmes qui permettent actuellement d’effectuer des recherches sur le contenu. Ceux-ci n’étant, dans la plupart des cas, capables de rechercher une image qu’à partir d’une couleur, d’une forme ou d’une texture. Les outils de description fournis par MPEG-7 sont, en effet, en mesure de préciser un grand nombre d’informations supplémentaires, classées en cinq catégories principales. Elles peuvent bien entendu inclure les informations de bas niveau (couleur, texture, etc. ), mais également de type éditorial (titre d’un film, nom du réalisateur, format, etc. ), d’éventuelles restrictions sur les conditions d’usage (copyright, etc. ), des caractéristiques de stockage (format, codage), de structure spatiale, temporelle ou spatio-temporelle (zone de déplacement d’un objet…).

Plusieurs prototypes sont déjà en fabrication

Dans la mesure où cette norme concerne, en théorie, un grand nombre d’applications et d’environnements, aussi bien dans les domaines professionnels que grand public, un autre objectif fut très naturellement de le rendre aussi souple, ouvert et extensible que possible. D’après le Moving Picture Expert Group, MPEG-7 a été développé, notamment, en tenant compte d’autres projets plus spécifiques, tels que SMPTE, TV-Anytime, EBU P/Meta et Dublin Core. Le choix d’un langage pour description des contenus s’étant porté sur XML Schema, récemment normalisé par le W3C. Dans cette optique, MPEG-7 standardise trois types d’éléments principaux. Les descripteurs (D), d’abord, définissent la syntaxe et la sémantique à utiliser pour représenter les caractéristiques propres du contenu. Ils peuvent être de type visuel pour tout ce qui concerne les caractéristiques de couleur (dominante, histogramme, etc. ), de texture, de forme ou de mouvement (de la caméra, d’un objet, d’une trajectoire, etc. ). Ils peuvent être également de type audio pour définir, par exemple, le timbre d’un instrument, la voix d’un orateur (associé à des métadonnées) ou le rythme et le profil d’une mélodie. Le deuxième type d’éléments standardisés par MPEG-7, les Description Schemes (DS), prédéfinit la structure et le cadre des relations qui seront établies entre différents composants (descripteurs, ou Description Schemes). Le Description Definition Language (DDL), enfin, permet de créer ou de modifier les Description Schemes.Bien que MPEG-7 ne soit pas encore tout à fait finalisé, de nombreux projets d’applications ont d’ores et déjà été lancés depuis plusieurs mois. Ainsi, l’Institut national de l’audiovisuel (INA) participe depuis janvier 1999 au projet ” Architecture globale pour l’indexation et la recherche ” (Agir), en partenariat avec Alcatel CIT, l’Inria, l’Irit, LIP-6 et l’INT. Il s’agit de produire le prototype d’une station de production de descriptions de contenus multimédias conformes à la norme MPEG-7, utilisable pour la mise à disposition de contenus indexés, ainsi que celui d’une station de recherche documentaire multimédia permettant de naviguer dans une base indexée, utilisable pour la production.







































 Les descripteurs de bas niveau utilisés pour caractériser un contenu  
 Type     Caractéristiques     Descripteur (D) 
 Visuel     ? Structures de base 
 ? Couleur 
 ? Texture 
 ? Forme 
 ? Mouvement 
   ? Arrière plan (Grid layout), histogramme 
 ? Couleur dominante, histogramme des couleurs, colorimétrie 
 ? Intensité de l’image dans l’espace, homogénéisation de la structure 
 ? Forme des volumes, formation des contours, description des formes 3D  
 ? Mouvement de caméra, trajectoire de l’objet, mouvement paramétrique 
         
 Audio     ? Parole 
 ? Timbre 
   ? Combinaison de mots et de phonèmes + métadonnées 
 ? Pondération des partiels, cohérence des harmoniques 
 



🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Stéphane Gautier