Issue des travaux de l'ISO en 2002, la norme Isan (International Standard Audiovisual Number) doit simplifier les échanges dans l'industrie audiovisuelle. Cela en attribuant un numéro d'identification mondial unique à chaque oeuvre cinématographique ou audiovisuelle. Organisme créé en 2003, l'Isan-IA (Isan International Agency) s'est attelée à la codification de l'existant. Une tâche difficile, faute de réels standards dans la description d'une oeuvre : titres différents (et ne correspondant pas à une traduction fidèle) selon le pays, hétérogénéité des dates (de fin de tournage, de copyright, de distribution), etc. Une analyse profonde des données s'impose donc pour éviter d'affecter deux identifiants au même film. Analyse que l'Isan-IA effectue depuis début 2005 avec Qualitystage, d'Ascential (rebaptisé Websphere Qualitystage depuis le rachat d'Ascential par IBM en mars).
L'agence s'appuie en partie sur une base déjà constituée par l'Association de gestion internationale collective des oeuvres audiovisuelles (Agicoa), l'un de ses organismes fondateurs. Pour le reste, la demande d'enregistrement d'une oeuvre est effectuée par les producteurs sur le mode déclaratif. Et cela par un formulaire en ligne, l'envoi d'un fichier XML, ou l'interfaçage de leur système avec celui de l'Isan-IA via un service web.
Stockée dans une base intermédiaire, la nouvelle entrée est d'abord « nettoyée » des données jugées inutiles (pronoms, particules...). Les données restantes sont ensuite comparées aux enregistrements de la base selon de multiples critères, avec un souci d'automatisation maximum (un outil de traduction des titres est notamment en cours de développement).
195 Mo pour décrire 200 000 oeuvres
« Il existe 10 000 façons de définir une oeuvre, note Reshad Moussa, coordinateur des systèmes et des technologies de l'Isan-IA. C'est ce qui rend notre travail si complexe. » Représentant déjà 195 Mo pour décrire 200 000 oeuvres (avec un objectif de 500 000 pour la fin 2006), la quantité des données stockées à comparer à la nouvelle entrée va générer des traitements de plus en plus lourds. La capacité de Qualitystage à fonctionner en cluster, et donc à monter en charge, s'est ainsi avérée un critère de choix déterminant. Mais il n'a pas été le seul : « Le produit universel pour gérer la qualité des données en particulier dans l'univers de l'audiovisuel n'existe pas, souligne Reshad Moussa. Qualitystage représentait le meilleur compromis. En outre, Ascential a fait un effort financier et s'est aussi engagé à personnaliser son offre pour notre secteur. »
Qualitystage fournit un score (probabilité que la nouvelle entrée soit un doublon). S'il est inférieur à 30 %, l'Isan-IA affecte un numéro Isan (au format 0000-0000-0000-0000-X) à l'oeuvre et l'enregistre dans la base. S'il se situe entre 30 et 60 %, le déclarant est sollicité pour déterminer s'il s'agit d'un doublon. S'il est supérieur à 60 %, un membre de l'équipe vérifie qu'il est en présence d'un doublon et rejette l'entrée. L'objectif est d'améliorer l'outil pour diminuer la proportion de cas générant un score entre 30 et 60 %.
Activité :
référencement mondial d'oeuvres audiovisuelles suivant la norme Isan (ISO 15706).
![]()
Siège :
Genève (Suisse).
![]()
Effectif :
5 personnes.
Qualitystage, d'Ascential.
![]()
Ensemble du projet (mise en oeuvre de la base de données, définition du schéma XML, création des services web, interface de consultation, etc.) réalisé par la SSII Cross Systems, pour un équivalent de 350 jours/homme (environ 100 jours/homme pour la seule implémentation de Qualitystage).
Problème de performances corrigé après un audit dû à la prise en compte de trop de données pour les comparaisons.
![]()
Absence de dictionnaire de traduction multilingue au niveau de la fonction de comparaison (en cours de développement).