Passer au contenu

SIR 3.0 cherche le sens caché des documents

Le logiciel de gestion de contenu de Profium se fonde sur les métadonnées et la sémantique des documents pour gérer leur recherche et leur publication.

La gestion de contenu sera sémantique ou ne sera pas. C’est du moins l’ambition de l’éditeur Profium qui présente la version 3.0 de son logiciel de gestion de documents, Smart Information Router (SIR).Fondé sur le langage Resource Description Framework (RDF), qui permet de décrire les métadonnées d’un contenu suivant la syntaxe XML, SIR assure trois types de traitements : la définition de métadonnées à partir des documents filtrés par la solution (documents HTML, XML, Office, etc.), leur stockage vers des bases de données relationnelles compatibles JDBC et leur publication multisupport. Celle-ci pourra s’opérer au format HTML, WML, SMS ou XML natif grâce à des feuilles de style. Enfin, Smart Information Router prend en charge la recherche de documents, en s’appuyant sur ces métadonnées.

Des requêtes basées sur les “motifs d’information”

En termes de nouveautés, SIR 3.0 affine son exploitation du langage RDF. Auparavant, la plate-forme autorisait essentiellement la recherche de contenus suivant des types de ressources génériques : auteur, date de publication, nature d’un contenu, etc. Désormais, SIR permet la recherche de “motifs d’information”
(information pattern). Les requêtes peuvent ainsi tenir compte de la nature des relations existant entre les ressources. Élaborées à l’aide de l’outil de développement Query Editor, elles permettront de localiser une propriété récursive propre à un contenu (ce site a un auteur, cet auteur a un nom, cet auteur possède une page d’accueil…).Autre nouveauté, des jeux d’instructions Java font leur apparition afin de faciliter l’extraction automatique de métadonnées à partir d’en-têtes HTML, ou de balises XML. De plus, l’éditeur livre des adaptateurs destinés à exploiter les informations textuelles intégrées dans les documents audio MP3, les fichiers issus de la suite bureautique Microsoft Office, ou ceux au format Adobe XMP (Extensible Metadata Protocol, basé sur RDF).

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Francisco Villacampa