3. Exploiter des données stockéesXQuery et XPath faciliteront l'accès à l'information

Extraire, insérer ou interroger des informations en XML suppose une maîtrise de la structure du document afin de comprendre le vocabulaire et la syntaxe utilisés, et de pouvoir l’exploiter en conséquence. La plupart des éditeurs de bases de données proposent des outils de développement adaptés à cette particularité, outils que l’on retrouve également chez WebGain avec TopLink ou Ilog avec JRules. Deux approches coexistent qui utilisent les interpréteurs ou les langages de requête, mais elles ne sont pas concurrentes, les interpréteurs étant les seuls à permettre la création de documents. Ils sont utilisés pour les interrogations uniquement parce que les langages de requête propres à XML ne sont pas encore finalisés.

Des parsers efficaces, mais qui ralentissent les traitements

La plupart des bases de données, relationnelles ou natives XML, sont dotées d’analyseurs syntaxiques, également appelés interpréteurs (parsers). Accessibles à l’aide d’interfaces de programmation par des composants Java (servlets), en Perl, C et C++, voire en PL/SQL pour IBM, ils analysent la structure du document. Grâce à ces interpréteurs, il est donc possible d’effectuer une recherche dans des informations stockées en XML, d’extraire des données qui iront “remplir” le composant Java, par exemple, et ensuite d’alimenter l’application qui a effectué la requête. L’inverse est également vrai : les données saisies par un utilisateur dans un navigateur, par exemple, seront “portées” par le composant Java qui appellera le parser avant d’insérer les modifications dans les documents.Il existe deux principales catégories d’interpréteurs : DOM (Document Object Model) et SAX (Simple API for XML). Les premiers sont capables de lire et d’écrire dans un document XML tandis que les seconds sont limités à la lecture. Autre différence importante, qui a des répercussions directes sur les temps de réponse et les ressources nécessaires à l’exécution d’une requête : un interpréteur DOM lit l’intégralité du document avant d’effectuer une opération, là où SAX fonctionne de manière séquentielle. Dans tous les cas de figure, interpréter un document avant de l’interroger, quelle que soit la méthode, ralentit forcément le fonctionnement de l’application qui attend sa réponse, qu’il s’agisse d’un navigateur web, d’un serveur d’intégration B-to-B, etc.C’est la raison pour laquelle les éditeurs, soutenus par le W3C, travaillent à l’élaboration de langages de requête propres à XML qui permettraient d’extraire des informations des documents XML d’une façon assez semblable à celle de SQL. Après de nombreuses initiatives concurrentes, deux normes complémentaires semblent se dégager. La première, XPath, est ratifiée et implémentée par de nombreux éditeurs, et la seconde, XQuery, est en cours de définition.Mais l’utilisation d’un moteur XPath ou d’un moteur XQuery suppose que ce dernier connaisse la structure du document XML, soit sa DTD ou son schéma. Les spécifications de XML schéma n’ayant été définitivement ratifiées qu’en mai dernier, aucun éditeur de solution de stockage en XML n’a encore implémenté cette norme, pourtant indispensable pour atteindre le niveau de finesse des requêtes SQL avec XQuery, et surtout faciliter les échanges électroniques dans le cadre du B-to-B.

Les langages de manipulation d’informations XML

XPath 2.0 (XML Path Language), ratifié en novembre 1999 (v. 2.0 en cours de finalisation). Utilisé par XSLT et faisant partie de l’initiative XML Query qui regroupe tous les outils de requêtes XML, XPath est un langage de requête qui utilise une syntaxe semblable à celle de l’adresse d’un système de fichiers ou une URL du web. XPath effectue des requêtes intégrant des opérations booléennes ou des attributs de valeur, mais ses expressions restent limitées à des requêtes simples en termes de typage des données.

XQuery 1.0 est en cours de finalisation. Comme XPath, XQuery fait partie de l’initiative XML Query et permet d’élaborer des requêtes plus complexes que XPath, langage sur lequel il se fonde. Considéré comme un langage hybride à mi-chemin entre XPath et SQL, XQuery permet de faire des requêtes imbriquées contenant des expressions FLWR (elles assignent des valeurs à une ou plusieurs variables utilisées pour livrer un résultat).

XSLT 1.1 (eXtensible Stylesheet Language Transformations) ratifié en novembre 1999 (v. 2.0 au stade de document de travail). Langage de transformation basé sur XPath et XSL pour extraire et transformer des données afin de les adapter aux caractéristiques d’affichage d’un périphérique, créer un document XML à partir d’un contenu XML existant, etc.

XSL 1.0 (eXtensible Stylesheet Language), ratifié en septembre dernier. XSL n’attaque pas une base de données directement, mais s’intéresse plus spécifiquement à la présentation des données extraites d’une base à l’aide de XPath, par exemple, puis transformées par XSLT qui s’appuie sur la feuille de style XSL pour élaborer la présentation d’un nouveau document.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Marie Varandat