Passer au contenu

Bases de données XML : mode natif ou mode mixte relationnel -XML ?

Les entreprises disposent de peu d’indicateurs fiables pour les aider à choisir le SGBD adéquat pour leurs documents nouvellement mis au format XML.

D’un côté, des SGBD relationnels éprouvés, mâtinés de fonctions externes de stockage au format XML ?” ceux d’IBM et d’Oracle, par exemple. De l’autre, des SGBD respectant l’intégrité de l’arborescence des documents XML, tels ceux de Software AG, d’Openlink, ou encore de X-Hive. Parmi les critères qui poussent vers l’une ou l’autre des approches, figurent la volumétrie du projet ?” performances de traitement du SGBD ?”, la granularité des documents à stocker ?” complexité de l’arbre ?” et la prise en compte de l’existant, applicatif comme culturel. C’est ce dernier point qui a guidé les responsables de la société Eurédit, éditeur de l’annuaire Europages. “Nous avons décidé de nous équiper de Tamino, de Software AG, pour diffuser nos contenus internet, dont notre annuaire, et en gérer l’aspect multilingue “, explique Thierry Cohen-Solal, directeur des systèmes d’information de la société Eurédit.

Le natif, un choix indépendant du volume de données

“Depuis cinq ans, nous utilisons le langage SGML pour structurer nos contenus, mais sous forme de fichiers texte plats. C’est donc tout naturellement que nous nous sommes dirigés vers XML. Et vers une base de données native, plutôt que de passer par du relationnel. En effet, nous ne voulions pas découper nos documents structurés pour les ranger dans des tables et dans des colonnes. Le fait de stocker le document tel qu’il est présente l’avantage de pouvoir conduire facilement des interrogations en XQL à partir de n’importe quel n?”ud. Sa restitution est aussi plus rapide si certains n?”uds sont indexés.”Pour cet annuaire, Eurédit gère un million de documents structurés. Le choix de la base de données native XML n’est pas lié au volume de traitement. “Pour apprécier le critère du volume de traitement des données, il faut tenir compte des règles métier liées à l’application, poursuit Thierry Cohen-Solal. Pour des documents complexes, comme ceux du secteur militaire ou de l’aviation, la solution mixte serait, à mon avis, la plus appropriée. Il faut, en fait, distinguer deux choses : la formalisation des documents en XML et les recherches à effectuer sur ces documents. Tout dépend donc de la complexité des recherches. Le XML natif de bout en bout n’est pas la solution miracle pour toutes les applications.”

La structure des documents est déterminante

Pour les responsables du Forem (service public de l’emploi de la région wallonne, équivalent belge de l’ANPE), l’analyse est quelque peu différente. “Une base de données mixte est plus adaptée pour stocker des documents au format XML lorsque ceux-ci atteignent cinq cents pages et qu’ils contiennent plusieurs rubriques par page, estime Pascal Guarrera, manager de l’information au service public de l’emploi de la région wallonne. Pour notre part, nous avons choisi Tamino pour stocker les curriculum vitae et les offres d’emploi, car les documents n’atteignaient pas un tel niveau de complexité. Ce choix a été précédé d’une année d’analyses et de la prise en compte des détails les plus fins. Nous avons, par exemple, bien préparé la structuration de l’information et bien défini le schéma XML qui décrit les types de données. C’est en fonction de la complexité de la structuration des documents que l’on doit choisir la base de données la plus adéquate.”Chez Ouest-France Multimédia, filiale du groupe Ouest-France, c’est non seulement la prise en compte de l’existant qui a déterminé le choix d’Oracle 8i, mais également sa simplicité d’utilisation, sa robustesse en exploitation et sa capacité à traiter d’importants volumes de données. “Notre structure met en ligne cinq mille documents et mille cinq cents photos, déchargés quotidiennement depuis la base de données relationnelle Sybase qui équipe la maison mère, explique Michel Le Nouy, responsable technique chez Ouest-France Multimédia. Oracle 8i dispose d’un outil capable d’effectuer un transfert massif de ces documents et photos. Par ailleurs, l’éditeur fournit une API réalisant le mapping entre le schéma XML et la structure relationnelle. Ce n’est peut-être pas la solution idéale pour charger des documents rapidement, mais il reste suffisamment performant.”

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Ismaïla Sarr