Passer au contenu

La base de données dIBM met le cap sur XML natif

La version 9 de DB2 intègre un second moteur de stockage pour traiter nativement des documents XML. D’autres améliorations concernent la compression des données et le partitionnement des tables.

Pour ses 25 ans, le serveur de bases de données DB2 passe en version 9, baptisée Viper, et s’offre un sérieux lifting : intégration d’un moteur de stockage XML et du langage de
requêtes XQuery, compression de données, partitionnement de tables. Certaines de ces technologies sont issues des environnements grands systèmes, mais, sur un point au moins, le géant de l’informatique innove complètement.‘ C’est la première base de données hybride relationnelle/XML du marché ‘, affirme Georges Baklarz, du groupe de support avant-vente DB2 d’IBM. Même la concurrence le
reconnaît : ‘ Avec cette version, c’est un grand pas en avant. IBM a fusionné et consolidé des technologies issues de ses divers rachats ‘, concède Renaud Marcadet, chef de produit SQL
Server à Microsoft France.‘ Il existait déjà un certain niveau d’intégration de XML, par le biais d’un extenseur. Mais la méthode consistait plus ou moins à faire entrer des carrés dans des cercles en pliant des éléments XML
à une structure relationnelle SQL, ce qui avait toujours un coût, en performances ou en fonctionnalités. Nous avons décidé que le moment était venu de passer à un moteur de stockage strictement XML. D’autant plus que les besoins des
entreprises en stockage et en manipulation de documents XML ne cessent d’augmenter ‘,
considère Georges Baklarz.Effectivement, les applications clientes (traitement de texte, messagerie) et les serveurs ont adopté XML soit pour structurer les documents, soit pour faciliter les échanges entre applications. Les entreprises regorgent donc de
données XML.Mais XML pose un problème aux SGBD relationnels classiques. La structure des documents XML, fondée sur une arborescence et des balises, ne correspond pas au modèle relationnel. Certains éditeurs ont conçu des bases de
données XML natives (Tamino de Software AG).D’autres ont tenté de stocker les documents XML dans des SGBDR soit comme des objets massifs Blob ou Clob, soit par la technique du ‘ shredding ‘, laquelle consiste à briser le
document XML en fragments capables de rentrer dans des tables relationnelles. Deux méthodes peu satisfaisantes. La première ‘ oblige à remonter les données XML avant d’effectuer la requête SQL et, selon la
volumétrie, cela peut prendre du temps et impacter foncièrement la performance ‘,
considère Bastien Keller, consultant pour Team UP.La seconde brise la structure du document XML et lui fait perdre ses propriétés. ‘ Personne n’a encore réussi à résoudre de façon satisfaisante le problème de l’intégration de XML dans une
structure SQL ‘,
constate Brian Haker, directeur de l’architecture de MySQL.

De 40 à 70 % d’espace de stockage en plus

La solution d’IBM : installer à côté de son moteur de stockage relationnel un second moteur capable de traiter les documents XML dans leur format natif. Pour les requêtes, le traditionnel SQL (qui dispose
d’extensions XML), cohabitera avec XQuery, un langage de requêtes de documents XML en cours de certification.‘ L’utilisateur voit DB2 V9 comme ça l’arrange, sous l’angle SQL ou avec XQuery, rien n’est imposé ‘,affirme Paul Zikopoulos, membre de l’équipe
Database Competitive Technologies d’IBM. Autre nouveauté de DB2, la Data Row Compression, qui ferait gagner de 40 à 70 % d’espace de stockage.‘ Il s’agit d’identifier des motifs dans une table et de ne stocker les motifs identiques qu’une seule fois par table. La compression a un coût en cycles CPU, elle oblige à décompresser les
données lors de la lecture, mais ce coût est compensé par le gain en entrées-sorties : en compressant, davantage de données tiennent sur une page. La compression initiale a aussi un coût ‘,
explique Paul
Zikopoulos.

Oracle en phase avec IBM

Apparaît aussi dans DB2 V9 une technologie de partition de tables (Range Partitionning). Celle-ci permet de découper une table en une série de sous-éléments manipulables de façon indépendante.Une fonction utile, par exemple en décisionnel, pour isoler uniquement les données pertinentes sur lesquelles lancer une analyse. ‘ Ce n’est pas quelque chose de réellement nouveau. Oracle possédait déjà
une technologie de ce type depuis longtemps. Mais c’est une fonction utile pour de très grandes bases de données ‘,
considère Georges Baklarz.Oracle accueille DB2 V9 sans angoisse. ‘ C’est une bonne nouvelle, IBM fait des efforts à un moment où beaucoup voudraient faire des bases de données un simple composant technique du système
d’information, alors qu’elles en sont le moteur. Oracle fait du XML depuis des années, donc, de ce côté, nous sommes en phase avec le discours d’IBM ‘,
constate Patrick Lemartret, directeur
marketing SGBD pour Oracle.Quant à Matthieu Poujol, de Pierre Audoin Conseil, il considère que ‘ c’est une façon pour IBM de se positionner sur des segments sur lequel il est absent, sur le Web, sur les bases pour PGI et,
globalement, sur les évolutions que connaissent les systèmes d’information
[AOS, services Web…, NDLR] ‘. Beau plébiscite pour IBM, mais réserves unanimes : il faudra voir sur le terrain les performances
pour réellement juger.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Renaud Bonnet et Fabrice Frossard