La base de données dIBM met le cap sur XML natif

Pour ses 25 ans, le serveur de bases de données DB2 passe en version 9, baptisée Viper, et s’offre un sérieux lifting : intégration d’un moteur de stockage XML et du langage de
requêtes XQuery, compression de données, partitionnement de tables. Certaines de ces technologies sont issues des environnements grands systèmes, mais, sur un point au moins, le géant de l’informatique innove complètement.‘ C’est la première base de données hybride relationnelle/XML du marché ‘, affirme Georges Baklarz, du groupe de support avant-vente DB2 d’IBM. Même la concurrence le
reconnaît : ‘ Avec cette version, c’est un grand pas en avant. IBM a fusionné et consolidé des technologies issues de ses divers rachats ‘, concède Renaud Marcadet, chef de produit SQL
Server à Microsoft France.‘ Il existait déjà un certain niveau d’intégration de XML, par le biais d’un extenseur. Mais la méthode consistait plus ou moins à faire entrer des carrés dans des cercles en pliant des éléments XML
à une structure relationnelle SQL, ce qui avait toujours un coût, en performances ou en fonctionnalités. Nous avons décidé que le moment était venu de passer à un moteur de stockage strictement XML. D’autant plus que les besoins des
entreprises en stockage et en manipulation de documents XML ne cessent d’augmenter ‘, considère Georges Baklarz.Effectivement, les applications clientes (traitement de texte, messagerie) et les serveurs ont adopté XML soit pour structurer les documents, soit pour faciliter les échanges entre applications. Les entreprises regorgent donc de
données XML.Mais XML pose un problème aux SGBD relationnels classiques. La structure des documents XML, fondée sur une arborescence et des balises, ne correspond pas au modèle relationnel. Certains éditeurs ont conçu des bases de
données XML natives (Tamino de Software AG).D’autres ont tenté de stocker les documents XML dans des SGBDR soit comme des objets massifs Blob ou Clob, soit par la technique du ‘ shredding ‘, laquelle consiste à briser le
document XML en fragments capables de rentrer dans des tables relationnelles. Deux méthodes peu satisfaisantes. La première ‘ oblige à remonter les données XML avant d’effectuer la requête SQL et, selon la
volumétrie, cela peut prendre du temps et impacter foncièrement la performance ‘, considère Bastien Keller, consultant pour Team UP.La seconde brise la structure du document XML et lui fait perdre ses propriétés. ‘ Personne n’a encore réussi à résoudre de façon satisfaisante le problème de l’intégration de XML dans une
structure SQL ‘, constate Brian Haker, directeur de l’architecture de MySQL.

De 40 à 70 % d’espace de stockage en plus

La solution d’IBM : installer à côté de son moteur de stockage relationnel un second moteur capable de traiter les documents XML dans leur format natif. Pour les requêtes, le traditionnel SQL (qui dispose
d’extensions XML), cohabitera avec XQuery, un langage de requêtes de documents XML en cours de certification.‘ L’utilisateur voit DB2 V9 comme ça l’arrange, sous l’angle SQL ou avec XQuery, rien n’est imposé ‘,affirme Paul Zikopoulos, membre de l’équipe
Database Competitive Technologies d’IBM. Autre nouveauté de DB2, la Data Row Compression, qui ferait gagner de 40 à 70 % d’espace de stockage.‘ Il s’agit d’identifier des motifs dans une table et de ne stocker les motifs identiques qu’une seule fois par table. La compression a un coût en cycles CPU, elle oblige à décompresser les
données lors de la lecture, mais ce coût est compensé par le gain en entrées-sorties : en compressant, davantage de données tiennent sur une page. La compression initiale a aussi un coût ‘, explique Paul
Zikopoulos.

Oracle en phase avec IBM

Apparaît aussi dans DB2 V9 une technologie de partition de tables (Range Partitionning). Celle-ci permet de découper une table en une série de sous-éléments manipulables de façon indépendante.Une fonction utile, par exemple en décisionnel, pour isoler uniquement les données pertinentes sur lesquelles lancer une analyse. ‘ Ce n’est pas quelque chose de réellement nouveau. Oracle possédait déjà
une technologie de ce type depuis longtemps. Mais c’est une fonction utile pour de très grandes bases de données ‘, considère Georges Baklarz.Oracle accueille DB2 V9 sans angoisse. ‘ C’est une bonne nouvelle, IBM fait des efforts à un moment où beaucoup voudraient faire des bases de données un simple composant technique du système
d’information, alors qu’elles en sont le moteur. Oracle fait du XML depuis des années, donc, de ce côté, nous sommes en phase avec le discours d’IBM ‘, constate Patrick Lemartret, directeur
marketing SGBD pour Oracle.Quant à Matthieu Poujol, de Pierre Audoin Conseil, il considère que ‘ c’est une façon pour IBM de se positionner sur des segments sur lequel il est absent, sur le Web, sur les bases pour PGI et,
globalement, sur les évolutions que connaissent les systèmes d’information [AOS, services Web…, NDLR] ‘. Beau plébiscite pour IBM, mais réserves unanimes : il faudra voir sur le terrain les performances
pour réellement juger.

Un nouveau positionnement pour DB22

Matthieu Poujol, consultantpour Pierre Audoin Conseil : ‘ Viper remet IBM dans la course après deux années un peu creuses, dues en partie à un problème de positionnement, et plus généralement à un marché
déprimé, du fait de la pression des coûts. Sur le marché français, le logiciel libre et Microsoft sont très présents, une de nos spécificités. IBM a la chance d’avoir une large base installée AS/400, donc un marché captif. Avec Viper, il veut
aussi sortir de ce marché et toucher celui des PGI et celui du Web où il est peu présent. Avec cette version, IBM pose aussi une brique d’une offre plus étendue sur le management de l’information et la gestion de contenu au sens étendu
du terme. En ce sens, Viper est un composant d’une offre plus vaste. Reste à voir l’accueil des partenaires, le nerf de la guerre en France. ‘

standards pour XQuery : Stéphane Solomon (spécialiste technologies Web) : ‘ XQuery pourrait remplacer SQL ‘

Quels sont les avantages de passer en XML ?

Techniquement, partir d’un XML natif limitera les conversions nécessaires pour publier du contenu dans tous les formats. Plus globalement, XML garantit des migrations faciles lors d’un changement de bases de données, et
les équipes maîtriseront plus rapidement un projet XML parce que le vocabulaire y est commun. En exploitation, XQuery pourrait remplacer SQL.

Et quels sont les risques ?

Dans le cas de grosses bases de données comportant des dizaines de milliers de lignes, basculer en tout XML risque de ralentir les accès. Les bases de données relationnelles ont optimisé leurs index. Sur de gros volumes, la différence
de performance peut être notable. Le deuxième risque porte surle niveau actuel de standardisation. Le langage d’interrogation XML XQuery utilisé par DB2 n’est pas encore recommandé, mais seulement candidat. Comme pour SQL, une
petite part de la syntaxe restera certainement propriétaire.

intéressant mais complexe : Renaud Marcadet (chef de produit SQL Server) : ‘ des zones d’ombre sur l’administration ‘

‘ Sur le papier, la base est très belle. Le moteur XML dédié devrait lui donner un avantage pour le stockage. En revanche, deux moteurs apportent de la complexité : mixer une requête relationnelle à
XML peut devenir lourd dans des requêtes complexes. Il semblerait aussi qu’il soit impossible de modifier partiellement un document XML enregistré [un des manques de XQuery, NDLR]. L’argument de la compression des
données est fort. Celle-ci rend plus difficile l’indexation, et la compression logicielle n’est pas la plus performante.

De plus, nombre de clients réalisent leur archivage en ligne de manière continue, comment administrer cet archivage avec les deux moteurs ? Idem pour la haute disponibilité, IBM ne détaille pas ce pan de sa base. Reste
l’argument du partitionnement, un challenge pour des bases de données dont le volume est multiplié par deux tous les dix-huit mois en moyenne. Le partitionnement apporte une vraie réponse à cette problématique. Mais avec des zones
d’ombre dans la manière dont cela est administré. ‘

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

Renaud Bonnet et Fabrice Frossard