Passer au contenu

Les outils d’ETL doivent être à la fois ouverts et peu intrusifs

Une solution d’ETL ne réduit l’effort de développement que si son ouverture permet d’en étendre le rôle. Les critères de choix sont à la fois techniques et psychologiques.

Outil d’ETL (Extraction, Transformation and Loading), ou développement spécifique. Tel est le choix initial auquel est confrontée une entreprise voulant transformer et transférer des données entre des sources et des cibles. Le calcul comprend alors une forte variable économique. “Nous aurions pu développer en PL-SQL. Mais l’outil graphique de l’ETL d’Informatica, qui élabore lui-même les requêtes, nous a permis de diviser l’effort par deux”, estime Serge Krywyk, responsable du système décisionnel de Thomson Multimédia. Fabien Normandin, chef de projet ETI chez BNP Paribas, renchérit : “Un outil d’ETL est cher et ne génère aucun gain sur le premier programme. Mais, dès le second, ETI-Extract nous a permis d’économiser 40 % de temps.”

Il doit s’agir d’un outil ouvert

La banque BNP Paribas, Thomson Multimedia, ainsi que la SNCF ont initialement choisi l’ETL pour alimenter des entrepôts de données ?” l’application typique de ce genre d’outils. Mais l’économie est plus importante lorsque l’ETL devient un outil d’infrastructure. BNP Paribas a ainsi étendu le rôle d’ETI-Extract à la création d’interfaces interapplicatives non temps réel et à la migration de données de production. “Il fallait donc que l’outil soit très ouvert. C’est pourquoi nous avons opté pour le seul produit de sa catégorie capable d’invoquer des modules externes et de générer du C et du Cobol”, précise Fabien Normandin. ETI-Extract appartient, en effet, à la famille des ETL distribués, qui génèrent un code exécuté sur chaque cible et source. Contrairement aux outils centralisés, tout aussi ouverts mais fonctionnant sur un serveur intermédiaire dédié qui extrait, transforme et envoie les données.Guidés par des facteurs psychologiques et techniques, des choix opposés d’architecture s’appuient curieusement sur les mêmes arguments. “Le code généré par ETI-Extract peut être transféré sur les systèmes sous OS/390 et inséré dans la chaîne de production, comme n’importe quel programme écrit à la main. Un serveur dédié, lui, aurait été vu comme une boîte noire”, argumente Fabien Normandin. Christian Denis, responsable des études pôle économie et finance à la SNCF, a, au contraire, constaté une réticence de la part des personnels de la production : “Le code généré par ETI-Extract étant perçu comme intrusif, nous avons préféré le mode centralisé de Datastage, dont la mise en ?”uvre rapide nous a, en outre, permis de répondre à l’impatience des utilisateurs.” Il reste que le serveur supportant Datastage ou Powercenter constitue un goulet d’étranglement potentiel. Serge Krywyk l’a constaté : “Nous avons dû réaliser un important travail d’optimisation ?” notamment en parallélisant les traitements et en augmentant la mémoire et le nombre de processeurs ?” afin d’entrer dans une fenêtre de batch limitée à huit heures.”

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Thierry Lévy-Abégnoli