Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique


écrire à l'auteur imprimer
envoyer par mail
Cet article est extrait de : 01 Informatique

Hebdomadaire stratégique d'actualité, son objectif est d'informer et d'aider les décideurs dans leurs choix de produits et de solutions technologiques.

Découvrez le magazine
Contactez la rédaction
Abonnez vous


Datawarehouse centralisé : une vision unique de l'information
Un datawarehouse centralisé procure à l'entreprise une vision transversale des performances de ses activités. Baisse du coût du stockage, puissance accrue des serveurs de données parallélisées : tout concourt désormais à sa diffusion.

Stéphane Parpinelli , 01 Informatique, le 11/10/2002 à 00h00

Le concept d'entreposage de tous les indicateurs stratégiques de l'entreprise dans un unique réservoir de stockage est né au milieu des années quatre-vingt-dix. Plus de sept ans après, en 2002, les grands préceptes de cette philosophie - le datawarehousing - n'ont pas pris une ride. La quête du Graal suit toujours le même idéal : édifier un entrepôt centralisé a priori de grande taille pour disposer à chaque instant de toutes les informations de détail permettant de mesurer la performance d'une entreprise, grâce à une vision unique et globale. Avec l'avènement des nouveaux modèles tactiques fondés sur la volonté de valoriser la relation client, le datawarehouse centralisé et de gros volume est tout désigné pour fournir une vue à 360 degrés des clients. Pour exemple, l'entrepôt du groupe Casino, bâti sur Teradata, est passé de 80 Go en 1994 à 10 To en 2002. Et il fournit désormais une vision globale et analytique du groupe - relations fournisseurs, achats, ventes, volumes, tris, prix, stocks, etc. - pour tous ses hypermarchés, supermarchés et commerces de proximité.

Des volumes compris en majorité entre 20 et 100 Go

Pourtant, " en France, les gros entrepôts au-dessus du téraoctet ne sont pas légion, indique David Lau Lam, directeur technique de Business & Décision, SSII spécialisée dans le décisionnel. La majorité des datawarehouses présente un volume compris entre 20 Go et 100 Go. " Ces mastodontes sont, pour l'heure, réservés à " des entreprises dont le métier implique un très gros trafic d'opérations élémentaires sur un marché de masse " , explique Jean-Marie Gouarné, directeur technique de la SSII Genicorp. Les télécoms - France Télécom, Bouygues Télécom, etc. -, la banque de détail - Société Générale, etc. -, la grande distribution - Carrefour, Casino, entre autres -, ou encore le secteur public - Cnam, Cnaf, etc. - comptent donc logiquement parmi les premiers utilisateurs de ces gisements de données colossaux.

Mais comment, malgré tout, expliquer leur rareté ? Là, les avis divergent. Pour Jean-Marie Gouarné, " il s'agit d'une raison moins technique que politique : les grands comptes français ne sont pas organisés pour gérer ce type de projets transversaux. Leur culture s'appuie sur la relation maître d'oeuvre-maître d'ouvrage, avec un budget alloué pour un objectif au périmètre bien délimité. " Sur ce point, David Lau Lam estime au contraire que " les entreprises françaises commencent sérieusement à aborder la question d'une vision transversale au travers d'une politique de centralisation. A commencer par celle des achats " . Pour lui, la technologie est une cause importante du retard dans le délai d'adoption de ces gros magasins de données : " Le web a largement favorisé le principe de concentration des informations décisionnelles en un lieu unique. " Et de rappeler que, en 1995 ou 1996, le client-serveur obligeait à restreindre l'accès à l'entrepôt à un faible nombre d'utilisateurs du fait du coût élevé de maintenance des postes clients. Aujourd'hui, dotés d'outils de restitution " webisés " , les usagers sont beaucoup plus nombreux. Et ils peuvent accéder au datawarehouse depuis l'extérieur - filiale, extranet client, etc. Autre élément technique déclencheur : le rapport puissance/prix des machines. Un coût de stockage désormais abordable, allié à des serveurs multiprocesseurs de plus en plus puissants, le tout couplé aux capacités de gestion du parallélisme des dernières bases de données. David Lau Lam affirme alors que " construire un datawarehouse de plusieurs téraoctets ne pose, à présent, plus aucun problème technique majeur " .

Entre quinze et vingt datamarts dans une même entreprise

Or, plutôt que de débuter par la mise en place de datawarehouses centraux, on a souvent préféré une démarche incrémentale, ponctuée par l'implantation de datamarts (base répondant aux besoins d'un département). Gartner estime entre quinze et vingt le nombre moyen de datamarts disséminés dans une même entreprise. Dans une étude signée Lou Agosta de juillet 2002, le Giga estime que la majorité de ces datamarts constitue des îlots d'information - marketing, ventes, achats, etc. - physiquement dispersés et souffrant d'un manque de design cohérent d'entités telles que les clients, les produits, etc. Dans ce cas, le Giga - comme Gartner - recommande fortement de les consolider au sein d'un entrepôt centralisé. Une opération synonyme de bénéfices multiples (voir infographie ci-dessus) : réduction des coûts de licences, de maintenance et d'administration des bases de données, élimination des données redondantes, harmonisation des processus d'extraction, etc. 1990-2000, 2000-2010... D'une décennie à l'autre, du datamart au datawarehouse...


En avril dernier, Gartner a mis à jour son cadran magique portant sur les bases de données taillées pour le datawarehouse. Par rapport à la précédente évaluation de juin 2001, Gartner distingue le système de gestion de bases de données Teradata, classé devant Oracle et IBM DB2, pour ses bonnes capacités techniques dans ce domaine.

Le retour sur investissement (ROI) lié à l'implantation initiale d'un datamart est significatif. Toutefois, ce ROI décroît après chaque itération de ce datamart : le coût d'une nouvelle livraison représente 70 % de celui de la précédente version, quand le ROI baisse de 50 % à chaque nouvelle itération. Dans la plupart de cas, Gartner préconisera une consolidation des datamarts dans un entrepôt centralisé.

classement FAI
Retrouvez chaque semaine le classement des fournisseurs d'accès avec ip-label 1 Numericable 30 Mbps 2 Darty câble 30 Mbps 3 Orange > Plus de détails
Espace Emploi

Recherche express