01net. web avec Google
Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique
[ RÉFÉRENTIEL ]
Gestion de contenu : la fin de la pensée unique
Fini le stockage centralisé. Place au système virtuel, qui rassemble de façon homogène les contenus disséminés dans l'entreprise sans les déplacer.

Vincent Berdot , 01 Informatique (n° 1795), le 17/12/2004 à 00h00

Oui à la gestion de contenu d'entreprise comme moyen de manipuler plus facilement l'information. Non au stockage centralisé des données et des documents. Tel est le verdict des entreprises confrontées à l'éparpillement de l'information. Systèmes de fichiers, référentiels des différents logiciels de gestion documentaire, bases de données, progiciels (PGI, gestion de la relation client, etc.), applications maison... L'information se niche partout. Ce qui complique les recherches et empêche d'avoir une vue homogène d'un sujet. La gestion de contenu étendue à l'entreprise, concept promu en 2002 par Documentum, était censé résoudre tous ces inconvénients. Seulement, son approche centralisatrice du stockage s'est vite révélée illusoire. « J'ai passé dix ans de ma vie à chercher le référentiel idéal. Je ne l'ai jamais trouvé », reconnaissait, beau joueur, le PDG d'Open Text il y a quelques semaines.

Déplacer le contenu : cher et risqué

Même si le référentiel idéal existait, il n'est pas certain que les entreprises l'adopteraient. La centralisation des contenus implique une phase de migration longue et coûteuse. Sans parler des risques bien réels de choc culturel. Aujourd'hui, un autre concept prend le relais : le référentiel virtuel, ou ECI (Entreprise Content Integration). Son principe : référencer les différents contenus de façon normalisée sans les déplacer. Certains de ces outils vont jusqu'à modifier à distance des contenus. Le récent rachat de Venetica par IBM, celui d'Askonce (entité de la recherche française de Xerox) par Documentum l'an dernier, ou encore la sortie de Verity Federator confirment cette orientation. Ces technologies d'à peine trois ans sont aujourd'hui mises en avant par les géants de la gestion de contenu.

Le référentiel virtuel présente deux grandes caractéristiques : il ne stocke ni n'indexe le contenu qu'il décrit. La fonction de recherche reste assurée par chacune des sources pointées. Via des connecteurs, le système d'ECI transmet la requête aux moteurs de recherche des différentes sources de données. Au besoin, il la reformule. Il se comporte comme un métamoteur, mais est capable d'accéder aux ressources internes de l'entreprise, et pas seulement au web. « La couverture d'un référentiel virtuel restera toujours plus étendue que celle d'un moteur de recherche central en entreprise, explique Jérôme Lapous, consultant gestion de contenu chez Unilog. Il y a peu de chances que ce dernier traite les petits intranets conçus par une dizaine de personnes et reposant sur des moteurs de recherche locaux. »

L'ECI ne s'appuie que sur les résultats remontés par chaque source locale. Il bâtit une liste de réponses caractérisées par une adresse pointant vers un contenu et par un mode de description uniforme. A noter que les résultats présentés par le référentiel sont bien souvent volatils. Ils ne restent affichés que le temps de la recherche.

Deux usages : veille et interconnexion

On distingue deux sous-familles de référentiels virtuels. La première répond à des besoins de consultation, la seconde à l'interconnexion de systèmes. L'ECI devient alors le point d'accès à des référentiels différents, voire concurrents. Plus répandue aujourd'hui, la première sous-famille couvre donc les problématiques de consultation au sens large, souvent liées à des activités de veille. C'est dans ce domaine qu'intervient le nouvel outil de Documentum. « Il y a trois ans, les premiers connecteurs que nous avons développés pour Askonce attaquaient des bases de données privées du monde de la propriété intellectuelle, du juridique, du commerce, ou encore des bibliothèques », précise Dominique Maillet, consultant chez Xerox Services, l'intégrateur historique d'Askonce.

La division R&D de France Télécom est l'un de ses premiers clients d'Askonce. « Nous avions constaté que les personnes en interne connaissaient très mal les sources d'information disponibles sur nos différences sites », indique Véronique Henry, coordinatrice de l'offre de services pour l'intranet. Et pour cause : les quelque 3 500 salariés du centre de recherche de l'opérateur manipulent une multitude de formats hétérogènes : bases de normalisation, de brevets et de veille, référentiels documentaires Documentum, Lotus Notes, BRS, etc. Au total, 21 sources sont aujourd'hui référencées par Askonce. « Certains connecteurs étaient nativement livrés avec l'outil. D'autres ont été spécifiquement développés pour nos besoins. Nous souhaitons encore enrichir la liste », précise Véronique Henry. Parmi les sources ciblées par l'opérateur historique figure le web, et notamment le moteur de recherche Google. C'est l'une des spécificités des outils d'ECI axés sur la consultation. Ils parviennent, en étudiant la syntaxe des pages web, à catégoriser les attributs des documents (nom, auteur, date, thème, etc.). Un exercice délicat, puisque chaque site dispose de sa propre structure de présentation.

L'autre caractéristique de cette famille de référentiels tient à la catégorisation des contenus. Bien souvent, le volume des contenus pointés est tel que la réponse est difficilement exploitable. Le classement de ces réponses devient indispensable. Les outils rangent donc automatiquement les contenus dans des catégories. Celles-ci sont soit bâties à la volée (technologie de clustering), soit prédéterminées en fonction de la taxonomie de l'entreprise. Cette classification gagne à être jumelée avec les fonctions d'abonnement proposés par ces référentiels. Car s'il ne stockent pas les résultats des requêtes, certains d'entre eux gardent en mémoire la formulation de ces requêtes.

De la consultation à la modification du contenu

C'est cette combinaison de catégorisation et de gestion des alertes qui a séduit Airbus pour ses besoins de veille. L'avionneur utilise Askonce depuis 2001 pour fédérer les contenus de trois sources hétérogènes : une base propriétaire contenant toutes les normes (80 000 documents), une base SAP (10 000 documents), et le portail employé (1 500 documents). Certains groupes d'utilisateurs ne sont concernés que par des thèmes précis : manuels sur la qualité, documents sur la production, etc. « Nous avons enregistré pour ces utilisateurs des requêtes spécifiques. Chaque lundi matin, toutes les références de nouveaux documents ou de documents modifiés leur sont envoyées, relate Alexandre Coumont, responsable de gestion documentaire pour la branche manufacturing d'Airbus. Ces résultats sont automatiquement classés dans les 80 catégories que nous avons définies. »

Les référentiels virtuels dits de consultation se distinguent donc par le nombre et la variété de connecteurs. Ils pointent tant vers les différents systèmes de gestion de contenu que vers les grandes applications d'entreprise (PGI et gestion de la relation client, notamment). Sans oublier les applications maison. La capacité de classification constitue l'autre facteur déterminant. Par exemple, Verity entend se démarquer des technologies de clustering dynamique d'Askonce avec ses méthodes de classement, qui combinent statistiques et règles métier formulées par les utilisateurs.

A contrario, la deuxième sous-famille, composée des référentiels d'interconnexion, a la caractéristique de permettre la modification des contenus. « Depuis notre plate-forme, nous assurons les mêmes fonctions que celles proposées par les API des référentiels que nous contrôlons : créer un document, le mettre à jour, gérer ses versions, etc. », assure Stuart Levinson, fondateur de Venetica. Cet éditeur est, avec Vignette, l'un des rares à se positionner sur ce créneau.

Il a pour premier client la compagnie financière américaine Wachovia. Spécialiste des crédits, celle-ci a fusionné en 2001 avec une autre banque, First Union. Et s'est alors retrouvée avec deux systèmes documentaires pour ses prêts à la consommation. Or, comment réunir sous une même interface les documents issus de Filenet d'une part, et d'IBM Image Plus d'autre part ? Exclue, la migration de données : trop longue (plus de six mois), trop chère (plus de 1,5 million de dollars). C'est finalement la technologie d'ECI qui est retenue. Même si Wachovia a été contraint de développer un connecteur pour Image Plus. Par la suite, cette option s'est révélée avantageuse. En effet, d'autres divisions se sont appuyées sur ce connecteur pour interconnecter Image Plus à d'autres référentiels. Sans Venetica, l'entreprise aurait dû multiplier les intégrations point à point.

Reste que pour les deux sous-familles de référentiels virtuels, les enjeux techniques sont nombreux. Il faut retranscrire le contexte des contenus conformément aux spécificités des divers référentiels ; respecter leurs règles de sécurité, exploiter leurs spécificités fonctionnelles ; et garantir la synchronisation des contenus. Car la plate-forme d'ECI doit répercuter les modifications d'un référentiel sur l'autre.

IBM et Documentum/EMC cherchent à fondre la fonction d'ECI dans leur offre. Big Blue a ainsi intégré Venetica à DB2 Information Integrator, un outil adapté au contenu structuré. Ce module offre une vue unifiée de données issues de bases hétérogènes. Documentum, lui, permettra, d'ici à quelques semaines, de stocker des résultats remontés par Askonce dans son module de collaboration eRoom. Les éditeurs de gestion de contenu ont renoncé à devenir propriétaires de l'ensemble des informations dans les entreprises, mais pas à jouer un rôle central. Ils veulent être le point d'accès unique aux informations. Et, pour cela, ils misent sur le référencement virtuel.

Glossaire
ECI (Enterprise Content Integration)

Cette technologie affiche depuis une seule interface une description uniforme de contenus physiquement stockés dans d'autres applications : systèmes de fichiers, GED, PGI, gestion de la relation client, etc. On parle de référentiels virtuels, même si, bien souvent, ces derniers restent volatils. Ils ne conservent pas les résultats des recherches.

ECM (Enterprise Content Management)

La gestion de contenu d'entreprise s'est bâtie autour de la gestion documentaire. A la fonction de stockage sont désormais associées des composantes de collaboration et de gestion des archives. L'objet même de cette gestion s'est, lui aussi, élargi. Le contenu dépasse le document, puisqu'il comprend aussi le contenu web et le multimédia.

Métadonnées

Littéralement, données sur les données. Appliquées à la gestion de contenu, elles renseignent sur le contexte : auteur, date de création, thème, etc. Les systèmes d'ECI doivent déceler et catégoriser ces métadonnées dans chacune des sources ciblées. Ce sont précisément ces informations qui sont stockées dans les référentiels virtuels.

Métamoteur

La plupart des systèmes d'ECI se comportent comme des métamoteurs : ils diffusent leur requête auprès des outils de recherche de chaque source et présentent des résultats normés. Mais les outils d'ECI vont au-delà. Ils catégorisent les réponses, proposent des fonctions d'alerte. Et ils seront capables ­ pour ceux qui ne le font pas déjà ­ de stocker les résultats.


Trois moyens de fédérer ses contenus
Portail

Les plus : Fenêtre vers toutes les applications d'entreprises : gestion de contenu, PGI, etc.

Les moins : Le contenu n'est pas référencé en un point unique. Ce qui nuit à l'homogénéité.

Référentiel virtuel

Les plus : Vue unique de l'ensemble du contenu, sans avoir besoin de le déplacer.

Les moins : Reste tributaire des moteurs de recherche de chacune des applications sources.

Référentiel unique

Les plus : La centralisation du stockage renforce le contrôle sur le contenu et les approches transversales.

Les moins : Migration longue et coûteuse.

Freins politico-culturels.



Kaspersky Anti-virus:
La protection ultime de votre quotidien numérique.

publicité
FIFA12
Offert, le nouveau FIFA12 pour votre mobile, le jeu du moment !

classement FAI
Retrouvez chaque semaine le classement des fournisseurs d'accès avec ip-label 1 Numericable2 Darty câble 30Mbps3 Orange > Plus de détails
Espace Emploi

Recherche express

Battlefield 3 : Back to Karkand
De nouveaux succès et trophées, et bien plus encore !