Passer au contenu

Avec Dspace, l’archivage de HP veut gagner son indépendance

La société californienne propose son propre logiciel open source, spécialisé dans la gestion des métadonnées. Il vient en complément du récent rachat de Persist.

La stratégie du constructeur en matière de gestion du cycle de vie des données (ou
ILM) s’avère pour le moins originale. Certes, l’offre de Persist, société américaine tout juste rachetée, est similaire à Centerra d’EMC, baie de disques pourvue
 ?” entre autres ?” de fonctionnalités Worm logiques. Mais c’est surtout avec Dspace, son propre logiciel d’archivage open source (et gratuit) développé conjointement avec le MIT (Massachusetts Institute of
Technology) depuis deux ans, que HP se démarque.

Tenir compte de la modification de l’environnement du document

Bâtie sur un socle Java, cette couche est placée entre l’application métier et le stockage physique. Sa particularité : tenir compte des contraintes liées à la modification de l’environnement du document (emplacement de
la donnée, pérennité de l’application et évolution des métadonnées).La première de ces contraintes porte sur l’indépendance vis-à-vis de la localisation de l’information (adresse URL ou espace de stockage), amenée à être modifiée avec le temps. Pour s’en affranchir, Dspace entrevoit
le document sous l’angle d’un identifiant unique, généré par un serveur de gestion des identifiants (développé par la Corporation for National Research Initiatives), qui fait le pont avec le monde physique.

Uniformiser la description et les échanges des métadonnées

Deuxième exigence : se rendre indépendant, cette fois, de l’application d’origine, en migrant par exemple le document vers des formats pérennes (Tiff, PDF ou XML). Dspace ne fournit pas les outils de conversion, mais
propose une méthodologie ainsi que des utilitaires pour indexer les documents.Et c’est là qu’intervient la troisième contrainte : uniformiser la description et les échanges des métadonnées associées aux archives, afin de créer des passerelles entre les documents issus d’univers et de métiers
différents. Dspace s’appuie, pour cela, sur le vocabulaire standardisé par la communauté multi-sectorielle Dublin Core pour décrire tout type de métadonnées. Il repose également sur
RDF (Resource Description Framework), né en 1999 sous l’égide du W3C, dont la syntaxe permet de définir les liens entre des métadonnées en vue de leur échange.Enfin, Dspace répond au protocole OAI (Open Archives Initiative), issu de la communauté scientifique, qui vise à rendre interopérables des bases de métadonnées. Ces trois modèles, orientés web, exploitent XML. L’extensibilité de
ce langage offrira aux utilisateurs de Dspace la possibilité de faire facilement évoluer les métadonnées dans le temps, tout en conservant le document inchangé.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Vincent Berdot