Actualités Emploi Start-up Evénements 01 Avis d'expert Vidéos Indicateurs Distribution Telecharger Pro Livres blancs

L'Administration teste son standard d'archivage

Les Archives de France et le département des Yvelines sont les premiers à expérimenter le protocole standard d'échanges (PSE). Etat des lieux.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Le standard d'archivage de l'Administration électronique vient de souffler sa première bougie. Né de la collaboration de la Direction générale de la modernisation de l'Etat (DGME) et de la Direction des Archives de France (DAF), il spécifie un format d'échange lors des opérations de versement dans les plates-formes d'archivage. Deux projets sont actuellement en cours. L'un aux Archives de France, avec la mise en place d'une plate-forme complète de versement (baptisée Pilae) destinée à recueillir les archives patrimoniales des ministères. “ Encore en développement, la recette est prévue en juillet ”, indique Gabriel Ramanantsoavina, chef de projet archivage numérique, à la DGME qui travaille en tant que maîtrise d'œuvre. Le second projet, conduit par le conseil général des Yvelines, vise à conserver électroniquement les documents soumis au contrôle de légalité (par exemple les délibérations du conseil). Dans les deux cas, l'enjeu est identique : associer aux contenus électroniques des types de métadonnées définies par le format d'échange.

Un cadre théorique, gage de pérennité

Parallèlement à ce format d'échange, les Archives de France ont élaboré une série de préconisations liées à la sécurité des infrastructures de stockage. Tout le cadre théorique a été défini pour que les services de l'Etat ainsi que les collectivités territoriales puissent conserver de façon pérenne leurs archives patrimoniales. Un tel cadre manquait cruellement. Jusque-là, les rares mises en œuvre d'archivage électronique dans le secteur public ne concernaient que les registres qui ont été progressivement dématérialisés dans les années 70. Ces derniers consignent une liste d'évènements se référant à des dossiers papiers. “ A partir du moment où ces registres ont été dématérialisés, personne n'a songé à les archiver au même titre que le papier ”, déplore Françoise Banat-Berger, responsable de l'innovation technologique à la DAF. La majorité n'intègre aucun mécanisme de gestion du cycle de vie (des marqueurs de temps ou des dates de clôture). Résultat, quand le système d'information évoluait, certaines données se retrouvaient écrasées. “ Les producteurs de ces registres n'y voyaient pas d'inconvénients, puisque les documents papier étaient bien archivés par année. Mais les clés d'accès étaient perdues ”, regrette-t-elle. Un tel système n'est plus envisageable aujourd'hui. Il devient même impensable avec l'explosion du volume de documents numériques. La télétransmission de certaines procédures (le contrôle de légalité) a été homologuée par le ministère de l'Intérieur. “ La certification de plusieurs plates-formes de télétransmission, comme Fast, a clairement accéléré l'élaboration de ce format d'échange ”, note Françoise Banat-Berger.

Définir des métadonnées technique et sémantique

Les premières réflexions autour du standard d'échange ont été menées en 2004. Elles ont abouti à un appel à commentaires. Fournisseurs de plates-formes de dématérialisation, éditeurs de gestion documentaire et de coffre-fort électronique, archivistes, bibliothécaires… Au total, ils sont une soixantaine à avoir planché sur la question. A ce jour, ce standard s'applique aux bases de données, aux documents bureautiques, aux courriels et aux flux issus de la dématérialisation des appels d'offres. Pour chacun de ces contenus, les services versant doivent établir une correspondance entre des donnés métier et les balises d'un fichier de métadonnées en XML, dont la structure est imposée par le standard. “ Cette écorce XML qui accompagne l'archive comporte deux types d'informations ”, précise Bruno Ricci, directeur associé de Cecurity.com, dont le coffre-fort électronique a été retenu pour le projet Pilae. D'une part, celles relatives à la structure de l'archive. Pour une base de données ou une application, elles indiquent les clés, les index ou les relations d'intégrité entre les tables. Pour un document, les relations avec les sources de données. D'autre part, des informations contextuelles et sémantiques. Qui a produit l'archive ? Quand ? Qui concerne-t-elle ? De quel processus relève-t-elle ? Quelle est sa durée de conservation ? Ces derniers éléments deviendront les seules clés pour accéder aux données ou aux documents archivés. Car la plate-forme des Archives de France n'exploitera aucun moteur de recherche plein texte.

Ce travail d'interprétation du standard PSE doit être réalisé pour chaque type de document. Pour l'heure, “ avec les collectivités territoriales, nous avons déjà couvert les processus du contrôle de légalité, de l'action sociale à l'enfance ou encore de la passation des marchés public ”, indique Françoise Banat-Berger. Seulement ces versements imposent aux producteurs de préparer leurs archives conformément au standard. “ Or les applications des ministères n'ont pas encore développé de module d'export et ne pourront donc s'aligner sur notre norme ”, poursuit-elle. D'où le risque d'une incompatibilité du format de l'archive versée avec ceux autorisés par le standard d'échange (PDF/A, Open Document, TXT, HTML, Jpeg, Mpeg 2…).

Les prestataires assurent la conversion

Pour pallier cette distorsion, Pilae embarque des scénarios de conversion. “ Si le type de ficher du lot versé n'est pas conforme, par exemple .doc, un mécanisme de règles vérifiera si ce format est toutefois acceptable pour Pilae. Selon le résultat, le document sera ou non traité par les utilitaires de conversion de la plateforme ”, détaille Bruno Ricci. L'autre risque porte sur les métadonnées. La structure du fichier XML livré avec les données pourrait ne pas être en phase avec la syntaxe définie dans le standard. Mais là encore Pilae offrira des services de transformation.

En dépit de ces outils de conversion, la capacité des applications à préparer leurs archives restera l'un des principaux facteurs de succès de Pilae. Les Archives de France et la DGME poussent activement les éditeurs installés dans les ministères à développer des services d'export natifs pour leurs applications. En fait, plus que les services de l'Etat, ce sont paradoxalement les collectivités territoriales, a priori, moins bien armées, qui pourraient adopter plus facilement le standard d'archivage. Et ce, par le biais des plates-formes de télétransmission.

Ainsi, le conseil général des Yvelines ne connaît pas ces problématiques de conversion. Le standard d'échange lui sert à archiver les actes soumis au contrôle de légalité. En l'occurrence les arrêtés liés aux ressources humaines et les délibérations du conseil. “ Nous passons par la plate-forme de télétransmission de Fast pour envoyer et récupérer les documents échangés avec la Préfecture ”, indique Christelle Hevin-Bonner, responsable des technologies de l'information et de la communication au conseil général des Yvelines. Dans cette chaîne, Fast date, trace et signe ces documents. Mais surtout, il les formate conformément au standard d'échange avant de les livrer au département. Ou plutôt les formatera. Car le prestataire a justement pris du retard dans l'élaboration de son module d'export.

De son côté, le conseil général vient de terminer tous les développements liés à sa plate-forme d'archivage, fin prête à recevoir les versements. “ Au-delà de l'infrastructure technique qui a été déployée, nous avons réalisé un gros travail d'interprétation du standard, souligne Jean-François Navarre, chef de projet sur l'archivage électronique au conseil général. Il a fallu transposer les données du contrôle de légalité - objet, nature, matière, sous matière, identifiant du service versant - aux champs généralistes du standard - description, mots-clés, service producteur. ”

Des travaux menés avec la DCSSI

Ce standard d'échange ne suffit pourtant pas à bâtir un cadre complet pour une politique d'archivage. Celle-ci doit également intégrer une forte composante sécurité. “ Avec la Direction centrale de la sécurité des systèmes d'information, nous avons défini toutes les conditions pour qu'une archive ait à tout moment une valeur probante et ne soit jamais perdue lors de son cycle de vie ”, indique Françoise Banat-Berger de la DAF. Ces préconisations, essentiellement techniques, ont été mises en œuvre dans le coffre-fort de Pilae. Elles s'appuient sur les fonctions conçues par le progiciel de Cecurity.com : traçabilité, horodatage, calcul d'empreintes, signature électronique et redondance des équipements (réplication des données sur deux sites distants de 40 km, clusters de serveurs…). Ces préconisations touchent également l'interface, développée au-dessus du coffre-fort. C'est à ce niveau que sont identifiés les rôles (producteur, verseur, archivistes, contrôleur…) et que le dialogue entre les deux parties est orchestré (envoi, accusé de réception, accords, refus…). Lorsque les versements seront automatiques, l'échange de données se fera par l'entremise de services web. Dans le cas où l'application productrice ne dispose pas de module d'export, les archivistes des ministères s'appuieront sur des formulaires pour entrer manuellement les métadonnées.

Ce projet Pilae n'en demeure pas moins qu'une expérimentation avant l'ouverture, en 2011, du futur bâtiment des Archives nationales, basé à Pierrefite en Seine-Saint-Denis. Un centre qui conservera 320 kilomètres linéaires de document papier et qui hébergera une plate-forme d'archivage électronique reprenant tout ou partie des spécifications de Pilae.

v.berdot@01informatique.presse.fr

Le protocole standard d'échanges (PSE)

Le PSE s'inspire d'OAIS (Open Archive Information System). Normalisé par l'ISO en 2003, ce standard issu du monde spatial impose des grandes familles de métadonnées.

Elles portent sur la représentation de l'archive (son format notamment), sa pérennisation (mode de lecture, de maintenance, auteur…) et la description des données métier.

Il s'appuie sur la DTD EAD (Encoded Archival Description) pour la structure du fichier XML qui stocke les métadonnées. Il décrit son arborescence. PSE applique également les recommandations de l'UN/CEFACT qui spécifient la forme sous laquelle les métadonnées doivent apparaître dans les balises XML.

Des délibérations envoyées à un coffre-fort électronique

La plate-forme de télétransmission Fast prépare l'archivage des délibérations qui ont été au préalable contrôlées par la Préfecture. Elle exporte dans un fichier XML toutes les métadonnées nécessaires, conformément au protocole standard d'échanges. Ce fichier est ensuite joint à l'archive proprement dite, qui a été signée électroniquement par Fast. Le lot est envoyé au conseil général.

L'archiviste vérifie que le format du document, ainsi que ses métadonnées restent en phase avec le standard. Elle rajoute ensuite manuellement des index supplémentaires dans le fichier XML, et déclare le lot archivable.

Le contenu est envoyé vers un système de fichiers sécurisé (coffre-fort électronique) accompagné de ses fichiers de métadonnées au format XML. Ce stockage se répartit sur deux serveurs distants de plusieurs kilomètres, chacun sauvegardé sur bande. Par ailleurs, les métadonnées sont envoyées également dans une base MySQL centralisée qui servira aux requêtes.

Questions/Réponses

Le rôle de la Direction générale de la modernisation de l'Etat se limite-t-il à la définition du standard ?
NON La mode Direction générale de la modernisation de l'Etat effectue des tests sur des bases de données, des documents et des courriels qu'envoient respectivement le ministère de l'Education nationale, de l'Equipement et les services du Premier ministre aux Archives nationales.

Le standard d'archivage aborde-t-il la problématique des supports de stockage ?
NON Sa priorité porte avant tout sur la qualité des versements. La politique de stockage assurant la pérennité des supports dans le temps sera menée à l'initiative de chaque service d'archivage. Concrètement, cette pérennité sera classiquement assurée par des migrations de disques à disques.

www.01blog.fr/1907

2 questions à… : Françoise Banat-Berger, responsable de l'innovation technologique à la direction des Archives de France

Où en est l'Administration dans l'archivage ?
“ La Direction générale de la modernisation de l'Etat a mené un audit sur la modernisation de l'archivage dans les ministères et les services déconcentrés. Le rapport, rendu il y a deux mois, montre que la fonction est rarement bien identifiée. Notamment pour les archives dites intermédiaires pour lesquelles il n'y a pas, ou peu, d'organisation dédiée. Et nous n'avons aucune idée des coûts puisque nous ne connaissons ni le temps que lui consacrent les producteurs, ni le prix des locaux d'archivage. Sans compter que des informations identiques sont souvent stockées en plusieurs lieux. ”

Comment améliorer les processus ?
“ La principale exigence est de faire collaborer les archivistes avec les services producteurs en vue d'associer un cycle de vie au document dès sa création. L'idée étant de dégraisser le document en supprimant des détails tout au long de son parcours. Pour ne conserver au final que les informations nécessaires à l'archivage. ”

Témoignage : Thierry Ehret-Franck (Yvelines) : “ les premiers versements nous renseigneront sur les temps de réponse de la plate-forme ”

“ Pour conserver leurs contenus numériques, les collectivités envoient souvent aux archives départementales des CD-Rom, voire des disquettes dont les lecteurs n'existent plus. Nous ne pouvions plus continuer comme ça ! D'autant que les volumes d'archives vont exploser. Notre plate-forme d'archivage, calée sur le standard d'échange, sera donc exploitée par les collectivités du département. Il s'agit d'une expérimentation. Les premiers versements du prestataire de télétransmission Fast nous renseigneront sur la montée en charge et les temps de réponse de la plate-forme. A terme, celle-ci s'appuiera sur une GED du marché, à laquelle nous appliquerons nos spécifications. Nous accueillerons aussi d'autres types d'archives, celles générées directement par les applications des collectivités. Avant cela, les éditeurs devront développer des modules d'export. ”

publicité
à lire aussi
SUR LES MÊMES THÈMES
01 Business : émission spéciale sur la dématérialisation
Livre vert de Syntec : première partie, la dématérialisation
Les bulletins de paie électroniques sont désormais légaux
Appels d'offres en ligne : encore beaucoup à faire
Le Sedif passe à l'heure de la télétransmission
Gestion de documents : La Poste vise les 500 M d'euros en 2012
4 millions de télédéclarations sociales parfaitement sécurisées
L'Administration teste son standard d'archivage
Debitel automatise le “ zéro papier ” pour facturer ses clients
La DGA blinde ses échanges avec les industriels de l'armement
La LAD s'impose à tous les types de documents papier
Place au deuxième chantier de l'Assurance maladie
La fin du train-train du tri ?
Le Cigref refond son référentiel des métiers du SI
La fibre optique peu accessible aux PME
Comment lutter contre le paradoxe des TIC
Voyage au cœur d'un futur centre de données
Le secteur IT progresse, mais peut mieux faire
Crever enfin le plafond de verre
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2009 Internext - 01net.