











“ Rien ne convenait mieux qu'une architecture de stockage circulaire pour un anneau de stockage de lumière comme le Synchrotron ”, affirme Philippe Martinez, chargé de l'informatique scientifique à Synchrotron Soleil. Le centre de recherche basé à Saclay, dans l'Essonne, constitue l'une des premières références du Français Active Circle, pionnier du stockage cellulaire, avec son logiciel éponyme. La solution retenue repose sur des cellules (serveurs dédiés) qui jouent le rôle de point de stockage et/ou de point d'entrée dans le système. Il n'y a pas de hiérarchie entre les cellules : si l'une d'elles est défaillante, une autre prend de suite le relais. L'ensemble, interconnecté viaIP, constitue Active Circle, véritable système de fichiers virtualisé qui applique des classes de service selon le cycle de vie des données.
Le choix d'une solution aussi originale n'était pas évident. Philippe Martinez a même craint, au lancement du projet, qu'aucun fournisseur informatique ne satisfasse à la totalité de leurs attentes en matière de stockage. Elles étaient nombreuses. Le projet nécessitait d'abord une architecture souple et évolutive. Les volumétries quotidiennes varient, en effet, dans des proportions considérables. De quelques méga-octets à plusieurs centaines de gigaoctets selon les besoins des onze lignes de lumière (sorties vers lesquelles est orienté le rayonnement synchrotron). Puis, certaines données doivent être conservées deux semaines et d'autres à vie. La politique de stockage diffère donc selon le statut des chercheurs. Ils sont 350 à demeure, mais six fois plus nombreux à venir profiter chaque année de l'anneau de Saclay. Par ailleurs, les chercheurs ont besoin d'avoir accès en permanence à leurs données pendant la durée de leur mission, et ensuite de les exporter vers des médias amovibles ou via le réseau. Pour finir, la solution devait aussi être centralisée, afin de soulager des chercheurs qui, souvent, ne se soucient guère des politiques de stockage, tout en laissant chaque responsable de ligne de lumière gérer l'espace alloué.
Un casse-tête qui a nécessité un important travail en amont. “ Nous avons mené une réflexion qui a duré six mois, notamment pour hiérarchiser les données en fonction de leur nature, de leur volumétrie et de leur fréquence de lecture ”, détaille Philippe Martinez. Puis un appel d'offres a été lancé en 2005. “ Plusieurs solutions tenaient la route sur le papier, alors nous avons décidé de les mettre en compétition en demandant une maquette. ” Trois sociétés de services acceptent de se prêter au jeu. Morse-Arkenis propose une solution à base de librairies Adic et de baies Hitachi avec le logiciel Stornext et des serveurs Sun. Histor concourt avec un matériel de Sun Storagetek, et le logiciel SAMFS/QFS, et Devoteam avec une solution à base de serveurs Dell, de librairies Grau, de baies EMC et du logiciel Active Circle. Quatre architectures sont envisagées : des serveurs de fichiers, avec des accès NFS/CIFS, redondés dans deux salles ; un stockage en réseau de type SAN ; une approche unifiée SAN-NAS ; et enfin la solution cellulaire, la plus originale. Ces maquettes ont apporté de nombreux enseignements. “ Nous avons été très déçus par les SAN, notamment en termes de tolérance aux pannes ”, souligne Philippe Martinez. C'est la solution de Devoteam - la plus évolutive - qui est retenue. Elle est extensible presque à l'infini dans un environnement matériel entièrement ouvert puisqu'elle associe des cellules reposant sur des systèmes d'exploitation et des matériels différents. C'est aussi la plus robuste et la plus sécurisée. En effet, l'interconnexion entre toutes les cellules assure un stockage redondant, et ainsi une haute disponibilité des données. Elle offre, en outre, le plus bas prix au téraoctet et les meilleures perspectives d'archivage. “ En dépit de tous ces atouts, le choix n'a pas été aussi évident, car il est risqué de s'engager avec une start-up ”, estime le responsable informatique. Avec du recul, il ne regrette pas son choix. Il se demande même s'il n'aurait pas été aussi risqué de s'engager avec les autres solutions. “ Si l'approche d'Active Circle nous a séduits, nous avons aussi été impressionnés par leur réactivité et leur rapidité à résoudre les problèmes. ” Lors du déploiement, tout n'a effectivement pas été parfait. De nombreux bugs sont apparus.
Depuis le mois de juin 2006, Active Circle a apporté des améliorations sur de nombreux points : entre autres, une meilleure synchronisation des cellules, l'amélioration de leur temps de démarrage, une gestion des annuaires LDAP en mode Samba (CIFS). L'éditeur français Active Circle a également mis à disposition une interface de programmation afin de connecter des outils d'administration, de maintenance, d'audit, de statistiques en mode commande. Les performances ont ainsi progressé. Synchrotron Soleil espère que, prochainement, l'outil d'Active Circle gagnera en ergonomie, avec un tableau de bord opérateur (interface d'administration), des statistiques étoffées, un rechargement des configurations des cellules en cas de plantage ou de mise à jour, des remontées d'alarmes… Philippe Martinez ressent aussi la nécessité d'améliorer la traçabilité des données. Mais, le résultat est satisfaisant. Une dizaine de lignes sont en mode “ commissioning ” (en service), et les données commencent à être exploitées. “ Nous n'avons eu jusqu'ici aucune perte de données, malgré les bugs et les crashs. Depuis janvier 2007, tout fonctionne parfaitement, se félicite Philippe Martinez. Les prochaines étapes consisteront à mettre en place l'archivage et un plan de reprise d'activité. ”
k.frascaria@01informatique.presse.fr
16 cellules de stockage sont installées : 2 dans chaque salle informatique, 1 sur chacune des 11 lignes de lumière, 1 sur le cluster de calcul.
4 copies pour chaque donnée, sans historisation.
5 To de données.
40 To dans chacune des deux baies EMC (113 To d'ici à la fin de l'année).
80 à 160 To en bandes LTO-3 dans une salle (440 à 880 To d'ici à la fin 2007).
50 à 130 To en bandes SAIT1 dans la deuxième salle (450 To à 1,2 Po d'ici à la fin de l'année).
Le projet Synchrotron Soleil (source optimisée de lumière d'énergie intermédiaire du Lure, le laboratoire d'utilisation du rayonnement électromagnétique) a été initié dans les années 1990 pour remplacer le synchrotron d'Orsay. La construction du site a démarré en 2002 à Saclay dans l'Essonne. Quatre ans plus tard, le 13 septembre, la première ligne de lumière a produit son premier octet à stocker.
Des électrons circulent, des heures durant, dans un anneau, dit de stockage, de 354 mètres de circonférence. L'anneau est équipé d'aimants et d'onduleurs qui forcent les électrons à suivre des trajectoires courbes
Le rayonnement synchrotron qui en résulte est capté en différents endroits, puis canalisé vers des sorties que l'on appelle lignes de lumière. Une dizaine de lignes sont, aujourd'hui, en service. On en prévoit vingt-quatre en 2010.
Ils sont multiples : exploration de la matière et de la structure des matériaux, détection de substances polluantes, conservation des aliments, élaboration de nouveaux matériaux, recherche pharmaceutique, étude de l'ADN, etc.
Les données issues des travaux menés dans les lignes de lumière ou du cluster de calcul sont déposées dans les cellules, qui servent de point d'entrée au système de stockage. Elles restent au moins quatre jours dans le cache des serveurs Dell.
Elles sont ensuite copiées dans une baie de disque CX 700, d'EMC (d'une capacité de 40 To). Le stockage secondaire est assuré par une librairie de bande ITX-XL, de Grau.
L'infrastructure de stockage, qui s'appuie sur un réseau en fibre Gigabit IP spécifique, est dupliquée dans une seconde salle. Au cœur de la solution, le logiciel d'Active Circle agit comme un seul noyau identique sur toutes les machines. Il inclut la sauvegarde en continu, la réplication, le stockage hiérarchique, le stockage multisite, et la haute disponibilité.
Au bout de cent jours, les deux copies de données stockées dans les baies EMC expirent. Il ne reste alors que les deux copies sur bande.
Les deux copies sur bande expirent au bout de un à cinq ans. L'utilisateur peut demander au préalable un archivage de ses données, s'il le souhaite.














