Pourquoi faire le choix d'un cluster de PC fonctionnant avec Linux ? La réponse est avant tout économique. Fondée sur des PC x86 à faible coût et sur un système d'exploitation gratuit, cette architecture en grappe affiche un rapport performances/prix inégalé face à des serveurs Risc/Unix spécialisés dans la haute performance (HP, pour High Performance), la répartition de charge ou la haute disponibilité (HA, pour High Availability).
Les premiers à avoir exploité des clusters Linux intégrant jusqu'à plusieurs dizaines de PC ont été les laboratoires universitaires recherchant une alternative aux supercalculateurs. Depuis, la maturation de cette technologie s'est accélérée grâce à l'accroissement de puissance des processeurs x86 et à l'amélioration des équipements réseaux (généralisation de l'Ethernet 100 et 1 000 Mbit/s).
Le foisonnement du monde Linux a, par ailleurs, donné naissance à de nombreuses solutions logicielles : Beowulf, mis au point par la Nasa, pour les clusters HP, LifeKeeper et Kimberlite pour les clusters HA, et LVS (Linux Virtual Server) concernant l'équilibrage de charge pour ne citer que les plus connus... Bref, toute une panoplie de logiciels susceptibles de séduire les entreprises selon leurs besoins.
L'utilisation : de la répartition de charge au calcul
Parmi les différentes utilisations d'un cluster Linux, la répartition de charge est sans conteste la plus simple. « Nous avons monté un cluster pour notre intranet. Le but était d'offrir un accès intuitif à notre base de données Oracle, laquelle couvre notamment la description de notre parc immobilier, le suivi des opérations, les états budgétaires et les logements vacants », décrit Philippe Tran, chef de projet à la Sagi (Société anonyme de gestion immobilière), une société d'économie mixte de la Mairie de Paris. « Deux cents utilisateurs accèdent à notre base. Notre cluster de type LVS comporte deux noeuds redirecteurs, l'un prenant le relais de l'autre en cas de panne, et trois noeuds serveurs fonctionnant avec Apache », précise-t-il.
Pour le site Autovalley.fr , où deux petits clusters de PC ont été montés pour un coût réduit, il s'agissait de répondre à une brusque montée en charge : « En 2000, Autovalley.fr a signé un partenariat qui s'est traduit par une brutale augmentation de la fréquentation, et nos deux serveurs avaient du mal à tenir la charge », explique Stéphane Leguet, alors chargé du développement web de ce site, avant de rejoindre Arval PHH, une autre filiale du groupe BNP-Paribas.
Dans le calcul numérique, le critère principal demeure le niveau de performances. « Par rapport à une solution de type IBM Unix à base de processeur Power 3, nous gagnons un facteur de 3 à 5 en termes de performances. Mais bien sûr, cela dépend des codes », explique Françoise Berthoud, ingénieur de recherche CNRS au Laboratoire de physique et modélisation de la matière condensée de Grenoble (LP2MC). Le cluster comporte 40 noeuds (des PC bi-Athlon standards) gérés par la distribution Mandrake Clic et reliés au travers d'un réseau Ethernet 1 Gbit/s.
Autre champ d'application des clusters : l'optimisation des ressources de l'entreprise. « En 2000, nous avions besoin d'une puissance de calcul supplémentaire. Nous avions passé dix stations clientes de Windows à Linux. Nous avons eu l'idée de les mettre en cluster afin que ces machines soient exploitées 7j/7 et 24 h/24, et non plus seulement comme postes de travail », raconte Christophe Kersuzan, responsable système de la société CLS (Collecte Localisation Satellites).
Enfin, la haute disponibilité est un domaine où les clusters de PC Linux ont encore des progrès à faire puisqu'ils restent distancés par les solutions Unix. Il vaut donc mieux opter pour des solutions intégrées (logiciel et matériel). Un choix qu'a fait Eutelsat pour son service de streaming Internet par satellite, Opensky, en acquérant un cluster Dell/Red Hat Advanced Server. « En plus de la fiabilité, le cluster de haute disponibilité nous apporte de la souplesse. Nous pouvons ainsi mettre à jour plus facilement nos applications sans interruption de services », explique Roberto Bellucci, responsable produit Opensky.
Ressources : des compétences Linux indispensables
Les clusters Linux fonctionnent en théorie avec tout PC d'architecture x86 : « J'ai utilisé des machines de récupération : Celeron 400 MHz pour les redirecteurs, Pentium III à 500 MHz pour les noeuds du cluster », explique Philippe Tran.
Pour autant, le choix de la plate-forme matérielle est parfois plus ardu, notamment dans le calcul, comme ce fut le cas au CNRS. « Nous avons fait un appel d'offres avec un cahier des charges très précis. Certains de nos codes font beaucoup d'appels entrées/sorties mémoire et disque dur, et il s'est avéré que certaines machines que nous avions testées plantaient trop souvent », confirme Françoise Berthoud.
Toujours dans une perspective de performances, la liaison entre les noeuds du cluster a son importance. Il faut souvent utiliser des cartes spécialisées, de type SCI par exemple, qui offrent un temps de latence inférieur aux cartes Ethernet. « Pour notre cluster, nous sommes passés par l'intégrateur Alineos afin d'obtenir des PC sur mesure. Il nous fallait des disques SCSI et des cartes réseau Myrinet », explique Guillaume Alleon, chef de service calcul numérique avancé pour EADS-CCR.
Mais les ressources utiles à la mise en place d'un cluster Linux sont avant tout humaines. « Il est important d'avoir de bonnes relations avec la communauté Linux pour résoudre certains problèmes », continue Guillaume Alleon. Mais, même avec des compétences en interne, l'appel à un intégrateur est souvent incontournable.
« Nous avons choisi une SSII, en l'occurrence Alcove, car les personnes en interne connaissaient soit Unix AIX, soit Microsoft, mais pas trop Linux », justifie Philippe Tran. La société CLS, quant à elle, a préféré se débrouiller seule : « Nous avions des compétences, mais nous avons tout de même choisi une solution logicielle prépackagée, Alinka Raisin, afin d'aller vite. Nous bénéficions de leur assistance par téléphone et ils ont été très réactifs », explique Christophe Kersuzan.
La mise en oeuvre : une démarche rigoureuse
Même si l'installation du cluster est effectuée par une SSII, l'entreprise doit bien préparer le terrain. « Les solutions de clustering sont très nombreuses. La difficulté pour une entreprise est de trouver la bonne », estime Guillaume Alleon.
L'intégrateur doit ensuite être rigoureux. « Pour un client, nous faisons dans un premier temps une recommandation d'architecture matérielle et logicielle. Ensuite, nous lui demandons de vérifier qu'il remplit bien toutes ses exigences. Enfin, nous allons monter le cluster chez lui, le validons, le démontons, puis le remontons avec l'administrateur du système », détaille Marc Triboulet, directeur général de Non Stop Systems.
Bien entendu, dans le domaine du calcul, des tests de performances doivent être effectués. L'installation du cluster lui-même est souvent rapide : environ une semaine, à laquelle il faut ajouter un ou deux jours de formation. Les solutions logicielles prépackagées de type Alinka ou Mandrake Clic offrent une interface graphique qui simplifie grandement l'administration. « Cette dernière était le point sensible. Ce n'est plus le cas aujourd'hui : Clic fournit des fonctions qui la simplifient considérablement », estime Françoise Berthoud.
Écueils : les problèmes sont liés à l'intégration
La première difficulté rencontrée lors de l'installation d'un cluster ? C'est généralement la nécessité de déployer les mêmes systèmes d'exploitation et configurations sur tous les noeuds. « Les noeuds faisant aussi office de stations de travail, l'installation d'Open Office doit forcément passer par le noeud maître, tout comme la gestion des pilotes de cartes graphiques, note Christophe Kersuzan. Cela est pratique au final, mais a demandé quelques réglages au début. »
D'une manière plus générale, les difficultés viennent de l'intégration du cluster dans l'environnement de l'entreprise, essentiellement du fait qu'il fonctionne avec Linux : « Il a fallu faire en sorte que le noeud maître reconnaisse notre serveur NIS [Network Information Service, Ndlr], fonctionnant avec Sun Solaris, chargé de la gestion des utilisateurs et des mots de passe. L'intégration de notre baie NFS a également demandé quelques réglages », témoigne à nouveau Christophe Kersuzan. La mise en place d'une solution de haute disponibilité nécessite de développer des scripts destinés à la surveillance de l'application.
Gains : des coûts moins élevés pour une solution plus souple
En s'appuyant sur des PC d'architecture x86, les clusters reviennent moins cher qu'une solution à base d'Unix commercial et de processeurs Risc. Une économie réalisée sur les plates-formes de base, mais aussi sur les logiciels associés : « Une licence logicielle pour PV-Wave, logiciel dédié à l'analyse des données, est deux fois moins chère avec Linux qu'avec Unix » [environ 2 300 euros ht au lieu de 4 600 euros ht, Ndlr], affirme Christophe Kersuzan.
Résultat, le prix du cluster mis en place par CLS est environ trois fois inférieur à celui d'une architecture Unix. Les économies réalisées ne sont pas toujours aussi importantes. « Je pense que nous avons obtenu une économie de 20 à 40 %. Mais notre critère principal était la qualité de la solution », explique Roberto Bellucci, d'Eutelsat.
De fait, les solutions fonctionnant en cluster avec Linux peuvent se révéler très performantes, par exemple à la Sagi. « L'un des principaux objectifs était d'obtenir la réponse à une requête en moins de vingt secondes, affirme Philippe Tran. Nous comptons entre trois et dix secondes pour la plupart des pages, et moins de trente secondes pour quelques pages demandant l'analyse de davantage de données (pouvant atteindre plusieurs centaines de milliers d'enregistrements à la volée). La recherche d'un locataire est ainsi trois fois plus rapide qu'avec d'autres outils fondés sur une architecture client-serveur. De plus, notre cluster ne demande pas de maintenance. Aucune machine n'est tombée en panne depuis leur mise en service il y a un an et demi. »
Le coût est ici très réduit, puisque cette solution d'équilibrage de charge et de tolérance de panne n'a requis aucun matériel, hormis quatre cartes Gigabit Ethernet. La seule dépense est liée à l'intervention d'Alcove pendant une semaine. En revanche, pour un cluster de haute disponibilité, il faut compter environ 30 000 euros ht pour une configuration d'entrée de gamme (avec reprise de transaction lorsque celle-ci est interrompue) fonctionnant avec LifeKeeper.
Les clusters de calcul et de haute disponibilité exigent des configurations matérielles très fiables. Il faut parfois installer des cartes réseau et des configurations disques spécifiques et choisir le processeur (AMD ou Intel) en fonction de l'application, afin d'obtenir des performances optimales.
Mieux vaut parfois passer par des intégrateurs pour obtenir des PC sur mesure, ou opter pour des configurations clés en main, notamment concernant la haute disponibilité.
Il est facile d'ajouter un serveur au cluster, et cela ne demande qu'une heure à une demi-journée. On peut ainsi faire face rapidement à une montée en charge temporaire ou ajouter quelques machines à un cluster de calcul pour gagner en puissance. Il est, par exemple, possible d'ajouter au fur et à mesure des machines de récupération. Les clusters fonctionnant avec Linux constituent, de ce point de vue, une solution évolutive.
Les clusters Linux peuvent accomplir des tâches très variées, allant du calcul à la répartition de charge en passant par le stockage. De fait, les solutions logicielles les accompagnant sont extrêmement nombreuses. Développées pour Linux, elles évoluent rapidement. Un choix qui impose, en revanche, une bonne connaissance de Linux et, en général, l'accompagnement du projet par une SSII.
En s'appuyant sur des PC courants, les clusters Linux/Intel se révèlent moins chers que les architectures Risc/Unix. Ils permettent ainsi de bâtir des plates-formes de calcul ou d'équilibrage de charge à un coût réduit. L'administration, auparavant leur point faible, est désormais plus simple, grâce à l'apparition d'interfaces graphiques et de solutions logicielles prépackagées.
![]() |
01 Site Creator
Une équipe de professionnels développe votre site, vous le faites évoluer !
|
|
![]() |
FILM OFFERT !
Votre 1er film OFFERT ! Des centaines de films à télécharger !
|
|
1 Numericable2 Darty câble 30Mbps3 Orange
> Plus de détails

![]() |
Mystery Case Files : The 13th Skull
Menez une enquête palpitante en Louisiane
|
|
