Passer au contenu

Éviter le pire grâce au plan de reprise

Les plans de secours des systèmes d’information se révèlent souvent mal adaptés. Leur organisation requiert la mobilisation des dirigeants afin de fixer le bon ratio entre moyens mis en ?”uvre et budget.

Les événements dramatiques du World Trade Center ou de l’usine chimique AZF de Toulouse incitent les dirigeants d’entreprise et les responsables informatiques à s’interroger : “Et si un sinistre majeur survenait chez nous ?” Au-delà du drame humain et des conséquences sociales et politiques, cette question doit être étudiée. Plus de la moitié des sociétés ayant connu un sinistre majeur de leur système d’information ont cessé leur activité dans les deux ans qui ont suivi. En effet, nombre d’entreprises, y compris des multinationales, ne disposent pas de plan de secours opérationnel. Et, lorsqu’il existe, il ne répond pas toujours à la réalité du sinistre.L’échec des plans de secours est régulièrement lié à un engagement insuffisant des décideurs. Leur réticence à examiner sérieusement toutes les conséquences prévisibles des scénarios de risques construits par les spécialistes du domaine, et à prendre toutes les dispositions qui en découlent est indéniable. Les ressources engagées ne doivent pas répondre à une logique de retour sur investissement, mais bien être considérées comme indispensables à la survie de l’entreprise.La définition d’un plan de secours se fait par étapes. Une fois assurée la sûreté des personnes, il faut calculer le délai admissible d’interruption des applications stratégiques en prenant en compte les différentes conséquences économiques et sociales.Lors d’un incident, on constate souvent deux types de reprises. La première s’effectue sous douze à vingt-quatre heures, avec des techniques de sauvegarde informatique traditionnelles. La seconde intègre de la haute disponibilité (sauvegarde à la volée sur un robot d’archivage distant, journalisation des fichiers d’historique en temps réel sur les disques d’un site secondaire, ou encore, base miroir distante). Une reprise instantanée imposera une cohérence permanente entre le disque principal et le disque de secours.

Le choix d’un site de secours est capital

Grâce à une réplication synchrone, chaque transaction sera dupliquée à distance. Si un écart de quelques transactions peut être toléré, une réplication asynchrone, plus souple, suffira. Le choix dépendra du délai de régénération des données perdues (ressaisie d’ordres de Bourse, par exemple).Seuls 5 à 10 % des entreprises adoptent la haute disponibilité. Le choix d’un site de secours est alors capital. “Redémarrer un système à partir de sauvegardes, mais sans site de repli n’aurait pas de sens “, insiste Emmanuelle Servaye, responsable marketing chez Guardian IT. Le choix du site est déterminé par l’autonomie organisationnelle et technologique dont l’entreprise veut se doter, par l’environnement structurel (PME ou grand groupe) et par les contraintes budgétaires. Une PME sous-traitera ses moyens de secours auprès d’un fournisseur spécialisé. Un grand groupe exploitera son propre centre de backup. Face au coût des liens télécoms nécessaires à une réplication distante, nombre d’entreprises font le choix de sites de secours sur leur propre zone d’emprise. Si la Caisse d’Épargne ou Sofinco gèrent des bâtiments de secours à 300 m de leurs sites principaux, Usinor relie ses baies de disques, via des liens optiques, entre Dunkerque et Mardick, situés à 7 km l’un de l’autre.Les principaux prestataires, sur le marché français, sont Comdisco, IBM BCRS, Integris, Guardian IT et Storage Telecom. Les constructeurs, tels Compaq, HP ou Sun Microsystems, louent des configurations matérielles pour remplacer celles de l’entreprise. À New York, le redémarrage a, semble-t-il, fait la fortune des vendeurs de matériels d’occasion, qui ont fourni en masse des PC de bureau.Comdisco a alors enregistré 73 déclarations de sinistres émanant de 36 entreprises, dont 12 banques et 2 compagnies d’assurances. Deux ans auparavant, l’ouragan Floyd avait déclenché 32 déclarations. Les trois mille salariés des trente-six entreprises et les systèmes d’information correspondants ont alors été répartis sur douze sites nord-américains. Chez SunGard ?” autre prestataire spécialisé qui vient de racheter Comdisco ?” il y a eu 70 déclenchements d’alertes, dont 22 déclarations de sinistres. Au final, Comdisco aura vu 30 % de ses ressources américaines occupées.Vérifier la redondance des centres de secours ainsi que leur taux de mutualisation n’est donc pas inutile lors de la souscription d’un contrat. Certaines sociétés ont subi la perte de leurs sauvegardes dans le même temps que leurs systèmes eux-mêmes. En effet, bien qu’externalisées, elles étaient conservées dans la tour jumelle du World Trade Center ou à proximité immédiate. D’autres disposaient de sites miroirs à haute disponibilité. Mais, là encore, la distance était trop réduite (parfois deux étages seulement), et, si l’acte terroriste était difficilement concevable, l’hypothèse d’un incendie ne pouvait être écartée.Après le premier attentat de 1993, la chambre de commerce de New York avait créé, dans le Queens, un espace pour la reprise d’activité. Depuis, l’utilité de cet espace faisait l’objet de querelles, au vu du coût de location annuelle (plus de 2 millions de francs). Trois fois par an, pourtant, des tests de reprise d’activité y étaient menés. Le dernier ?” qui aurait dû se dérouler le 8 septembre 2001 ?” avait été repoussé au 15 septembre, à cause de problèmes électriques. “Depuis les attentats, certaines tours ont été fermées en Allemagne et à Londres. Nous avons recensé vingt-six déclenchements d’alertes en Europe, sur quatre mille clients, ce qui est énorme”, raconte Emmanuelle Servaye. De plus, dans les trois jours qui ont suivi l’attentat, les entreprises disposant d’un plan de secours ont souhaité procéder à des mises à jour, voire à des achats de matériels.

Un plan de secours bien préparé

La prise de conscience aura été plus forte que lors de l’incendie du Crédit Lyonnais. Les moyens mobilisés sont plutôt similaires à ceux qui ont été déclenchés par le bogue de l’an 2000. Un sinistre informatique majeur survenant le plus souvent lors de la conjonction de causes multiples et interagissantes, le processus de gestion de crise doit être mûrement préparé, via un plan de communication externe et interne, d’une part ; et par la prise en compte du stress inhérent aux situations exceptionnelles, d’autre part. Le plan de secours relève à la fois de la perspicacité fonctionnelle nécessaire à la construction de “vraies” solutions et de la rigueur indispensable dans l’examen du détail.* (Telindus)

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Jean-Yves Oberlé et Renaud Hoffman