Passer au contenu

La Française des jeux : une surveillance maximale pour une tolérance zéro aux pannes

Assurer une supervision permanente avec une tolérance aux pannes égale à zéro, telle est l’équation à résoudre par les superviseurs du système d’information de La Française des jeux.

La très haute disponibilité est, pour nous, une réalité. La moindre indisponibilité a un impact direct et immédiatement visible sur le chiffre d’affaires des jeux en ligne ‘, insiste Guy Faia, responsable du service Exploitation à La Française des jeux.

Mobiliser des équipes pluridisciplinaires

Pour l’atteindre, un premier projet de réorganisation a donc consisté à fusionner les entités chargées de l’administration des différents éléments composant le système d’information. Cela a amené à constituer des équipes pluridisciplinaires chargées de surveiller le système 24 heures sur 24 et 7 jours sur 7. L’hétérogénéité de ces équipes a été obtenue en associant les savoir-faire de chacun. Chaque salarié doit remplir une fiche de compétences, en s’attribuant une note allant de 0 à 3 pour chacune des tâches techniques. Un ‘ 0 ‘ signifie que l’on ne maîtrise pas une opération ; et un ‘ 3 ‘, que l’on est à même de former d’autres personnes à cette tâche. Ce modèle organisationnel n’est, cependant, pas sans poser de problèmes. ‘ Les personnes travaillant en horaires décalés sont très vite déconnectées de la réalité. Il faut donc trouver un système qui leur assure une formation continue ‘, enchaîne Guy Faia. Cette réflexion a débouché sur un cycle de travail de six semaines. Durant chaque cycle, une équipe dispose d’une semaine de formation ou de travail en horaire normal. Parallèlement à cette organisation des ressources humaines, la surveillance du système d’information a été adaptée pour créer trois niveaux de contrôle : l’événementiel, le tendanciel et l’information. L’événementiel correspond à la console d’administration remontant les alarmes (signal vert ou rouge, selon le degré de gravité). Le tendanciel permet l’anticipation des incidents par la visualisation de courbes de tendances sur le trafic, la fréquence des alarmes et leur origine. Enfin, l’information est un niveau supplémentaire, mis en place pour collecter les renseignements sur les opérations de maintenance qui risquent de déclencher une alerte. Les ingénieurs systèmes et administrateurs d’applications doivent renseigner cette base avant toute intervention sur le terrain.

Patrol, pour les applications ; OpenView, pour le réseau

La supervision du système d’information (toutes les plates-formes Unix et NT) est assurée par Patrol, de BMC Software, pour la partie applicative et système. La surveillance du réseau (composé de plus de 200 liens WAN) est dévolue à OpenView Network Node Manager, de HP, et à une console TGS de Transpac. HP OpenView Network Node renvoie les alarmes à la console centrale Patrol. ‘ Les administrateurs disposent ainsi d’une vue centralisée des alarmes, notamment. Pour l’investigation, ils utilisent les outils dont ils disposent. Rien ne les empêche d’exploiter directement OpenView pour cette opération ‘, poursuit Guy Faia. Enfin, Patrol s’appuie sur des modules de connaissance personnalisés par les équipes de La Française des jeux, afin de les adapter à leurs besoins.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Xavier Bouchet