Passer au contenu

Au Génopole, les bits croquent le vivant

Evry, près de Paris, constitue le premier pôle de génomique en France. Un site où la masse de données brassée donne la migraine aux informaticiens. Reportage.

Une grosse partie de l’intelligence informatique du Génopole d’Evry réside dans ses sous-sols. Derrière des armoires anodines, dans le ronronnement entêtant des climatiseurs, 48 processeurs cadencés à 400 mégahertz (MHz) travaillent jour et nuit. “Nous avons 2 téraoctets de données en stock”, commente sobrement un chercheur. Dans son bureau, il est permis de vérifier l’assiduité des machines : des indicateurs colorés montrent que 40 des 48 processeurs travaillent en ce moment à plein régime. Nous sommes dans la tour informatique du pôle, abritant notamment Infobiogen, le centre de ressources en informatique appliquée à la génomique. Un bâtiment qui héberge également le Laboratoire de méthodes informatiques (Lami) et plusieurs jeunes pousses. Depuis sa création en 1990, la maîtrise de l’outil informatique est devenue incontournable dans ce pôle dédié à l’étude des gènes. C’est sous l’impulsion de l’Association française contre les myopathies (AFM) et grâce aux 27,6 millions d’euros (181 millions de francs) levés par le premier Téléthon en 1987 que la ville nouvelle d’Evry a pu accueillir le pôle de recherche en devenir. Diverses équipes se sont alors lancées avec succès dans la course au décryptage du génome. Des travaux qui ont largement contribué à l’explosion mondiale du volume de données. Aujourd’hui, la gestion de ces bases de données donne la migraine aux informaticiens. Car les informations ont été stockées avec les moyens du bord par les chercheurs.Résultat : les bases sont très hétérogènes, pour ne pas dire anarchiques. “Les bio-informaticiens passent leur temps à changer les fichiers de format”, se désole Éric Viara, à la tête de la société de services informatiques Sysra. Bilan, la SSII tente de rapatrier les données dans un seul système, ce qui représente un travail colossal. Le Lami pense avoir trouvé la solution : “Nous les encapsulons dans une interface propre, ce qui permet quand même d’en extraire des informations”, explique Gilles Bernot, directeur du laboratoire. Car cet amas de données doit être annoté, trié et comparé. Or, si lire les séquences des gènes est une chose, connaître leur rôle en est une autre, et les logiciels d’annotation ont pour objet de préciser les informations connues sur chaque gène. “L’annotation est un enjeu majeur de la bio-informatique”, précise Gilles Bernot. Quant à la comparaison… C’est une tâche à laquelle s’est attelée la petite Genomining, dirigée par William Saurin, précédemment directeur informatique du Génoscope (le pôle de séquençage d’Evry). Le Décrypthon, fruit d’un partenariat entre l’AFM et IBM, a ainsi été lancé à l’occasion du Téléthon. Objectif : établir la cartographie des protéines grâce au calcul distribué, en utilisant la puissance des ordinateurs d’internautes volontaires (lire aussi les pages Techno du Nouvel Hebdo du 25 janvier 2002).Autre espoir : arriver à modéliser puis simuler des systèmes biologiques. Des travaux qui n’en sont qu’à leurs balbutiements. “Ce n’est que très récemment que les biologistes ont rassemblé assez d’informations pour entreprendre un tel projet”, commente Gilles Bernot. Et l’informaticien de préciser que “les différences entre informaticiens et biologistes apparaissent alors en pleine lumière”. Les biologistes cherchent en effet davantage l’exception que la loi générale, contrairement aux informaticiens. “Formuler les logiciels permettant ce type de calcul oblige d’abord à limiter le nombre de concepts”, assure le chercheur… Pas d’inquiétude donc. Le pôle d’Evry ne risque pas dêtre à court de projets titanesques…

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Gilles Musi et Agathe Remoué