Passer au contenu

Erik Boucher de Crevec?”ur (Inserm)

‘ De nouveaux logiciels permettent des recherches directement dans les contenus. ‘

Ce généticien de formation est devenu un expert des moteurs de recherche et de la gestion de contenu. Il ?”uvre désormais à la modernisation de la banque de données de l’Inserm.Décision informatique : Vous êtes à la tête du SI scientifique de l’Inserm depuis quelques mois. Quel est votre principal chantier ?


Erik Boucher de Crevec?”ur : Dans le cadre de la refonte globale du SI, je pilote la migration de l’extranet dédié à l’information sur la recherche, la banque d’informations sur les recherches (BIR). Cette application
permet de savoir qui travaille et sur quoi. Également base documentaire, elle intègre principalement à ce jour les titres, résumés et mots-clés des publications et des protocoles.Que voulez-vous faire de cette base de données ?


L’objectif est à la fois de la rationaliser, de l’ouvrir à la gestion de contenu et de la doter des dernières technologies de traitement de la langue. Contrairement aux outils de recherche actuels, qui s’appuient sur des résumés et des
mots-clés, de nouveaux logiciels permettent des recherches directes dans les contenus (texte des publications, protocoles, etc.). Grâce au text mining, ces outils alerteront, par exemple, de la découverte d’une nouvelle molécule
à l’étranger sans avoir à lire des centaines de publications scientifiques.Vous étiez précédemment chargé du développement numérique au Centre national de documentation pédagogique (CNDP). Quel est votre bilan ?


Mon dernier projet au CNDP a porté sur la réinformatisation du recueil des lois et règlements de l’Éducation nationale. Ce recueil, accessible à 10 000 abonnés, compte 30 000 pages remises à jour huit fois par an. Il a
fallu revoir toute la chaîne éditoriale qui passait par une saisie externalisée dans un format SGML. Les textes sont désormais directement saisis par les rédacteurs dans une base XML, TextML Server, grâce à un simple éditeur XML, XMetal. Ce qui
permet de produire, quasiment sans aucune adaptation, une nouvelle version du site, un CD, et une version papier.Vous êtes également à l’origine du moteur de recherche Spinoo…


Effectivement. Basé sur le logiciel K2 de Verity, Spinoo était au départ prévu pour le seul site du CNDP. Aujourd’hui, ce moteur indexe tous les sites de l’Éducation nationale, soit 2 millions de pages. Par nature, les professeurs
sont spécialement bavards dans la formulation de leurs requêtes avec, par exemple, des recherches sur ‘ le programme de mathématiques de 5e ‘. Ce qui m’a amené à personnaliser
l’interface de recherche par du code ?” ajout d’opérateurs booléens ?” afin d’améliorer la pertinence des résultats.Quel est votre parcours professionnel ?


Après un DEA de génétique humaine en 1992, j’ai obtenu un DESS d’informatique appliquée à la biologie. Mon mémoire portait sur le développement d’un logiciel de reconnaissance génétique destiné aux lycéens. J’ai continué à développer cet
outil en dehors de mes heures de travail. J’en suis aujourd’hui assez fier ! Baptisé Anagène, il est aujourd’hui préconisé par l’Éducation nationale pour la préparation au Bac. J’ai ensuite travaillé pour Jeulin, un éditeur de logiciels
pédagogiques. Pendant quatre ans, j’ai développé des pilotes qui simulaient le temps réel en ‘ bufférisant ‘ les données pour porter ces applications de DOS vers Windows 16 bits ! Puis ce fut
le CNDP, et maintenant, l’Inserm.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Patrick Brébion