En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.FERMER  x
Pour en savoir plus et paramétrer les cookies...
Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01Business
Applis, logiciels
Produits
Télécoms
Sécurité
Culture, médias
Politique, droits
Technos
Buzz, société
Jeux
Business

La BNF fait corriger ses œuvres numérisées par la communauté Wikimedia

Les ouvrages tombés dans le domaine public et numérisés pour la bibliothèque en ligne Gallica présentent des erreurs. Les internautes vont se charger de revoir 1 400 documents.

laisser un avis
Confier la réalisation d'une encyclopédie en ligne à des internautes lambda, est-ce une bonne idée ? Régulièrement, la qualité de Wikipedia fait débat. La Bibliothèque nationale de France (BNF), elle, a surtout retenu de ce genre de projet la capacité de travail d'internautes bénévoles et la force de la communauté.
C'est pourquoi elle a conclu un partenariat avec Wikimedia France, l'association qui soutient les projets communautaires et la diffusion de contenus libres, pour solliciter le concours d'internautes contributeurs. La BNF va donner accès sur Wikisource à ses documents tombés dans le domaine public et numérisés pour la bibliothèque en ligne Gallica. Ces œuvres ont été photographiées, et les images analysées par un programme de reconnaissance automatique de caractères.
Or, à cause des techniques employées pour imprimer les documents d'origine et de leur ancienneté, la numérisation n'a pas toujours été parfaite. « Les logiciels de reconnaisssance de caractères ont beaucoup progressé en trente ans, explique Dominique Stutzmann, expert technique documentaire à la BNF, mais il reste des passages mal reconnus. Avec l'impression mécanique du XIXe siècle, par exemple, les textes sont parfois mal encrés, des passages sont plus clairs que d'autres, etc. » Les transcriptions qui en résultent présentent donc des erreurs. Ce sont ces dernières que les internautes sont invités à traquer et à corriger.

1 400 ouvrages

La BNF a transmis à Wikisource 1 400 œuvres sous forme de fichiers. L'ensemble représente plusieurs milliers de pages, incluant des œuvres de George Sand, d'Emile Zola, de la comtesse de Ségur, d'Alphonse de Lamartine, de Stendhal, etc. (voir la liste intégrale).
Les internautes disposent en fait de deux versions de chaque ouvrage, le fichier image des pages photographiées et la transcription, pour pouvoir comparer les deux et, donc, de corriger la seconde si besoin.
La mise en ligne des documents est en cours, afin qu'ils soient progressivement « nettoyés » de leurs scories. « Comme sur Wikipedia, tout le monde peut vérifier les contenus, les corriger. Des équipes peuvent se former de manière spontanée pour travailler sur tel ou tel document, explique Christophe Henner, porte-parole de Wikimedia France. Ensuite, nous allons essayer d'animer ce projet régulièrement, de créer des événements, autour des anniversaires de tels auteurs ou œuvres par exemple. »
Le projet, qui repose entièrement sur le bénévolat des internautes, n'a pas de calendrier ni de date butoir, même si Wikimedia informera régulièrement la BNF de l'avancée des travaux. « Pour nous, l'enjeu est de montrer qu'un partenariat entre une institution publique et le monde privé, associatif, même, ça marche. » L'opération a surtout valeur de test, et les deux partenaires ne se sont pas imposés trop de contraintes. Dans un premier temps, les textes corrigés ne seront disponibles que sur Wikisource.
envoyer
par mail
imprimer
l'article
@01net sur
à lire aussi
SUR LES MÊMES THÈMES
Bull va développer la version 2 du site Relire de la BNF
Grâce à l'impression à la demande, achetez un livre ancien en librairie
La BNF, première lauréate des Data Intelligence Awards
BNF : bond de 15% de la fréquentation de Gallica en 2012
Adoptez un livre pour financer sa numérisation
Le château de Versailles ouvre ses grilles à Wikipédia
500 000 livres épuisés vont être numérisés et commercialisés
La fondation Wikimédia récolte 16 millions de dollars de dons
Le Muséum de Toulouse partenaire de Wikimédia
Le livre électronique s'installe à la Bibliothèque nationale de France
Wikipedia : un lifting prévu fin avril
Et 2 millions de dollars de plus pour Wikimedia
La numérisation du patrimoine des bibliothèques à l'étude
Wikipedia officiellement sur l'iPhone
La BNF pourrait confier à Google la numérisation de ses livres
De quoi j'me mail, le podcast [18/04]
« Welcome to New York » sortira sur Internet, mais pas dans les salles françaises
Le Guardian et le Washington Post récompensés pour leurs révélations sur la NSA
Près de la moitié des comptes Twitter sont muets