En poursuivant votre navigation sur ce site, vous acceptez nos CGU et l'utilisation de cookies afin de réaliser des statistiques d'audiences et vous proposer une navigation optimale, la possibilité de partager des contenus sur des réseaux sociaux ainsi que des services et offres adaptés à vos centres d'intérêts.
Pour en savoir plus et paramétrer les cookies...

(Mise à jour) L'Europe veut un débat sur sa bibliothèque numérique

(Mise à jour) L'Europe veut un débat sur sa bibliothèque numérique
 

Six chefs d'Etat européens écrivent à Jose Manuel Durao Barroso, président de la Commission de Bruxelles, pour la mise en chantier d'un projet paneuropéen de numérisation des savoirs.

A voir aussi

Votre opinion

Postez un commentaire

52 opinions
  • Christian Tremblay
    Christian Tremblay     

    Entièrement d'accord avec vous :
    - la numérisation d'un ouvrage prend aujourd'hui quelques heures seulement
    - il faut regarder la question du droit d'auteur : passé le succès de librairie, les ouvrages ne vendent plus. La numérisation et l'accès gratuit peut aider à mieux faire connaître des auteurs. La même logique s'applique dans le domaine de la musique.
    - le livre papier a une valeur propre et ne peut être mis en danger par le numérique. On ne lit pas 300 pages à l'écran et l'impression papier a elle-même un coût.
    Il faut progresser dans cette réflexion pour construire un projet. Ensuite, pour le transmettre à Jean-Noël Jeanneney, il faudra lui écrire. La question est de savoir qui le fera.

  • Christian Tremblay
    Christian Tremblay     

    Votre idée est tout à fait juste et pourrait mobiliser beaucoup d'énergies. Jamais des fonds publics ne pourront réaliser ce projet magnifique. Le "libre" peut le faire.

  • fanou47
    fanou47     

    Pour lui écrire encore faudrait-il ne pas faire de fautes d'orthographe...

  • kanpanstu
    kanpanstu     

    Et pendant ce temps, Les responsables de Google (vu sur 01net ou zdnet...), en visite en France font leur tournée des popottes des éditeurs et leur font signer (avec plus ou moins de réussite, c'est vrai) des lettres d'intention sur la mise à disposition de leurs sources.

    A noter que Google dispose de fonds liés au mécénat autour de son projet et que cette mise à disposition n'a pas de raison d'être gracieuse.

    Par ailleurs, il faut étudier dans le détail le business model du livre : Un livre peut tout à fait être mis à disposition gracieusement, s'il n'est pas ou plus un succès en librairie, ne sera pas ré-édité et ne rapporte donc plus rien, mais si sa mise à disposition gratuite permet de favoriser un livre plus récent de l'auteur. Le tout bien avant la tombée dans le domaine public.
    Les éditeurs de soft ou de jeux l'ont compris avec de vieilles versions disponibles en download.

    Enfin, n'oublions pas qu'avec le livre, on n'est pas dans le numérique pur. Il demeure une praticité et un plaisir tactile de l'objet livre, qui devraient rendre les acteurs moins paranos que dans le son ou l'image.

  • kanpanstu
    kanpanstu     

    En effet, ce n'est pas gratuit mais on peut récupérer des versions de démo sur leur site irislink.com. Leur moteur d'OCR est intégré dans des solutions Pro(IrisPdf) ou GdPublic(ReadIris).
    Sinon ils distribuent des CD de démo sur les salons comme GEIDE, ou Documation.

    Je comprends tes problèmes car il y a un bruit pas possible sur les documents Gallica. Il y a 3 éditeurs majeurs d'OCR sur le marché : Iris, Scansoft (Omnipage), et une boite russe (FineReader). Maintenant ne rêve pas, globalement ça se vaut.

  • Coolmicro_
    Coolmicro_     

    Bonjour Kanpantsu,
    Et merci pour ton message.
    Je ne connais pas IrisPDFServer (et surtout, je doute qu'il soit gratuit...), j'utilise FineReader, qui est de bonne qualité. Le problème n'est pas vraiment de traiter des centaines de PDF d'un coup, mais plutot la qualité obtenue. Si je scanne moi-même, en 300 dpi, un livre actuel, bien imprimé, le résultat de l'OCR avec FineReader est excellent, et ne demande q'une bonne relecture. Quand je prends un scan de Gallica, les résultats de l'OCR demandent un travail 10 fois plus importants... As-tu testé IrisPDFServer avec les PDF image de Gallica ?

  • Colonel_
    Colonel_     

    m'h?
    heu, pas vraiment, et alors?
    Mon point etait que seuls les livre du domaine public (pas de droits d'auteur) peuvent etre mis en ligne 'gracieusement'. Rien d'autre, deja.
    Le fait que les editeurs aient des sources numerisee est une bonne remarque, mais vont-ils les lacher comme ca?

  • kanpanstu
    kanpanstu     

    A toutes fins utiles, il y a des solutions qui peuvent sacrément te simplifier la vie :
    Je connais IRISPdf Server qui applique un automate d'OCR en batch sur des fichiers TIFF ou PDF : Il les convertit en PDF "texte-caché", en texte ou en XML.
    Tu mets tes dizaines-centaines de PDF dans un répertoire, l'outil convertit le tout sans intervention. Reconnaissance nickel pour un scann en 300dpi, peu/pas de subsitution : évidemment, il faut tout de même vérifier.

  • kanpanstu
    kanpanstu     

    Je suppose que dans ton esprit, la ré-édition d'une oeuvre "patrimoniale" (Victor Hugo, Jules Verne et Voltaire sont réédités constamment) signifie que les éditeurs font des photocopies de la version originale du 17-18-19e siècle, ou la recopient à la plume en Chine peut-être...

  • Tof_
    Tof_     

    Une petit réflexion en plus du débat sur la liberté de la recherche européenne/Microsoft. Corrigez-moi si je me trompe :

    L'INRIA a annoncé avant-hier un partenariat avec Microsoft.

    Or si l'INRIA est chargé de la numérisation pour la bibliothèque électronique européenne, on donne donc un point d'entrée à Microsoft dans la boucle. Donc à Corbis (banque d'images) et MSN (moeur de recherche)...

    Je vois pas trop l'intérêt de s'associer à Microsoft/MSN/Corbis pour contrer Google... je n'y vois pour l'instant que des dangers, comme un pacte avec le Diable.

Lire la suite des opinions (52)

Votre réponse
Postez un commentaire