Passer au contenu

Julien Masanès (BNF) : ” Aujourd’hui, quand un site s’arrête ou est modifié, aucune trace ne subsiste “

Le projet de Loi sur la société de l’information (LSI), prévoit une prolongation du dépôt légal pour Internet, pour conserver la mémoire du Web. L’une des premières actions menées par la BNF dans ce cadre consiste à stocker tous les sites liés à la campagne électorale en cours. L’idée d’archiver le Web n’est pas sans soulever de nombreuses questions aussi bien techniques qu’éthiques.

Bonsoir à toutes et à tous, nous sommes heureux de recevoir Julien Masanès. Bonsoir à tous et à toutes.Journaliste 01Net.


: A quand remonte le dépôt légal et à quoi sert-il ?
Le dépôt légal remonte à 1537 et il sert à assurer une collecte très large de tout ce qui est publié en France pour permettre aux chercheurs d’y avoir accès, parfois plusieurs siècles après. La collecte se fait de manière très large, pour que des livres ou des revues qui passent inaperçues, à l’époque de leur parution, mais qui présentent un grand intérêt plus tard soit également conservés. exfandesiteetsurf : Google propose un moteur de recherche sur les newsgroups. Est-ce légal d’archiver ainsi ce que des gens ont dit, il y plusieurs dizaines d’années en arrière, alors qu’ils croyaient pouvoir parler librement ? A-t-on la possibilité de demander l’effacement de certains messages ? Effectivement, le cas des newsgroups, comme celui du mail d’ailleurs, pose clairement le problème de la frontière entre l’expression publique et l’expression privée, qui ont tendance à se regrouper sur un même support technique qu’est le réseau Internet. Pour notre part, nous ne visons à archiver que ce qui relève de la publication et cela explique que nous nous focalisions sur le Web, protocole de diffusion de contenus publics par excellence. Je crois, cependant, que Google offre la possibilité d’effacer des messages archivés sur demande. gabrieldib : Archiver, c’est bien, mais il faut indexer pour que cela soit réutilisable : comment indexer audio et vidéo ? Avec quelle segmentation ? Effectivement, archiver sans donner les moyens pour retrouver ces contenus n’aurait pas de sens. Cependant, nous ne pensons pas pouvoir faire dans ce domaine mieux que les grands moteurs de recherche. De fait, les contenus audio et vidéo sont souvent repérables sur le Web grâce à ce qui les entoure et notamment les pages html. C’est pourquoi nous envisageons d’indexer les contenus textes (HTML, PDF, etc.) pour permettre de repérer l’information dans l’archive au moins aussi bien que sur le Web réel.Blake : Ca sert à quoi d’archiver le Web ? concrètement… Je crois qu’on peut tous constater que le Web devient un moyen de plus en plus important pour véhiculer l’information, les savoirs, les débats de notre époque. Or, tout cela intéressera certainement des chercheurs dans 10, 50 ou 100 ans, qui s’intéressent à l’histoire des m?”urs, de la culture, de l’économie, de la technique… C’est pourquoi il est important de conserver ces traces pour l’avenir. Ce travail de mémoire qui a été fait pour le livre, et les différentes publications jusqu’à nos jours permet à beaucoup de chercheurs de travailler aujourd’hui sur ce riche matériel. Pour Internet, la question est d’autant plus aiguë que quand un serveur s’arrête ou qu’un site est modifié, aucune trace ne subsiste, contrairement au livre que l’on pouvait parfois retrouver longtemps après chez des collectionneurs ou des libraires.raph : Archiver c’est sûrement très bien, mais à quel prix ? Nous le savons tous, même si en apparence, Internet est gratuit, rien n’est réellement gratuit ! Donc, est-ce réellement rentable, au vu des coûts de stockage, d’investir dans un archivage, qui, dans quelques dizaines d’année, sera, qui sait, dépassé. De plus, l’informatique évolue sans cesse. Comment garantir une lecture des données dans quelques années ? Pour répondre à votre première question, disons que nos expérimentations actuelles visent entre autres à évaluer les coûts de stockage et de pérennisation de ces contenus. Concernant la possibilité de lire ces données à l’avenir, c’est un problème qui ne se pose pas que pour les archives Web, il se pose pour l’ensemble des documents numériques produits par notre société, et il est nécessaire de prévoir dès aujourd’hui les moyens pour garder un accès à cette mémoire numérique. Cela nécessite notamment de bien connaître les formats utilisés et éventuellement de migrer certains contenus dans de nouveaux formats. Une réflexion d’ensemble est en cours sur ce sujet à la BNF en collaboration avec d’autres organismes qui conservent l’information numérique comme par exemple le CNES.Kyo : Est-ce que les données archivées par la BNF sont commercialisables et vont être commercialisées ? Non, la BNF n’a pas mission de commercialiser les contenus qu’elle archive. Journaliste 01Net. : La principale préoccupation des internautes concernent les pages persos. Que répondez-vous ? Nous faisons une différence entre les pages persos, qui ont une vocation privée, et celles qui ont une vocation publique. Il y a certains sites personnels, de grande qualité et qui ont clairement vocation à toucher un public large et Internet permet justement à des particuliers de ” publier “. Ce serait dommage de passer à côté de ce caractère nouveau qu’apporte ce média. toma : Est-ce que tout le monde pourra consulter les archives ou ce sera restreint un peu comme certains ouvrages de la BNF qui sont réservés aux chercheurs ? Je voudrais dire d’abord que les ouvrages de la BNF ne sont pas ” réservés ” aux chercheurs mais, communiqués que lorsqu’on ne peut les trouver ailleurs, ce qui n’est pas pareil. Pour l’archive du Web, ce sera au législateur de décider si l’on peut donner un accès en ligne ou pas en respectant le droit d’auteur bien sûr.Zibou : L’archivage sera-t-il humain ou robotisé ? Vu la quantité d’information que contient le Web, il est nécessaire d’utiliser au maximum les possibilités de collecte et de traitement automatiques. Mais dans certains cas, notamment lorsque les robots ne peuvent pas accéder à certaines parties de sites, ce que l’on appelle le Web invisible, il sera nécessaire de prendre contact avec les webmestres pour voir avec eux comment effectuer un dépôt du site. Nous travaillons actuellement sur cette question, avec plusieurs dizaines de sites très différents, pour établir avec eux les modalités pratiques de travail et préparer la future loi sur le dépôt légal de l’Internet.Journaliste 01Net. : Quel est le rôle de la BNF et celui de l’INA ? Nous travaillons tous les deux à la demande du ministère de la Culture sur cette question avec, bien sûr, l’expérience de nos métiers respectifs qui sera utile, vu ce qu’est le Web aujourd’hui. Gaston : Aura-t-on la possibilité de modifier des informations personnelles, comme c’est le cas dans le cadre d’Informatique et Liberté ? C’est une question qui devra être débattue notamment avec la CNIL, pour trouver un bon équilibre entre la protection de la vie privée et le droit de mémoire.exfandesiteetsurf : Avez-vous des objectifs quantifiés ? C’est illusoire de vouloir tout archiver. Oui, c’est illusoire de vouloir tout archiver. Non seulement tous les sites mais toutes leurs modifications. Cependant, comme il est très difficile de prévoir ce qui pourra intéresser les générations futures nous avons le souci d’archiver quand même largement la baisse du prix des moyens de stockage nous permet d’être optimiste. Dred : Que pensez-vous des expérimentations comme la plus longue page Web du monde ?Nous cherchons plutôt la dernière page du Web 😉 Merci à Julien Masanès, le mot de la fin ? Merci pour toutes vos questions. Je vous invite à venir sur le site de la BNF pour en savoir plus : http://www.bnf.fr et notamment pour nous aider à archiver les sites sur les élections législatives et présidentielles 2002. Pour le reste, je ne doute pas que certains dentre vous qui faites des sites passeront à la postérité, au moins dans nos archives. Au revoir et à bientôt.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


La rédaction