Passer au contenu

L’Ina et la BNF prêts à archiver le Web français

La loi Droits d’auteur et droits voisins impose le dépôt légal des sites Internet. L’Ina se charge des sites relatifs à l’audiovisuel, la Bibliothèque nationale de France du reste.

Le projet de loi Droits d’auteur et droits voisins, censé être débattu au Parlement les 20 et 21 décembre prochains, fait beaucoup parler de lui pour ce qui est de la musique et du peer to peer. Sans pour
autant se limiter à ces deux domaines. Le titre IV du texte prévoit ainsi une obligation de dépôt légal pour tous les ‘ signes, signaux, écrits, images, sons ou messages de toute nature faisant l’objet d’une communication
publique en ligne ‘.
Autrement dit, l’archivage du Web français, blogs inclus.La loi partage la tâche entre l’Institut national de l’audiovisuel (Ina) et la Bibliothèque nationale de France (BNF), qui tenaient une conférence de presse mercredi 14 décembre pour présenter ce chantier.
‘ Le périmètre de l’Ina n’est pas précisément déterminé dans la loi, note son PDG, Emmanuel Hoog. Mais pour nous, il est clair qu’il s’agit des sites de communication
audiovisuelle. ‘
C’est-à-dire les sites officiels de chaînes de télévision et de radios, les sites d’émissions (staracademy.tf1.fr, thalassa.france3.fr…), les sites institutionnels du secteur, comme celui du CSA, ou
ceux consacrés à ce secteur. Soit, selon l’évaluation de l’Ina, 10 000 sites.Cette catégorie mise à part, à la BNF d’archiver tout le reste. Ce qui ferait un bon million de sites Web, selon Jean-Noël Jeanneney, président de la BNF. L’archivage par la BNF se fait de trois manières différentes et
complémentaires : une collecte automatique de sites à l’aide de robots, une collecte semi-automatique en indiquant aux robots les sites à visiter et un archivage manuel de sites particuliers, échappant aux procédés automatiques.Pour les deux organismes, en tout cas, le processus et l’objectif sont les mêmes. Identifier les sites à archiver, les ‘ capter ‘, eux et leurs mises à jour successives, les indexer et les stocker pour, au
final, en organiser la consultation par un public de chercheurs. La loi donnera trois ans avant une mise en place effective du dépôt légal du Web.La quantité de données est bien sûr impressionnante. Autour des élections de 2002 et 2004, par exemple, 3 500 sites ont été collectés pour 23 millions de fichiers et 535 Go de données. ‘ La
seule collecte de décembre et janvier derniers a consisté à recueillir 120 millions de fichiers, et encore, seulement dans le domaine du .fr
, commente Jean-Noël Jeanneney. On est loin du rêve de
l’exhaustivité. ‘
Sans compter que tout est dupliqué et stocké dans un deuxième site, tenu secret, de la BNF. C’est le projet ‘ Cinquième Tour ‘, en cas de dommages causés aux quatre de la
bibliothèque François Mitterrand.

L’Ina et la BNF peuvent contourner les DRM

La quantité de données n’est pourtant pas le plus préoccupant. ‘ L’archivage de la télé et de la radio est beaucoup plus lourd que celui du Web, explique Jean-Michel Rodes, directeur du département de
l’Ina en charge du dépôt légal. C’est la diversité des objets qui complique la tâche. ‘ Mais il n’y a pas que cela.Il a, par exemple, été décidé que ce ne serait pas aux sites Web de faire la démarche de dépôt auprès de la BNF ou de l’Ina, mais que ce serait à ces derniers de les repérer et de les archiver. Contrairement à ce qui se passe pour
l’audiovisuel qui envoie ses contenus aux deux institutions. La raison ? Le sentiment général que les éditeurs de sites ne joueront pas le jeu s’ils sont contraints. ‘ Déjà, à l’époque de la radio et de la télévision, on
a eu toutes les peines du monde à obtenir les contenus ‘,
rappelle un responsable de l’Ina.Problème, le projet de loi légitime les systèmes anticopie et de gestion de contenus (les DRM, ou Digital Rights Management), c’est d’ailleurs la mesure la plus emblématique. Ils sont connus pour être utilisés sur
les CD et les fichiers musicaux des plates-formes légales mais, dans la loi, ils sont valables pour tout type de contenu numérique, y compris en ligne. Le fait de contourner ces dispositifs, dans la future loi, relève du délit de contrefaçon. D’où,
a priori, des problèmes en perspective pour le dépôt légal si les sites sont protéges.Pour éviter l’impasse, la loi interdit aux auteurs de refuser de communiquer leurs ?”uvres à des fins de dépôt légal auprès des deux organismes. De plus, un amendement du rapporteur de la loi, Christian Vanneste, autorise l’Ina
et la BNF à passer outre les DRM. Non pas en les ‘ crackant ‘, comme des pirates, mais en contactant les éditeurs et producteurs pour obtenir les moyens de déverrouiller les contenus (clés de décryptage, codes…). Une
procédure un peu fastidieuse et qui ne garantit pas que les intéressés acceptent. ‘ Nous attendons beaucoup des discussions avec les producteurs ‘, tempère Valérie Game, responsable juridique de
lIna.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Arnaud Devillard