RTFlash

L'INA et l'ENS associés pour le dépôt légal du Web

Les deux institutions se sont associées pour évaluer des solutions de collecte, d'analyse et d'archivage des contenus des sites français. L'accord est passé inaperçu. Pourtant, il y a un mois, l'Institut national de l'audiovisuel (INA) et l'Ecole normale supérieure (ENS) se sont associés pour un programme d'expérimentations et de recherche sur l'archivage de l'Internet. Son nom : "Toute la mémoire du monde". Son but : expérimenter et évaluer toutes les solutions de collecte, d'analyse et d'archivage des contenus des sites français et au-delà, explorer les conditions du démarrage d'un dépôt légal de l'Internet, prévu par le projet de loi sur la société de l'information (LSI). A la manoeuvre : le laboratoire de physique théorique de l'ENS, l'Ecole normale supérieure étant devenue un carrefour des sciences de l'Internet. L'idée d'archiver le Web n'est pas neuve. Des universitaires américains ont entrepris d'archiver les pages Web des campagnes présidentielles américaines de 1996 et 2000, et les archives liées aux attaques terroristes du 11 septembre à New York et Washington. Par ailleurs, une étude publiée en octobre 2001 par l'Online Computer Library Center souligne la vitalité du Web : le nombre de sites Web est passé de 1,5 million en 1997 à 8,7 millions en 2001. Ce qui n'empêche pas ces contenus d'être instables, volatils : 70 % des pages ont une durée inférieure à quatre mois, et la moitié des sites en ".com" changent tous les onze jours. "Le Net est un média dont il devient important de conserver la mémoire. Des initiatives comme celles de Brewster Kahle en sont l'illustration", souligne Dominique Pignon, du département de physique de l'ENS, qui analyse les structures de Web et va mener l'expérimentation d'archivage patrimonial du Web français. Cette opération résume à elle seule les grandes problématiques de l'archivage. Il ne faut pas se contenter de stocker, il faut aussi pouvoir retrouver l'information lorsqu'elle sera archivée, ce qui pose la question de l'indexation et du choix des outils de recherche. La question de la pérennité des supports de stockage ne doit pas être évacuée. Comment lire les différents formats dans trente ans ? Par ailleurs, le projet ne vise pas l'exhaustivité, notion héritière de la dimension policière du dépôt légal, ce qui posera la question des contenus à conserver. Parallèlement à cet effort d'archivage, l'INA et l'ENS vont s'attacher à analyser les usages de l'Internet : pratiques des utilisateurs, évolution des usages, analyse des relations entre outils d'accès et intelligibilité des contenus seront passées en revue.

Le Monde : http://interactif.lemonde.fr/article/0,5611,2871--254445-0,FF.html

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

    Recommander cet article :

    back-to-top