lundi 8 octobre 2012

Atelier "Archivage du Web : BigData & PétaBox"


Mercredi 17 octobre 2012, de 12h à 13h30.

La collecte du Web est une opération effectuée au quotidien par les grands moteurs de recherche pour leurs besoins d’analyse des liens entre pages. On imagine les moyens gigantesques nécessaires à l’aspiration de dizaines de milliards de pages.
Mais, ces moteurs ne conservent pas les données dans la durée, tandis que nos institutions françaises, la BnF et l’INA, ont pour mission d’archiver le Web et ses contenus multimédias.
Si ces institutions n’archivent que le Web francophone, elles ont un devoir de conservation perpétuelle. Cette conservation pose des problèmes techniques très spécifiques : augmentation constante de la volumétrie des données, flux gigantesques de données, obsolescence des supports, etc.

Trois experts viendront animer cet atelier :
  • Clément Oury, chef du service du dépôt légal numérique à la BnF 
  • Claude Musso, Direction Déléguée aux Collections, Dépôt Légal du Web à l'INA
  • Baptiste Fluzin, membre des WebArchivists

Ils aborderont en particulier :
  • les enjeux de l'archivage du Web (Histoire et patrimoine)
  • les outils d'archivage (technologies, volumétrie, trafic,...)
  • les enjeux de la mémoire du patrimoine numérique (facebook, twitter,..)


Informations pratiques :
Entrée libre et gratuite
Mercredi 17 octobre 2012 de 12h à 13h30
Dans le Labo BnF
BnF - François Mitterrand
Paris XIII

Pour suivre cet atelier sur Twitter, utilisez le hashtag #LaboBnF.