background preloader

Bnf

Facebook Twitter

Le dépôt légal de l'internet français à la Bibliothèque nationale de France. Le dépôt légal de l'internet en pratique. Début 2006, le Bulletin des bibliothèques de France invitait la Bibliothèque nationale de France (BnF) à faire part à ses lecteurs des actions engagées pour étendre sa mission de dépôt légal aux publications de l’internet [2]. Nous indiquions alors les principes directeurs, mais aussi les incertitudes qui pesaient sur ce qu’il convenait encore d’appeler un projet expérimental.

Un peu plus de deux ans plus tard, de nombreux obstacles ont pu être levés : le législateur a donné à l’archivage du web un cadre juridique ; l’établissement s’est doté d’une infrastructure informatique assurant la sauvegarde et le traitement continus de grandes quantités de données ; les collections sont désormais accessibles au public ; enfin, l’équipe projet s’est muée en un service du dépôt légal numérique qui a trouvé sa place dans l’organisation de la BnF. Comment ce dispositif fonctionne-t-il concrètement ? Préfigure-t-il des évolutions profondes pour la profession ?

L’internet français Histoire et missions. Infos légales » Présence Éco. Infos légales – ISSN – Dépôt légal (loi 2006-961 initiée par le robot Heritrix) Direction de la publication & de la rédaction : Annie Aubert Siège rédactionnel et de direction : 9 avenue de la Plage, Saint Georges de Didonne (17) Éditorialistes : Denis Guardia, Annie Aubert, Jack Chaca, Andrea Mulberry Pigiste Chroniques Hebdomadaire, Responsable Économie : Philippe Salaverry, Michel Edde Pigiste Fiscalité & Droit des Sociétés : Frédéric Bontemps, Oscar Gutierrez Pigistes Arts, Livres et Bien-être : Claudine Finidori, Annie Aubert, Christophe Orué, Joan Did (correspondante) Email : redaction.presenceeco@hotmail.fr Chargée d’animation : Joaquin Benavides Responsable infographique : Romano Caspani Titre : Présence éco.fr BNF légalement déposé avec déclaration pour collectes de manière automatique à l’aide du robot Heritrix Pour tous les textes et œuvres présentés sur ce site : © Présence-Eco.fr 2013.Tous droits d’auteur des œuvres réservés.

Hébergement : OVH. Le fichier Robots.txt snobé par la Biblothèque Nationale de France! Les robots vont d’abord analyser ce fichier pour savoir s’il faut indexer ou non cette page web. Grace à ce fichier on peut donc choisir les robots qui vont analyser le site. Ce fichier est une proposition du World Wide Web Consortium W3C pour avoir un internet plus propre, et des moteurs de recherche plus précis. Ainsi tous les développeurs ont dû se conformer à cette nouvelle règle. Cependant ce fichier robots.txt n’est pas respecté par tous les sites. En effet certains sites comme la Biblothèque Nationale de France n’empêchent pas leurs robots (Heritrix pour la BnF) d’analyser tous les sites et de les indexer dans leurs bases de données. En vertu du Code du patrimoine (art L132-2-1), la BnF est autorisée à ne pas respecter le protocole d’exclusion de robot, également appelé protocole robots.txt.

Cependant si tous les robots fonctionneraient ainsi, le fichier robots.txt deviendrait totalement obsolète. Cela va à l’encontre des recommandations de la W3C. Avis aux webmasters. Dans les coulisses du dépôt légal de l’Internet - En avril dernier, la Bibliothèque nationale de France (BNF) annonçait qu’elle allait effectuer une collecte des sites Internet impliqués dans les campagnes présidentielles et législatives de 2012, de la même manière qu’en 2002 et 2007(voir notre article). Cette opération ponctuelle de capture de milliers de pages rentre dans le cadre des missions dévolues au dépôt légal de l’internet, qui sauvegarde depuis plusieurs années le Web français à des fins de conservation et de valorisation du patrimoine national. Clément Oury, responsable du dépôt légal de l’internet à la BNF, nous a reçu pour nous présenter de manière plus détaillée son fonctionnement.

Une logique de conservation depuis François 1er Depuis 1537, la BNF a pour mission de collecter au titre du dépôt légal divers documents mis à la disposition du public, à commencer par les documents imprimés. Obtenir une représentation du Web français à un moment donné Capture du site PC INpact, tel qu'on pouvait le voir le 1er janvier 2011. Ipress2012_art_spar.pdf (Objet application/pdf) Archives d’Internet : Papa Noël sait si tu as copié le contenu d’un site. Moi qui naïvement utilisais la Wayback Machine de Archive.org dans un objectif de recherche pour mon mémoire, j’ai récemment appris que cela pouvait également être un outil pour aller chercher des contenus de domaines expirés et les réutiliser (sans en avoir été l’auteur). Voilà donc une petite occasion pour moi de vous parler des archives de l’Internet français enregistrés par la Bibliothèque Nationale de France.Attention, ceci est un billet Gentil-Hat.

Une histoire de dépôt légal Dans le cadre d’une publication papier, dans l’ancien temps donc, (Florian Marlin vit dans l’ancien temps, cela explique sa nature de Géant) lorsqu’on décide d’éditer un livre en France il faut aller voir la BNF et lui dire « bonjour monsieur BNF, j’ai publié un pavé, voici trois exemplaires » (ordonnance de Montpellier de 1537).

On appelle ça le dépôt légal. Il a notamment pour objectif de centraliser toutes les livres et de s’assurer de leur pérennité. Comment cela se passe ? Source. Une simple adaptation ? L’héritage du dépôt légal face à la mutation numérique. Clément Oury - Chef du service du dépôt légal numérique (BnF) La diffusion des technologies numériques, et notamment le rôle croissant des applications et des services de l’Internet, ont radicalement changé notre façon d’accéder, de produire, de diffuser et de partager des produits culturels – modifiant ainsi notre rapport à la culture. Il s’agit d’un bouleversement fondamental, de trois points de vue. On peut tout d’abord remarquer la rapidité du phénomène : le Web a une petite vingtaine d’années, et son utilisation grand public est plus récente encore. Il faut ensuite souligner sa dimension universelle, c’est-à-dire sa capacité à toucher tous les acteurs (auteurs, éditeurs, diffuseurs, « consommateurs », analystes, chercheurs) et tous les domaines (musique, cinéma, livre, production scientifique…).

Les institutions patrimoniales ont dû, comme leur public, s’adapter à ce nouvel environnement. Le dépôt légal : de la naissance de l’imprimerie à l’invention du Web. Bibliothèque de l'Enssib -Détails de la notice. Impression à la demande et dépôt légal. Mardi 04 octobre 2011 Il y a, en France, un flou juridique con­cer­nant l’impression à la demande (POD ou Print On Demand). Ces ser­vices pro­posés par Lulu, The­BookEdi­tion ou d’autres sont de plus en plus plébisc­ité par les auteurs auto-édités : parce que ça ne demande pas d’investissement de base.

On ne paye rien tant qu’on ne vend rien, puisque le livre n’existe pas physique­ment tant qu’il n’est pas vendu. Pas de gaspillage. Or, tout livre imprimé à des­ti­na­tion d’un pub­lic élargi (pas sa famille et ses amis, quoi) doit faire l’objet d’un dépôt légal avant la mise en vente. Donc, théorique­ment, il faut envoyer à la BNF un exem­plaire du livre que vous pro­posez en POD avant de le ven­dre en ligne.

Théoriquement. Dans le for­mu­laire BNF pour le dépôt légal, vous devez indi­quer un ISBN (c’est pas dur à obtenir ça) et surtout un tirage… Dans le POD, le pre­mier tirage est de… 1 ? Or, deux exem­plaires, ce n’est pas pour un pub­lic élargi ! Partagez cet article sur: Dépôt légal des sites Web. Types de documents Le dépôt légal concerne tous les types de publications diffusées sur l’internet : sites institutionnels ou personnels, revues d’accès gratuit ou payant, blogs, sites commerciaux, plateformes de vidéos ou de livres numériques… Les contenus édités ou les éditeurs doivent avoir un lien avec le territoire français.

Il s’agit avant tout des sites web enregistrés en .fr ainsi que ceux des départements et territoires d’outre-mer. D’autres sites web en .com, .org, .net, etc. édités par des personnes physiques ou morales domiciliées en France font également partie du périmètre. La correspondance personnelle et les espaces privés des réseaux sociaux ou des sites intranet sont exclus du champ d'application du dépôt légal. Modalités pour les éditeurs, producteurs et hébergeurs Contrairement au dépôt légal traditionnel (des publications imprimées ou sur support audiovisuel, par exemple), le dépôt légal des sites web n'implique aucune démarche active de la part de l’éditeur. Welcome - NetarchiveSuite. Archives de l'Internet. Les « archives de l’internet », photographies de l’internet français constituées par la BnF, peuvent être consultées en Bibliothèque de recherche.

Un cadre juridique établi en 2006 La Bibliothèque a pour mission de collecter, conserver et communiquer les sites de l'internet du « domaine français » au titre du dépôt légal (Code du patrimoine, articles L131-1 à L133-1 et R131-1 à R133-1). À ce titre, elle moissonne en priorité : les sites en .fr ou autres extensions liées au territoire (.re., .nc., etc.) ; des sites hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France. Les collectes sont réalisées à l'aide de robots qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’internet, en cliquant de lien en lien.

Des échantillons représentatifs Modes de consultation. La mémoire de la Toile. La BnF autorisée à archiver l'ensemble du web français. La Bibliothèque nationale de France sauvegarde le web électoral de 2012. La BnF va archiver les sites politiques. La Bibliothèque nationale de France, période électorale oblige, annonce qu'elle va se mettre en quête d'une collecte massive de sites électoraux. Les robots d'archivage vont ainsi arpenter le net, en collaboration avec les bibliothèques de dépôt légal en région, pour sauvegarder ce qui doit l'être. Dans une communication, l'établissement indique qu'il va s'intéresser de près - de prêt ? - à « toutes les publications en ligne ayant un rôle à jouer dans la campagne : sites des candidats, des partis et des groupes de soutien, mais aussi sites d'analyse, de presse ou de militants ».

Ces derniers seront ainsi archivés et stockés en vue de préserver leurs messages et interventions au cours de cette campagne. L'ensemble des sites ainsi collectés sera accessible depuis les bibliothèques de recherche, et comptera parmi les nombreux autres déjà préservés du temps et de l'oubli. Car c'est connu, Sic transit gloria internauti... L’archivage du Web. Le dépôt légal d'Internet à la Bibliothèque nationale de France. Avec 25 millions d’internautes, 12 millions de foyers équipés d’un micro-ordinateur et un nombre croissant de sites publics (plus de 445 000 pour le « .fr » fin 2005), Internet a désormais atteint toutes les sphères de la société française : e-administration, arts numériques, édition en ligne, enseignement à distance, commerce et publicité, expositions virtuelles, bibliothèques numériques, blogs… Beaucoup d’activités se sont déplacées vers les écrans ou sont apparues avec eux.

L’enjeu dépasse celui d’une simple mutation technique. Des processus sociaux sont à l’œuvre, qui montrent que des communautés explorent, intègrent et digèrent de multiples possibilités d’édition et d’échanges. Les internautes réinventent les modalités d’intervention dans l’espace public en même temps qu’ils bouleversent les formes, les frontières et les cartes documentaires. Un cadre juridique qui inscrit le dépôt légal d’Internet dans la continuité de son histoire Qui est concerné par ce nouveau dispositif ?