Internet Archive

> >

Aaron Swartz digital archive. Using Wayback Machine for Research. The following is a guest post by Nicholas Taylor, Information Technology Specialist for the Repository Development Group at the Library of Congress.

Prompted by questions from Library of Congress staff on how to more effectively use web archives to answer research questions, I recently gave a presentation on “Using Wayback Machine for Research” (PDF). I thought that readers of The Signal might be interested in this topic as well. This post covers the outline of the presentation. The Wayback Machine that many people are familiar with is the Internet Archive Wayback Machine. The Internet Archive is an NDIIPP partner and a Founding Member of the International Internet Preservation Consortium. While the Internet Archive has been primarily responsible for the development of Wayback Machine, it is an open source project. Internet Archive’s Wayback Machine is just one among many, however; over half of the web archiving initiatives listed on Wikipedia provide access via Wayback Machine. Archiver le web. Brewster Kahle à la fondation Internet Memoryth©Radio France Première partie : Archiver le web.

Garder de cet espace mouvant qu’est le web, ce qu’il produit, stocke et fait circuler, l’idée n’est pas nouvelle. Et elle a été mise en place de manière effective depuis longtemps déjà. Suite à une initiative privée avec l’Internet Archive qui depuis 1996 archive les contenus du web, et suite à une initiative publique depuis 2006 avec, en France, le dépôt légal qui donne comme mission à la Bibliothèque nationale de France et l’INA (Institut National de l’Audiovisuel) d’archiver le web français. Ce qui va nous intéresser aujourd’hui, ce sont deux questions. D’abord la philosophie générale de l’archivage du web, celle qui réunit Internet Archive, le dépôt légal du web français et le consortium international pour la préservation de l’Internet qui essaie d’organiser l’archivage à l’échelle internationale.

La transcription de cet entretien est disponible sur InternetActu.net. Archive-It - Web Archiving Services for Libraries and Archives. Internet Archive. Un article de Wikipédia, l'encyclopédie libre.

Pour les articles homonymes, voir IA. Serveurs de l'Internet Archive. Pour assurer la stabilité et la sécurité des données archivées, un site miroir fonctionnel est conservé à la Bibliotheca Alexandrina[1] en Égypte. L’IA met gratuitement ses collections à la disposition des chercheurs, historiens et universitaires. Elle est membre de l’American Library Association et est officiellement reconnue comme bibliothèque par l’État de Californie[2]. Le robot d'indexation utilisé par l'IA est Heritrix, un logiciel libre. Histoire[modifier | modifier le code] L'Internet Archive fut fondée en 1996 par Brewster Kahle. Wayback Machine[modifier | modifier le code] La Wayback Machine (littéralement « la machine à revenir en arrière ») est la partie des clichés du Web de l'IA.

En 2006, la Wayback Machine contenait près de 2 petaoctets de données. L'appellation « Wayback Machine » renvoie à des épisodes du The Rocky and Bullwinkle Show, où M. Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine. Heritrix - Home Page. Internetarchive/heritrix3 - GitHub.