background preloader

Tesi Triennale

Facebook Twitter

Crawler. Da Wikipedia, l'enciclopedia libera.

Crawler

Un crawler (detto anche web crawler spider o robot), è un software che analizza i contenuti di una rete (o di un database) in un modo metodico e automatizzato, in genere per conto di un motore di ricerca. Un crawler è un tipo di bot (programma o script che automatizza delle operazioni). I crawler solitamente acquisiscono una copia testuale di tutti i documenti visitati e le inseriscono in un indice. Un uso estremamente comune dei crawler è nel Web. Sul Web, il crawler si basa su una lista di URL da visitare fornita dal motore di ricerca (il quale, inizialmente, si basa sugli indirizzi suggeriti dagli utenti o su una lista precompilata dai programmatori stessi). Ecco di seguito una tabella con i nomi degli spider dei principali motori di ricerca aggiornati al 21 febbraio 2008: Esempi di Web crawlers[modifica | modifica sorgente] La seguente è una lista di architetture pubbliche di crawler di carattere generico: Critiche[modifica | modifica sorgente]

jQuery: The Write Less, Do More, JavaScript Library. 4.8.11 The canvas element. Metadati: a cosa servono? La potenza dei microdati. Introduzione: semantica e rich snippet Leggendo questa guida dovrebbe essere chiaro che un punto focale di HTML5 è la semantica.

La potenza dei microdati

HTML5 ha introdotto infatti diversi tag semantici (come header, article o nav) che permettono di strutturare il contenuto secondo una logica, appunto, semantica. Ma questa suddivisione non assolve a tutte le necessità semantiche di cui il web ha bisogno. L’obbiettivo è quello di dare la possibilità a programmi come crawler dei motori di ricerca o screen reader di comprendere il significato del testo. Queste informazioni sono accessibili da questi programmi e rimangono (attualmente) invisibili per l’utente. Ecco come Google li descrive, all’interno della Guida di Strumenti per i Webmaster: “La specifica dei microdati HTML5 è un modo per assegnare etichette ai contenuti al fine di descrivere un tipo specifico di informazioni (ad esempio recensioni, informazioni su persone o eventi).

Figura 39 – Rich snippet relativo a un hotel I microdata in pratica I vocabolari. The future of HTML, Part 1: WHATWG. HTML isn't a very good language for making Web pages.

The future of HTML, Part 1: WHATWG

However, it has been a very good language for making the Web. HTML's ease of learning and the view source capability for browsers has bootstrapped the Web's popularity in an amazing way. The World Wide Web Consortium's (W3C) involvement in standardizing HTML has ensured that Web browsers all implement the same dialect, more or less. The emergence of CSS, and the corresponding growth of standards-based Web design as best practice has also averted HTML chaos and led to a better Web experience for users and developers alike. This much you probably know. No surprise then, that various groups are pushing again to develop HTML in a way that lets Web publishing and Web applications use more of the technology that's available in modern user interfaces.

The other two groups focus on future improvements. These articles will examine the work of the latter two groups: W3C and WHATWG. WHATWG, HTML 5, and Web Forms 2.0 So what's inside HTML5? Canvas.