background preloader

Opendata

Facebook Twitter

Données publiques / Open Data - Vimperator. An API for European Union law. DocumentCloud. Dis, papa, c’est quoi l’open data ? Nombreux sont ceux qui estiment que le mouvement "open data" aura, à l'instar de l’apparition de l’alphabet, de l'internet ou encore de l'explosion des réseaux sociaux, des répercussions majeures dans nos sociétés. Connu pour ses logiciels non libres, Microsoft a eu la très bonne idée de demander à Regards sur le numérique (RSLN, animé par Spintank), son “laboratoire d’idées, de réflexions et d’expérimentations en ligne“, de se pencher sur la notion d’open data, et donc le partage de données publiques dans des formats ouverts, afin de libérer les données récoltées, ou produites, par les autorités publiques, et de les rendre, si possible gratuitement, à la société, ses citoyens, associations, entreprises privées et administrations publiques.

Au menu, très complet, digeste et instructif : une enquête et une trentaine d’articles, que l’on retrouve sur son site ainsi que dans le n° spécial de leur magazine, suivi d’une conférence, intitulée L’Open data, et nous, et nous, et nous ? Data: Where can I get large datasets open to the public. Solvent. Solvent Why do I need screen scrapers? Piggy Bank needs web pages to embed information in a format that it can understand. This format is called RDF (Resource Description Framework) and its main advantage is that makes machine processing a lot easier. Unfortunately, at these very early stages, not many web pages embed or link to such "purer" RDF information. Piggy Bank, however, is capable of executing a particular screen scraper on particular pages in order to "extract" the information it needs.

In short, screen scrapers allow you to turn a regular web page into a regular web page plus semantic data, and thus frees the data from the page/site that contains it. How do I use it? Watch a screencast of Solvent scraping the location of Starbucks coffee shops in Cambridge, MA and then use Piggy Bank to show the scraped data on a map.

Also read the Piggy Bank screen scraping howto that uses Solvent to write a screen scraper for Piggy Bank. What are the main features of Solvent? Credits. Welcome. The Big Clean. Overview of Python Tools for Working with Linked Data. Pattern: A Bundle of Data Mining Modules for Python. Overview of Text Extraction Algorithms.