Open Data

Facebook Twitter

OpenBelgium. Open data. Statistiques. Exemples villes open data. Open data. Opendata & données publiques. Comarquage.fr. Belgique : Données publiques / Open Data. Public cible Les développeurs et personnes à la recherche d’open data.

Belgique : Données publiques / Open Data

Recherche d’open data. Cleaning data using Google Refine: a quick guide. I’ve been focusing so much on blogging the bells and whistles stuff that Google Refine does that I’ve never actually written about its most simple function: cleaning data.

Cleaning data using Google Refine: a quick guide

So, here’s what it does and how to do it: Download and install Google Refine if you haven’t already done so. It’s free.Run it – it uses your default browser.In the ‘Create a new project’ window click on ‘Choose file‘ and find a spreadsheet you’re working with. If you need a sample dataset with typical ‘dirty data’ problems I’ve created one you can download here.Give it a project name and click ‘Create project‘. The spreadsheet should now open in Google Refine in the browser.At the top of each column you’ll see a downward-pointing triangle/arrow. Refine - Google Refine, a power tool for working with messy data (formerly Freebase Gridworks)

OpenData & Mobilité « QNTNKSR. Ca y est, c’est fait, j’ai eu le culot d’envoyer des mails aux webmasters / secrétaires / directeurs de la TEC (Transport En Communs wallons) pour avoir leur avis concernant l’ouverture des données.

OpenData & Mobilité « QNTNKSR

La situation actuelle. Le site infotec.be utilise la plateforme microsoftienne ASP .NET effectuant les requêtes vers un serveur Oracle i9 ainsi que vers leur serveur global HASTUS que l’entreprise win a mis en place. L’architecture date de 2004 et le site tombe au delà des 73.000 visiteurs. Je ne prendrai pas de point de vue concernant ASP, d’autres le font très bien à ma place. Data Publica, le portail français des données publiques et de l'open data.

OpenData & Mobilité – démonstration « QNTNKSR. Suite au billet concernant l’ouverture des données dans le secteur de la mobilité et en particulier de la TEC, j’ai réalisé quelques recherches dans le but de faire une démo.

OpenData & Mobilité – démonstration « QNTNKSR

Le tiroir du fond Lors de mes recherches sur l’infrastructure qu’utilise la TEC pour ces données je suis tombé sur le site DAMIER et en particulier sur ce document pdf listant tous les arrêts en province de Luxembourg. Extraction des données La première chose à faire est obtenir des données lisibles et parsables. J’ai donc utilisé pdftohtml qui permet de transformer un document pdf en document html navigable par page.