background preloader

Open Data

Facebook Twitter

OpenBelgium. Open data. Statistiques. Exemples villes open data. Open data. Opendata & données publiques. Comarquage.fr. Belgique : Données publiques / Open Data. Public cible Les développeurs et personnes à la recherche d’open data. Recherche d’open data Actuellement, le nombre d’ensembles de données est assez limité, mais il grandira rapidement. Participants - Développeurs Si vous acceptez les conditions d’utilisation, vous pouvez demander de l’aide dans votre recherche d’ensembles de données et lancer des suggestions d’améliorations. Participants - Gouvernements Si vous travaillez pour une administration belge (de quelque niveau que ce soit) ou un parastatal, vous pouvez poser votre candidature en tant qu’éditeur de données ouvertes, ce qui vous permettra d’ajouter vos propres ensembles de données et recevoir en retour les avis de la communauté open data.

Cleaning data using Google Refine: a quick guide. I’ve been focusing so much on blogging the bells and whistles stuff that Google Refine does that I’ve never actually written about its most simple function: cleaning data. So, here’s what it does and how to do it: Download and install Google Refine if you haven’t already done so. It’s free.Run it – it uses your default browser.In the ‘Create a new project’ window click on ‘Choose file‘ and find a spreadsheet you’re working with.

If you need a sample dataset with typical ‘dirty data’ problems I’ve created one you can download here.Give it a project name and click ‘Create project‘. The spreadsheet should now open in Google Refine in the browser.At the top of each column you’ll see a downward-pointing triangle/arrow. Click on this and a drop-down menu opens with options including Facet; Text filter; Edit cells; and so on.Click on Edit cells and a further menu appears.The second option on this menu is Common transforms.

Click on this and a final menu appears (see image below). Like this: Refine - Google Refine, a power tool for working with messy data (formerly Freebase Gridworks) OpenData & Mobilité « QNTNKSR. Ca y est, c’est fait, j’ai eu le culot d’envoyer des mails aux webmasters / secrétaires / directeurs de la TEC (Transport En Communs wallons) pour avoir leur avis concernant l’ouverture des données.

La situation actuelle. Le site infotec.be utilise la plateforme microsoftienne ASP .NET effectuant les requêtes vers un serveur Oracle i9 ainsi que vers leur serveur global HASTUS que l’entreprise win a mis en place. L’architecture date de 2004 et le site tombe au delà des 73.000 visiteurs. Je ne prendrai pas de point de vue concernant ASP, d’autres le font très bien à ma place. Concernant Oracle c’est un choix que beaucoup d’entreprises font mais lorsqu’on sait que ce serveur n’a plus de support, ça doit être la joie dans la section IT. Hastus et Hastinfo quant à eux semble être des logiciels très complexes et performants au vu de leur utilisation chez presque tous les transporteurs européens, je ne m’aventurerai pas dans une critique sans m’être documenté d’avantage.

Développements futurs. Data Publica, le portail français des données publiques et de l'open data. OpenData & Mobilité – démonstration « QNTNKSR. Suite au billet concernant l’ouverture des données dans le secteur de la mobilité et en particulier de la TEC, j’ai réalisé quelques recherches dans le but de faire une démo. Le tiroir du fond Lors de mes recherches sur l’infrastructure qu’utilise la TEC pour ces données je suis tombé sur le site DAMIER et en particulier sur ce document pdf listant tous les arrêts en province de Luxembourg. Extraction des données La première chose à faire est obtenir des données lisibles et parsables. J’ai donc utilisé pdftohtml qui permet de transformer un document pdf en document html navigable par page.

La commande est très simple : pdftohtml votredocument.pdf -enc Latin1 Le Latin1 vous permet d’utiliser des caractères accentués. J’obtiens donc un document html contenant le contenu du tableau mais en ayant un élément par ligne comme ceci : Numéro Localité Rue Arrêt Lignes Ni une ni deux j’écris un script php me permettant de transformer le tout en fichier csv comme ceci : Numéro; Localité; Rue; Arrêt; Lignes.