Open Data

Facebook Twitter

OpenBelgium. Open data. Statistiques. Exemples villes open data. Open data. Opendata & données publiques. Comarquage.fr. Belgique : Données publiques / Open Data. Public cible Les développeurs et personnes à la recherche d’open data.

Belgique : Données publiques / Open Data

Recherche d’open data Actuellement, le nombre d’ensembles de données est assez limité, mais il grandira rapidement. Participants - Développeurs Si vous acceptez les conditions d’utilisation, vous pouvez demander de l’aide dans votre recherche d’ensembles de données et lancer des suggestions d’améliorations. Participants - Gouvernements Si vous travaillez pour une administration belge (de quelque niveau que ce soit) ou un parastatal, vous pouvez poser votre candidature en tant qu’éditeur de données ouvertes, ce qui vous permettra d’ajouter vos propres ensembles de données et recevoir en retour les avis de la communauté open data.

Cleaning data using Google Refine: a quick guide. I’ve been focusing so much on blogging the bells and whistles stuff that Google Refine does that I’ve never actually written about its most simple function: cleaning data.

Cleaning data using Google Refine: a quick guide

So, here’s what it does and how to do it: Download and install Google Refine if you haven’t already done so. It’s free.Run it – it uses your default browser.In the ‘Create a new project’ window click on ‘Choose file‘ and find a spreadsheet you’re working with. If you need a sample dataset with typical ‘dirty data’ problems I’ve created one you can download here.Give it a project name and click ‘Create project‘. The spreadsheet should now open in Google Refine in the browser.At the top of each column you’ll see a downward-pointing triangle/arrow. You’ll see there are a range of useful functions here to clean up your data and make sure it is consistent.

Trim leading and trailing whitespace Sometimes in the process of entering data, people put a space before or after a name. Collapse consecutive whitespace Like this: Refine - Google Refine, a power tool for working with messy data (formerly Freebase Gridworks) OpenData & Mobilité « QNTNKSR. Ca y est, c’est fait, j’ai eu le culot d’envoyer des mails aux webmasters / secrétaires / directeurs de la TEC (Transport En Communs wallons) pour avoir leur avis concernant l’ouverture des données.

OpenData & Mobilité « QNTNKSR

La situation actuelle. Le site infotec.be utilise la plateforme microsoftienne ASP .NET effectuant les requêtes vers un serveur Oracle i9 ainsi que vers leur serveur global HASTUS que l’entreprise win a mis en place. L’architecture date de 2004 et le site tombe au delà des 73.000 visiteurs. Je ne prendrai pas de point de vue concernant ASP, d’autres le font très bien à ma place.

Concernant Oracle c’est un choix que beaucoup d’entreprises font mais lorsqu’on sait que ce serveur n’a plus de support, ça doit être la joie dans la section IT. Capacités de l’open data pour la mobilité. Ce site web dédié à la mobilité comme il en existe d’autre (la STIB, de Lijn, SNCB/NMBS) fourni des informations d’utilité publique. La situation actuelle sous l’oeil de l’open data. Data Publica, le portail français des données publiques et de l'open data. OpenData & Mobilité – démonstration « QNTNKSR. Suite au billet concernant l’ouverture des données dans le secteur de la mobilité et en particulier de la TEC, j’ai réalisé quelques recherches dans le but de faire une démo.

OpenData & Mobilité – démonstration « QNTNKSR

Le tiroir du fond Lors de mes recherches sur l’infrastructure qu’utilise la TEC pour ces données je suis tombé sur le site DAMIER et en particulier sur ce document pdf listant tous les arrêts en province de Luxembourg. Extraction des données La première chose à faire est obtenir des données lisibles et parsables. J’ai donc utilisé pdftohtml qui permet de transformer un document pdf en document html navigable par page. Pdftohtml votredocument.pdf -enc Latin1 Le Latin1 vous permet d’utiliser des caractères accentués. J’obtiens donc un document html contenant le contenu du tableau mais en ayant un élément par ligne comme ceci : Numéro Localité Rue Arrêt Lignes Ni une ni deux j’écris un script php me permettant de transformer le tout en fichier csv comme ceci : Numéro; Localité; Rue; Arrêt; Lignes.