background preloader

De la statistique aux big data : ce qui change dans notre compréhension du monde

Par Hubert Guillaud le 19/12/12 | 9 commentaires | 4,776 lectures | Impression Lors de la dernière édition des Entretiens du Nouveau Monde industriel qui avaient lieu les 17 et 18 décembre 2012 au Centre Pompidou, le sociologue Dominique Cardon a proposé une intéressante matrice pour comprendre à la fois les limites de la réutilisation des données ouvertes et celle des “Big Data“. Nous sommes désormais confrontés à un incroyable déluge de données produit par le numérique, reconnaît Dominique Cardon. Mais sont-elles nécessaires ? Depuis quelques années, un ensemble de discours (relayé à la fois par des militants, des citoyens, des entreprises, des pouvoirs publics) se met en place autour “du nécessaire partage des données”. “La structuration des données a-t-elle pour but de mettre en forme, classer, comparer les individus (en maintenant leurs singularités) ou sont-elles comprises, organisées à partir de catégories ?” Image : la cartographie localisée de la criminalité de Londres.

Retour sur le premier meetup OKFN France | OKFN France C’est avec un grand plaisir que nous avons accueilli plus d’une soixantaine de participants pour le premier événement d’OKFN France qui a eu lieu mercredi 12 décembre au soir à la Cantine. Ce soir à @lacantine pour le lancement de l’OKFN France #OKFNFr – Crédit: @Etalab L’objectif de cet événement était double: introduire l’Open Knowledge Foundation en France et rassembler des personnes de différents horizons pour réfléchir ensemble à des idées et des projets concrets pour promouvoir l’ouverture et la réutilisation des contenus libres. La réussite de ce type de soirée devra se mesurer à termes sur les projets réalisés, mais déjà la dynamique était là. Présentation de l’Open Knowledge Foundation La soirée a débuté par une introduction à l’Open Knowlegde Foundation par les coordinateurs du nouveau groupe. Interventions libres La soirée s’est ensuite poursuivie par des interventions libres des participants: Le Gotha de l’ #OpenData est là @lacantine pour #okfnfr – Crédit @Ratzillas Open Data

Interview de Jeni Tennison, CTO de l’Open Data Institute décembre A l’occasion du lancement officiel de l’ Open Data Institute ce mardi 4 décembre, Jeni Tennison directrice technique de l’organisation a bien voulu répondre à nos questions. Jeni Tennison : Nous sommes actuellement concentrés sur l’activité des startups. Nous avons des outils de mesures très clairs grâce auxquels nous allons pouvoir mesurer nos efforts comme le nombre d’individus que nous allons former, le nombre d’organisations que nous allons réussir à mobiliser et également les sommes que nous allons engager dans notre incubateur de startup. En tant qu’organisation, nous avons des buts très spécifiques qui sont d’engager et d’influencer à la fois les éditeurs de données et le grand public. Oui, il y a un énorme, et très largement inexploité, potentiel pour les données provenant d’organisations privées qui pourraient elles-mêmes profiter de l’ouverture des données. Jenni Tennison Photo & images : Open Data Institute - theodi.org

Charles Nepote - Services urbains: Open data et modernisation des collectivités Auteur : Charles NEPOTE, chef de projet « partage des données publiques » à la FING, Fondation Internet Nouvelle Génération. Propos recueillis par Anne-Caroline Jambaud en novembre 2012 On observe une accélération du mouvement open data depuis deux ans, avec une sorte de « course à l’échalote » que se livrent les collectivités publiques. Je ne crois pas qu’on puisse parler de « course à l’échalote ». Pour ce qui est des motivations, des collectivités ont constaté que leurs services passaient un peu de temps à répondre à des demandes ponctuelles d’accès à certaines données ; en publiant les données, elles ont souhaité gagner du temps. La législation est en effet du côté du public. Mais cet argument juridique n’est pas le principal. On parle beaucoup d’open data, mais concrètement a-t-on vraiment recensé toutes les données produites (ou à produire) par les collectivités publiques ? Les budgets des collectivités locales sont eux aussi impossibles à comparer. C’est tout à fait vrai.

Animer l’open data, mille possibilités "Animer, animer et encore animer" : Hubert Guillaud résumait ainsi pour Internet Actu une partie des échanges lors de la Semaine européenne de l’open data en mai dernier. L’animation de l’open data est aujourd’hui à la fois un enjeu reconnu par tous et une "expression-valise". Proposition d’une grille d’analyse pour recenser la grande diversité des pratiques. Passé les premiers temps de l’effervescence, tous ceux qui – acteurs publics ou privés – ont ouvert des données se posent les mêmes questions. Pourquoi animer ? Comment, selon quels formats ? Si le constat semble partagé, il n’en est pas de même des réponses mises en oeuvre. La grille d’analyse : animer l’open data en 5 questions Je vous propose une grille d’analyse de l’animation de l’open data, en 5 questions : - pourquoi ? - comment ? - pour qui ? - quand ? - par qui ? En mixant les différentes options, on arrive au final à près de 1200 combinaisons possibles pour animer l’open data ! Comment utiliser cette grille d’analyse ?

The Best Open Data Releases of 2012 - Technology Last year, Cities named ten of its favorite metro datasets of 2011 from cities across North America, illustrating the breadth of what we might learn (regarding mosquito traps! misplaced vehicles! energy consumption!) in the still relatively young field of urban open data. Below, you'll find our picks for 2012's best open data releases from municipal vaults, with an emphasis on tools that can be used by anyone, not just developers and data geeks. 1. 2. Ari Ofsevit's Boston Hubway map. Capital Bikeshare in Washington also publishes trip data. 3. 4. BlightStatus.org 5. San Francisco High-Injury Corridors map. “The transportation agency realized that if you overlay this map with a map of where the city of San Francisco has made their traffic calming and traffic safety investments,” Bhatia adds, “you’ll see almost no overlap.” 6. Chicago City Hall, via the city's green roofs map. 7. 8. Honolulu Adopt-a-Siren. 9. 10.

« L’open data est très mal estimé » Interview de Claire Gallon de l’association Libertic En décembre prochain, l’association nantaise Libertic, fer de lance de l’open data en France, fêtera ses trois ans d’existence. C’est l’occasion de revenir sur 36 mois de lobbying et de pédagogie pour le développement de l’open data et la diffusion de bonnes pratiques. Claire Gallon, l’animatrice et pasionaria de l’association, revient sur la naissance, le bilan et l’avenir de l’open data « à la française ». Quand et à quelle occasion est née l’association Libertic ? A l’époque de la création de Libertic, les cofondateurs faisaient de la veille numérique dans une association chargée d’évaluer les impacts des produits de consommation sur l’environnement. C’est là que nous avons pris conscience de l’importance de pouvoir accéder librement aux données et que nous avons découvert l’émergence du mouvement open data dans les pays anglo-saxons. Combien êtes-vous et combien de temps cela vous occupe ? La carte de France interactive et collaborative de l'open data par Libertic

What Happened at the 1st Open Knowledge Foundation France Meet-up? The following post was written by OKFN France edited by Pierre Chrzanowski and translated by Peter Schiøler. It was with great excitement that we greeted 60+ participants for the first OKFN meetup in Paris on the evening of 12/12/12. The meetup had a double objective; first to introduce the Open Knowledge Foundation in France and second to gather Open Knowledge enthusiasts in France to reflect on concrete project ideas which could promote access to, and reutilisation of, open content. The success of such an event will eventually be measured by the actual projects developed, however it was good to see that the group dynamic was already there! Let’s return to this first meeting of OKFN France. The evening kicked off with an introduction to the Open Knowledge Foundation by the coordinators of the new group. In the third part of the evening the participants were divided into thematic groups: Open Data; Open Culture; Open Education, Access & Science. Open Data What’s next? Open Culture

Qu’est-ce que l’Open Data change aux processus de concertation ? Après plusieurs mois d’échanges avec l’association Décider ensemble, et faute d’avoir pu identifier en France aujourd’hui des expériences concrètes de concertation faisant recourt à l’Open Data, nous avons choisi d’imaginer comment cela pourrait se passer. Une quinzaine de spécialistes de la concertation publique et de l’Open Data a approfondi pendant une journée trois scénarios fictifs - bien que réalistes - de concertation : un débat public porté par la Commission Nationale du Débat Public (CNDP) une concertation menée dans le cadre d’un projet de réaménagement urbain une concertation pour l’élaboration d’un Plan Climat Energie Territorial L’objectif était d’identifier les moments où l’ouverture des données publiques pourrait alimenter les processus et les faire évoluer ; mais aussi les opportunités, les risques et les perspectives pour les différents acteurs en présence. De ce travail, il en ressort trois hypothèses principales : LA FING & Décider ensemble

Créer un fil RSS avec Yahoo Pipes « {Données juridiques} Yahoo Pipes est un outil bien utile, graphique et efficace qui vous permet notamment de manipuler des fils RSS. Un module supplémentaire a été créé le 24 avril 2012 permettant d’utiliser les fonctionnalités XPATH : XPATH (tutoriel publié à l’adresse est utilisé pour décrire les éléments HTMLou CSS d’une page web au moyen d’un langage apparenté au XML.Il peut être utilisé pour créer des fils RSS, alors que le site web n’en propose pas. Étude de cas : le Journal officiel L’idée est de créer à partir de la page du journal officiel du jour ( un fil RSS. Légifrance n’en propose malheureusement pas. Étape 1 : Je détecte pour chaque lien le chemin XPATH. J’utilise pour cela l’extension Firebug pour Mozilla Firefox pour faire apparaître le code source : Étape 2 : je copie le chemin du XPATH Étape 3 : je colle le chemin dans Yahoo Pipes Résultat obtenu

How Open Data Is Changing The Way Vancouver Shelters Its Homeless Last month, seemingly out of nowhere, the Province of British Columbia announced it would spend $1 million (in Canadian dollars) to address health and safety violations in a number of the single resident occupancy (SRO) buildings it owns in Vancouver. The reason...? Open data. Indeed, what follows is a wonderful example of how data and transparency can drive policy and encourage governments to fulfill commitments that help those most at risk. In January 2012, the Vancouver city council passed a motion mandating the creation of an online, searchable database of rental apartments in Vancouver, which would:utilize existing publicly available information collected by the City; and include information such as building owner, outstanding work orders, and property violations, if any. This open data set, modelled after a similar searchable database in New York, had two explicit goals. The impacts of this one dataset can be measured on several levels. Bigger opportunities for savings

Enquête : toutes les données des bibliothèques parisiennes dévoilées | Jeudi 13 Décembre 2012 sur StreetPress Ce qu’il faut retenir 1 Les revues trustent les premières places Dans toutes les bibliothèques de Paris, les revues figurent en haut de classement, alors que nous avons vu ci-dessus qu’il y avait davantage de livres et de BD empruntés que de revues. Comment expliquer ce mystère ? C’est simple : quand vous empruntez une revue, que ce soit le numéro 3 ou le numéro 500, cela sera comptabilisé comme l’emprunt d’un même titre. S’il y avait une catégorie « livres » qui regroupait tous les romans et les essais empruntés, alors les livres gagneraient dans leur combat face aux revues. Cela dit, l’engouement pour la presse magazine est réel, comme l’explique joint par StreetPress Christophe Evans, spécialiste de la sociologie de la lecture et des usages en bibliothèque : « Ce sont des formes courtes fortement segmentées qui se lisent rapidement et peuvent être consommées facilement. » 2 Peu de spécificité selon les arrondissements 3 Les bibliothèques, c’est pour les enfants

Why Google will crush Nielsen | Technology The web user is the most watched consumer ever. For tracking purposes, every large site drops literally dozens of cookies in the visitor's browser. In the most comprehensive investigation on the matter, The Wall Street Journal found that each of the 50 largest websites in the United Sates, weighing 40% of the US page views, installed an average of 64 files on a user device. (See the WSJ's What They Know series and a Monday Note about tracking issues.) As for server logs, they record every page sent to the user and they tell with great accuracy which parts of a page collect most of the reader's attention. But when it comes to measuring a digital viewer's commercial value, sites rely on old-fashioned panels, that is limited user population samples. Panels are inherited. I have yet to meet a publisher who is happy with this situation. Publishers monitor the pulse of their digital properties on a permanent basis. The developing field of statistical pairing technology shows great promise.

[Open-transport] Community coordinated list of all railway stations around the world [Open-transport] Community coordinated list of all railway stations around the world Pieter Colpaert pieter.colpaert at okfn.org Sun Dec 30 11:48:31 GMT 2012 Hi all, A very simple problem: giving id's to railway stations around the world and adding the right names in different languages. I'm thinking about creating a simple google drive spreadsheet for every country. Is this a ludicrous idea or does someone has a better alternative? More information about the open-transport mailing list

Related: