background preloader

De la statistique aux big data : ce qui change dans notre compréhension du monde

Par Hubert Guillaud le 19/12/12 | 9 commentaires | 4,776 lectures | Impression Lors de la dernière édition des Entretiens du Nouveau Monde industriel qui avaient lieu les 17 et 18 décembre 2012 au Centre Pompidou, le sociologue Dominique Cardon a proposé une intéressante matrice pour comprendre à la fois les limites de la réutilisation des données ouvertes et celle des “Big Data“. Nous sommes désormais confrontés à un incroyable déluge de données produit par le numérique, reconnaît Dominique Cardon. Mais sont-elles nécessaires ? Depuis quelques années, un ensemble de discours (relayé à la fois par des militants, des citoyens, des entreprises, des pouvoirs publics) se met en place autour “du nécessaire partage des données”. “La structuration des données a-t-elle pour but de mettre en forme, classer, comparer les individus (en maintenant leurs singularités) ou sont-elles comprises, organisées à partir de catégories ?” Image : la cartographie localisée de la criminalité de Londres.

Interview de Jeni Tennison, CTO de l’Open Data Institute décembre A l’occasion du lancement officiel de l’ Open Data Institute ce mardi 4 décembre, Jeni Tennison directrice technique de l’organisation a bien voulu répondre à nos questions. Jeni Tennison : Nous sommes actuellement concentrés sur l’activité des startups. Nous avons des outils de mesures très clairs grâce auxquels nous allons pouvoir mesurer nos efforts comme le nombre d’individus que nous allons former, le nombre d’organisations que nous allons réussir à mobiliser et également les sommes que nous allons engager dans notre incubateur de startup. En tant qu’organisation, nous avons des buts très spécifiques qui sont d’engager et d’influencer à la fois les éditeurs de données et le grand public. Oui, il y a un énorme, et très largement inexploité, potentiel pour les données provenant d’organisations privées qui pourraient elles-mêmes profiter de l’ouverture des données. Jenni Tennison Photo & images : Open Data Institute - theodi.org

Animer l’open data, mille possibilités "Animer, animer et encore animer" : Hubert Guillaud résumait ainsi pour Internet Actu une partie des échanges lors de la Semaine européenne de l’open data en mai dernier. L’animation de l’open data est aujourd’hui à la fois un enjeu reconnu par tous et une "expression-valise". Proposition d’une grille d’analyse pour recenser la grande diversité des pratiques. Passé les premiers temps de l’effervescence, tous ceux qui – acteurs publics ou privés – ont ouvert des données se posent les mêmes questions. Pourquoi animer ? Comment, selon quels formats ? Si le constat semble partagé, il n’en est pas de même des réponses mises en oeuvre. La grille d’analyse : animer l’open data en 5 questions Je vous propose une grille d’analyse de l’animation de l’open data, en 5 questions : - pourquoi ? - comment ? - pour qui ? - quand ? - par qui ? En mixant les différentes options, on arrive au final à près de 1200 combinaisons possibles pour animer l’open data ! Comment utiliser cette grille d’analyse ?

« L’open data est très mal estimé » Interview de Claire Gallon de l’association Libertic En décembre prochain, l’association nantaise Libertic, fer de lance de l’open data en France, fêtera ses trois ans d’existence. C’est l’occasion de revenir sur 36 mois de lobbying et de pédagogie pour le développement de l’open data et la diffusion de bonnes pratiques. Claire Gallon, l’animatrice et pasionaria de l’association, revient sur la naissance, le bilan et l’avenir de l’open data « à la française ». Quand et à quelle occasion est née l’association Libertic ? A l’époque de la création de Libertic, les cofondateurs faisaient de la veille numérique dans une association chargée d’évaluer les impacts des produits de consommation sur l’environnement. C’est là que nous avons pris conscience de l’importance de pouvoir accéder librement aux données et que nous avons découvert l’émergence du mouvement open data dans les pays anglo-saxons. Combien êtes-vous et combien de temps cela vous occupe ? La carte de France interactive et collaborative de l'open data par Libertic

Qu’est-ce que l’Open Data change aux processus de concertation ? Après plusieurs mois d’échanges avec l’association Décider ensemble, et faute d’avoir pu identifier en France aujourd’hui des expériences concrètes de concertation faisant recourt à l’Open Data, nous avons choisi d’imaginer comment cela pourrait se passer. Une quinzaine de spécialistes de la concertation publique et de l’Open Data a approfondi pendant une journée trois scénarios fictifs - bien que réalistes - de concertation : un débat public porté par la Commission Nationale du Débat Public (CNDP) une concertation menée dans le cadre d’un projet de réaménagement urbain une concertation pour l’élaboration d’un Plan Climat Energie Territorial L’objectif était d’identifier les moments où l’ouverture des données publiques pourrait alimenter les processus et les faire évoluer ; mais aussi les opportunités, les risques et les perspectives pour les différents acteurs en présence. De ce travail, il en ressort trois hypothèses principales : LA FING & Décider ensemble

How Open Data Is Changing The Way Vancouver Shelters Its Homeless Last month, seemingly out of nowhere, the Province of British Columbia announced it would spend $1 million (in Canadian dollars) to address health and safety violations in a number of the single resident occupancy (SRO) buildings it owns in Vancouver. The reason...? Open data. Indeed, what follows is a wonderful example of how data and transparency can drive policy and encourage governments to fulfill commitments that help those most at risk. In January 2012, the Vancouver city council passed a motion mandating the creation of an online, searchable database of rental apartments in Vancouver, which would:utilize existing publicly available information collected by the City; and include information such as building owner, outstanding work orders, and property violations, if any. This open data set, modelled after a similar searchable database in New York, had two explicit goals. The impacts of this one dataset can be measured on several levels. Bigger opportunities for savings

Why Google will crush Nielsen | Technology The web user is the most watched consumer ever. For tracking purposes, every large site drops literally dozens of cookies in the visitor's browser. In the most comprehensive investigation on the matter, The Wall Street Journal found that each of the 50 largest websites in the United Sates, weighing 40% of the US page views, installed an average of 64 files on a user device. (See the WSJ's What They Know series and a Monday Note about tracking issues.) As for server logs, they record every page sent to the user and they tell with great accuracy which parts of a page collect most of the reader's attention. But when it comes to measuring a digital viewer's commercial value, sites rely on old-fashioned panels, that is limited user population samples. Panels are inherited. I have yet to meet a publisher who is happy with this situation. Publishers monitor the pulse of their digital properties on a permanent basis. The developing field of statistical pairing technology shows great promise.

Blinded By Big Data: It's The Models, Stupid In the Gold Rush to accumulate and put to use Big Data, we may actually be making it harder to actually glean insights from that data. Yet the prospect of data solving all of our problems is so tempting that even the brightest minds of our generation seem confused. Take, for example, Irving Wladawsky-Berger, a strategic advisor to Citigroup and former IBM executive. Completely. Predicting Black Swan Events Black Swan events are major events that take us by surprise, but afterwards yield clear explanations as to why they happened. But they can also apply to business, and so there is a temptation to apply Big Data to spot such Black Swans before they happen. "This [Big Data] ability to work across data sets and silos could help us get early clues to hard-to-predict, high-impact black swan events, so we can dig deeper into these clues and assess their validity. Unfortunately for Wladawsky-Berger's analysis, Black Swans, by their very definition, cannot be predicted by analyzing the data.

L’avenir de l’industrie est-il dans l’open source Les signaux s’accumulent. L’industrie « traditionnelle » serait de plus en plus tentée par l’open source. C’était déjà le cas dans l’électronique, avec notamment la carte Arduino. Les fabricants n’ont pas accès aux meilleures des techniques pour les sécuriser, avance l’article. L’automobile aussi s’y met. Et c’est sans parler des FabLab, ces ateliers de fabrications open source à partir de fichier numérique, qui séduisent de plus en plus d’entreprises. C’est en tout cas la voie la plus prometteuse pour conquérir les nouveaux secteurs du numérique : énergie, ville, santé, robotique… A suivre.

Open data : la réutilisation des données a rapporté 35 millions d’euros aux administrations Un rapport ciblant les dysfonctionnements en matière d'Open data en France vient d'être remis au Premier ministre. Le document indique que certaines administrations ont encore des réticences à permettre la réutilisation de leurs données. L'Open data est un mouvement qui vise à mettre à la disposition de tous des informations appartenant à des entités publiques et donc a priori difficilement consultables. Des documents dont l'accès s'avère plutôt compliqué pour un citoyen ou un professionnel du fait des procédures administratives lourdes ou de la rareté des documents en question (version papier unique) sont ainsi mis en ligne. Un rapport rédigé par le magistrat à la Cour des comptes Mohammed Adnène Trojette vient expliquer le fonctionnement de ces mécanismes et les raisons pour lesquelles certaines administrations ne sont pas en pointe sur cette question. Le rapport s'inscrit en effet dans un contexte particulier. Revoir le principe des redevances

British government bets big on open data for growth Just like the rest of the Western world, Britain’s government is under serious pressure to revive the country’s stalled economy. And at no point is there pressure greater than today, as the Chancellor, George Osborne, unveils his latest initiatives to get things going as part of his Autumn Statement — the regular update on the state of the nation’s finances. But unlike other countries, the U.K. is not just talking about creating jobs or encouraging infrastructural projects: it’s also taking a gamble on data. This involves opening up a whole range of new government-owned data sets to the public, as well as encouraging greater sharing of information to try and boost the amount of innovation and development in Britain around this material. In addition, there’s going to be a new organization led in part by Sir Tim Berners-Lee — known as the Open Data Institute — to help foster this process and lead development. Here’s basically what is going live, soon:

Related: