background preloader

Big Data : les progrès de l’analyse des données

Big Data : les progrès de l’analyse des données
La démultiplication des outils de collecte de données (comme le web ou nos téléphones mobiles qui enregistrent très facilement nos déplacements, mais également nos actions, nos relations…) et l’amélioration des outils d’analyses de données offrent aux entreprises des moyens marketing de plus en plus inédits, estime Lee Gomes pour la Technology Review. Et de donner un exemple simple et frappant : celui des Giants de San Francisco, l’équipe de baseball américain championne du monde et championne de la ligue nationale, qui a mis en place une tarification dynamique mise au point par Qcue, permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir). Une tarification dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010. Vers le commerce algorithmique

La gratuité des données publiques encouragée par data.gouv.fr Trois mois après la formation de l’équipe en charge de créer le futur portail data.gouv.fr, un décret et une circulaire sortis au Journal Officiel ce matin viennent préciser le cadre dans lequel ÉtaLab et les ministères vont travailler. Coup de frein à la marchandisation des données publiques Le décret 2011-577 risque de ne pas faire plaisir à tous les intermédiaires qui vivent de la revente de données publiques sur le dos du travail des administrations. A partir du 1er juillet 2011, il sera beaucoup plus complexe pour une administration centrale de créer des barrières financières à l’accès à ses données publiques. Cependant, s’il renforce le poids du Premier ministre dans l’arbitrage de la création de licences payantes, il réaffirme également celui du COEPIA. Les données payantes le resteront au moins jusqu’en 2012 Enfin, ce mécanisme visant à assurer une meilleure transparence de la publication des données publiques, ne s’appliquera pas à tous les organismes ayant une mission publique.

Peut-on être contre les big data ? L'article présente les thèses d'Alan Mitchell, le directeur de la stratégie du cabinet Ctrl+shift. Selon lui, "les Big Data auraient presque un côté contre-révolutionnaire : le chant du cygne d’une informatique productiviste, centralisatrice, centrée sur les grandes organisations." L'effort consenti - notamment en R&D - pour développer cette informatique et ses applications aurait été mieux employé à développer le pouvoir de création des individus, et à les aider à produire eux-mêmes les arbitrages qui leurs sont proposés par cette informatique massive. Daniel Kaplan lui-même reconnaît, à la fin de l'article, que le propos est peut-être un peu fort et qu'il est peu adapté, par exemple, aux les sciences dures. Je m'arrête sur cet article parce qu'on me pose de plus en plus de questions sur ce phénomène big data dont j'ai parlé très tôt. Mais de là à contester l'existence même, l'intérêt et la puissance du phénomène big data, il y a un pas que l'on ne peut franchir.

Dis, papa, c’est quoi l’open data? Nombreux sont ceux qui estiment que le mouvement "open data" aura, à l'instar de l’apparition de l’alphabet, de l'internet ou encore de l'explosion des réseaux sociaux, des répercussions majeures dans nos sociétés. Connu pour ses logiciels non libres, Microsoft a eu la très bonne idée de demander à Regards sur le numérique (RSLN, animé par Spintank), son “laboratoire d’idées, de réflexions et d’expérimentations en ligne“, de se pencher sur la notion d’open data, et donc le partage de données publiques dans des formats ouverts, afin de libérer les données récoltées, ou produites, par les autorités publiques, et de les rendre, si possible gratuitement, à la société, ses citoyens, associations, entreprises privées et administrations publiques. Au menu, très complet, digeste et instructif : une enquête et une trentaine d’articles, que l’on retrouve sur son site ainsi que dans le n° spécial de leur magazine, suivi d’une conférence, intitulée L’Open data, et nous, et nous, et nous ?

Data design ou le pouvoir sur vos données ! Au quotidien, nous sommes confrontés à une quantité phénoménale de données. Elles sont communiquées dans tous les domaines ; culturel, financier, économique, politique … par le biais de tous les supports ; journaux, magazines, web etc… Elles s’abattent sur nous, dans notre sphère privée et professionnelle, de façon désordonnée et incontrôlable. Nous sommes bien à l’ère du « data déluge » ! Mais qu’entend –t-on exactement par la « donnée » ou « data » en anglais ?Un élément brut qui sorti de tout contexte n’a pas de sens en tant que tel. La donnée n’est pas une information, elle n’est qu’un premier indice pour résoudre un problème, comprendre une situation. Quelles sont les causes de cette explosion des données ? Quelles en sont les conséquences ? Face à ce déluge, le data design peut nous sauver ! Aujourd'hui, de nombreux designers se penchent sur le sujet. Un outil qui exige une maîtrise de la donnée à l’état brut mais aussi du design pour réussir à communiquer ce que l’on souhaite.

Manifeste Open Data | Les données publiques nous appartiennent ! Le décret signé de François Fillon qui affirme que l’accès aux données publiques doit être gratuit et ouvert à tous est un premier pas en avant mais, étant donné que nos administrations sont très réticentes à ouvrir leurs bases, la liste risque d’être longue des exceptions à la règle de transparence prévue pour le nouveau décret du 26 mai 2011 (INSEE, EPIC, Culture, données sanitaires et géographiques etc…). Aujourd’hui, les citoyens ont soif de connaissance notamment sur la performance de leurs services publics mais aussi sur l’accès à ces services et de pouvoir participer à leur optimisation ou en inventer de nouveaux : dans quel hôpital se faire soigner, dans quelle école inscrire ses enfants, quel taux de réussite aux examens, comment rationaliser ses déplacements, retrouver un ami, améliorer l’accompagnement des handicaps, comment mieux consommer ? L’Opinion publique réclame une ouverture des données généralisée, la révolution de l’open data ne doit pas se faire sans la France.

Contre la simplicité de John Maeda | Computer drawing Open Data : libération des données publiques Malheureusement, il semble que la livraison des données de transport en France, leur structuration et enrichissement par les citoyens peinent à passer des initiatives locales (Rennes, Nantes, Paris) au niveau national. Très récemment, celle d’Olivier Girardot qui avait lancé le site incidents-ratp.com, s’est vu attaquée par la RATP pour contrefaçon, car l’auteur aurait reproduit illégalement la marque déposée RATP en achetant le nom de domaine idoine. Afin de pouvoir poursuivre son initiative, il a été obligé dans l’urgence de transférer son site sous le nom de domaine incidents-transports.com, plus neutre, mais beaucoup moins lisible sur la toile. Cet exemple montre donc fort à propos qu’il est impératif de croiser les données publiques avec des données privées, y compris recueillies par la société civile de façon à leur donner tout leur sens. Colloque sur l’Open Data, quels enjeux pour la société civile ? La rencontre étant structurée autour de deux axes complémentaires :

Interview David McCandless Le journaliste du Guardian tient le site "Information is beautiful", sur lequel il met en scène toutes sortes de données. Entretien autour des problématiques que pose la visualisation de données. Boire un thé avec David McCandless d’Information is beautiful quand on s’intéresse à la visualisation de données revient un peu à partager un pétard avec ses rockers préférés quand on est une groupie. Je souris béatement tandis qu’il peste contre sa nouvelle maison qu’il juge bien trop grande et trop froide. David met de l’eau à bouillir et je remarque que même sa théière est recouverte d’une petite laine. Quelques instants plus tard, je le suis, sans sucre et sans lait, dans les escaliers qui mènent à son bureau. Work In progress Là, il me montre une infographie sur les exoplanètes qu’il termine actuellement pour The Guardian. La notion d’échelle est fondamentale pour moi ; je crois que c’est véritablement la clé de la visualisation de données car elle donne à la fois le contexte et le sens.

Une certaine idée de l’open data Le 13 juillet dernier est sorti un rapport produit par 4 élèves de l'école des Ponts ParisTech, intitulé "Pour une politique ambitieuse des données publiques". Il résume parfaitement une certaine idée de l'Open Data. L’open data est à la mode. Le conseil général de Gironde vient de lancer son site DataLocale, la Saône-et-Loire a annoncé l’ouverture d’un portail pour octobre, celui du gouvernement sortira dans quelques mois. Plusieurs villes y réfléchissent : Le Havre, Saint-Maur-des-fosses et Montpellier a sauté le pas. L’ouverture des données publiques est devenue la nouvelle mesure phare des collectivités en matière de transparence et de démocratie. Dans ce contexte est sorti un rapport très complet, intitulé Pour une politique ambitieuse des données publiques produit par quatre élèves de l’école des Ponts ParisTech : Romain Lacombe, François Vauglin, Pierre-Henri Bertin et Alice Vieillefosse. “Identifier des modèles économiques” Comment l’idée de ce rapport est-elle née ? Des ambitions…

Les data en forme Des tornades, de l'eau, du vent et la bonne dose habituelle de représentations chatoyantes de la densité humaine et de démographie colorée : c'est la nouvelle fournée de veille hebdomadaire par les journalistes de données de la rédaction d'Owni, à lire et à partager. A priori, le premier lien de notre veille hebdomadaire ne mange pas de pain numérique, ne pulvérise aucune rétine, n’estomaque pas le lecteur en mal d’awesomeness. Mais il est rudement pratique. Grand merci donc à Arthur Charpentier – plus connu (mais sans doute pas assez) via son blog Freakonometrics – et à Ewen Gallic, un jeune Rennais étudiant à Montréal (c’est dire s’il patauge dans le bon Open Data) qu’il relaie cette semaine. Mise-à-jour du 30 mai : Arthur Charpentier (décidément) nous indique fort justement que Freakonometrics a récemment pondu une version avec des données françaises [en] de “Which birth dates are most common”, qu’il en soit ici vivement adulé. Mamma Mia Petite entreprise ne connait pas la crise

Related: