background preloader

Big Data : le grand déséquilibre

Big Data : le grand déséquilibre
Pour Stéphane Grumbach (blog, @sgrumbach), directeur de recherche à l’Inria, les Big Data sont désormais un sujet important et dont les enjeux sont régulièrement médiatisés, comme le soulignait la semaine dernière le New York Times en s’intéressant à la consommation énergétique des centres de données. Souvent, le sujet est abordé sous l’angle (important) de la protection des données personnelles. Sur la scène de Lift France 2012, Stéphane Grumbach propose lui de l’aborder sous l’angle de la géographie. Est-ce que l’endroit où se trouvent les données est important ? Le sujet semble iconoclaste, car la caractéristique même de ces données numériques est d’être par essence reproductibles, liquides, disponibles partout et tout le temps… Pas si sûr estime le chercheur (voir sa présentation). La taille de l’univers numérique est estimée à 2,7 Zettabytes de données et il devrait atteindre 35 Zettabytes en 2020. Le second est de tirer du sens des données, comme le fait le profilage. Related:  data viz

Septembre 2012 : Open data et géomaticiens : « je t’aime, moi non plus » Documents > A la Une sur SIG la Lettre > Open data et géomaticiens : « je t’aime, moi non plus » L’open data n’en finit pas de questionner les géomaticiens. Pour preuve, la rencontre entre les deux communautés, organisée début juin par l’Afigéo, le forum français de l’OGC et LiberTIC a rassemblé près de 150 personnes à Lyon, en marge des Halles géomatiques et du salon UseIT. Et elle a apporté une certitude : acteurs de la géomatique et de l’open data ont tout intérêt à collaborer. Mais ce n’est pas facile tous les jours car, au-delà d’objectifs apparemment communs, ce sont deux cultures complètement différentes qu’il faut concilier. C’est en mai que La Rochelle a ouvert sa plate-forme open data Un géomaticien courtisé ? Le site open data de la région PACA a ouvert en juillet 2012. les données géographiques y sont présentées en partenariat avec le CRIGE Une place difficile à trouver C’est que les services géomatiques se sentent parfois exclus de la démarche open data, voire marginalisés.

MesInfos : quand les “données personnelles” deviennent vraiment… personnelles Par Renaud Francou le 04/12/12 | 6 commentaires | 2,855 lectures | Impression Que se passerait-il si, demain, les organisations partageaient les données personnelles qu’elles détiennent avec les individus qu’elles concernent, pour qu’ils en fassent ce que bon leur semble ? Quels usages, quelles connaissances, quels services, quels risques aussi, pourraient-ils émerger si les individus disposaient, non seulement du contrôle, mais de l’usage de ces données : leurs finances, leurs achats, leurs déplacements, leurs communications et leurs relations en ligne, leur navigation web, leur consommation d’énergie, etc. ? Voilà tout juste un an, la Fing et un petit groupe d’entreprises, d’acteurs publics et de chercheurs décidaient de chercher ensemble les réponses à ces questions un peu iconoclastes : le projet MesInfos était né. Aujourd’hui, celui-ci s’apprête à passer à une nouvelle étape, celle de l’expérimentation. Rééquilibrer la relation entre les individus et les organisations Intéressé ?

Intel Science & Technology Center for Big Data | Information about Big Data from the Intel Science & Technology Center for Big Data The Intel Science and Technology Center for Big Data is one of a series of research collaborations that Intel is establishing with U.S. universities to identify and prototype revolutionary technology opportunities. The centers are designed to encourage closer collaboration among academic thought leaders in essential technology areas. The Intel Science and Technology Center for Big Data is based at the Computer Science and Artificial Intelligence Laboratory (CSAIL) at MIT and is primarily affiliated with the Intel Parallel Computing Lab. Loïc Haÿ Chargé de mission chez La Fonderie - Agence numérique d'Ile-de-France Government Administration | Paris Area, France, FR Spécialiste des services et usages des technologies de l’information, j'évolue et interviens depuis 10 ans dans le secteur public pour accompagner les collectivités locales, soutenir leurs projets, et mettre les TIC au service de leurs politiques publiques de développement territorial. Specialties: Stratège, animateur et chef de projet en communication web et technologies émergentes spécialisé dans le secteur public et les collectivités locales.

Energie, pollution et internet La lecture de la semaine provient du New York Times, il s’agit du premier article d’une série consacrée au coût écologique du Cloud computing (informatique dans les nuages, le fait que nos données soient stockées, non pas dans les nuages, mais dans des infrastructures très matérielles). Le titre “Energie, pollution et Internet”, ce début d’article fait un résumé de la longue enquête du quotidien américain. “Des dizaines de milliers de data center (gigantesques bâtiments abritant des serveurs) sont aujourd’hui nécessaire pour supporter l’explosion de l’information numérique. Des quantités gigantesques de données sont mises en circulation chaque jour lorsque, d’un simple clic ou au contact du doigt, les gens téléchargent des films sur iTunes, regardent l’état de leurs comptes sur le site de leur banque, envoient un mail avec une pièce jointe, font leurs courses en ligne, postent un message sur Twitter ou lisent un journal en ligne.” Xavier de la Porte

Le ministre Alain Vidalies dénonce les effets du site NosDéputés Alain Vidalies, le ministre délégué en charge des relations avec le Parlement, vient de soulever la question des effets de l’initiative NosDéputés, ce site qui établit depuis trois ans un travail de veille, d’archivage et de classement des députés en pointant leur activité parlementaire et donc leur assiduité dans l’hémicycle. Pour lui, ce site a « des effets dangereux voire pernicieux sur le travail parlementaire », du fait de son approche quantitative qui pousse les élus à user de techniques peu favorables au bon fonctionnement des institutions parlementaires, dans l'unique but de monter dans le classement de NosDéputés. Samedi, lors de l’université d’été du Parti socialiste à La Rochelle, le ministre chargé des relations avec le Parlement s’est exprimé sur les effets d’Internet vis à vis du travail de nos députés. Pour Alain Vidalies, « La fonction parlementaire n’a pas échappé à l’émergence des réseaux sociaux. Les dérives d’une approche quantitative Xavier Berne

Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]

Big data: The next frontier for innovation, competition, and productivity The amount of data in our world has been exploding, and analyzing large data sets—so-called big data—will become a key basis of competition, underpinning new waves of productivity growth, innovation, and consumer surplus, according to research by MGI and McKinsey's Business Technology Office. Leaders in every sector will have to grapple with the implications of big data, not just a few data-oriented managers. The increasing volume and detail of information captured by enterprises, the rise of multimedia, social media, and the Internet of Things will fuel exponential growth in data for the foreseeable future. MGI studied big data in five domains—healthcare in the United States, the public sector in Europe, retail in the United States, and manufacturing and personal-location data globally. Big data can generate value in each. For example, a retailer using big data to the full could increase its operating margin by more than 60 percent. 1. 2. Podcast 3. 4. 5. 6. 7.

How Social Media Distracts You at Work [INFOGRAPHIC] How often does the social media monster swallow you whole? More than you may think, according to Red e App, which lets consumers get notifications from businesses without having to provide their personal information. The company developed an infographic, below, that details how interruptions impact employee productivity. "Is it possible to be too connected in this digital age?" Red e App asks in a blog post. Among the findings, the infographic shows that workers are interrupted approximately once every 10.5 minutes, and that it takes an average of 23 minutes to return to an assigned task.

Le cloud computing : quelques exemples d'utilisation Dans le cadre de notre dossier sur le cloud computing, nous avons réalisé une infographie détaillant les utilisations possibles du nuage au travers de quatre exemples : dans une start-up, dans une PME, à la maison et dans une mairie. Nous vous proposons de la découvrir ci-dessous : > En résumé : Dans une start-up, le nuage permet de se concentrer sur le cœur de son activité. Dans une PME, le nuage permet d’avoir accès à de nombreux services logiciels sans pour autant avoir besoin d’investir dans des infrastructures informatiques spécifiques. A la maison, le nuage est déjà là, par exemple en consultant nos emails, en archivant des vidéos ou des photos sur le Web ou encore en discutant sur les réseaux sociaux. Dans une mairie, le nuage permet de mettre très rapidement de nouveaux services à la disposition des citoyens, grâce à un catalogue d’applications en ligne qu’il suffit de choisir et de personnaliser pour pouvoir les utiliser. > Qu’est-ce que le cloud computing ? > Pour aller plus loin :

Web Open-Source et modulable à Montpellier – We make data porn : Les données sont toujours fausses L’Open-Data, c’est avant tout des données. Dans un monde parfait, ces données seraient toujours à jour, vérifiées et croisées avec les autres jeux de données, seulement voilà : nous ne vivons pas dans un monde parfait ! En tant que développeur devant utiliser des jeux de données issus de l’Open-Data, comment s’en sortir avec des données probablement fausses, incomplètes ou non unifiées ? Ce premier article de la série «We make data porn» va tenter de répondre à ces questions. Pourquoi les données sont fausses ? Je ne dis pas que les gestionnaires de jeux de données sont incompétents, mais qu’il relève du tour de force d’obtenir des données cohérentes avec les processus de publication couramment utilisés. Les collectivités n’ouvrent pas des données en claquant des doigts. Décider de quelles données ouvrirDéterminer où se trouvent les données brutes (quels services, quelles modalités d’extraction…)Extraire les donnéesRe-formater les données suivant leur typePublier les données En résumé :

Prédictions : les données seules ne sont pas suffisantes Par Rémi Sussan le 25/09/12 | 4 commentaires | 1,758 lectures | Impression Quelles relations établir entre la gigantesque masse de données fourbie par les ordinateurs – les fameux Big Data -, les modèles utilisés pour les analyser, et les humains qui les interprètent ? C’est la question que s’est posée Nate Silver, dans une brillante analyse de la science météorologique, parue dans le New York Times. Nate Silver n’est pas un inconnu, loin s’en faut. Figurant parmi les cent personnes les plus influentes de 2009 toujours selon le New York Times, ce génie des maths a commencé sa carrière… en analysant les probabilités des résultats des matchs de baseball, domaine qu’il a parait-il révolutionné. Puis il s’est fait connaître par son blog politique (@fivethirtyeight) analysant les chances des différents candidats aux élections américaines. La météo, un succès ? Image : Orage sur Enschede, aux Pays-Bas via Wikimedia Commons. Pourtant, tout ne marche pas aussi mal, nous rassure-t-il. Rémi Sussan

mars | 2013 | Data Tuesday Découvrez un article sur la présentation d’Elian Carsenat de NomDeTri.fr lors du dernier Data Tuesday Smart Cities & Data qui a eu lieu chez Ipsos le 26 mars. Like this: J'aime chargement… Merci à tous d’avoir participé à la rencontre SMART CITIES & DATA hébergé par Ipsos France ce mardi 26 mars ! Le prochain événement Data Tuesday aura lieu en mai et aura pour thème "Data Tourisme & Transport". Les présentations sont disponibles ci-dessous Lire la suite Découvrez le programme avec les premiers intervenants confirmés! Pensez à vous inscrire rapidement pour la prochaine rencontre Smart Cities & Data qui aura lieu le 26 mars à 18h30! Les Data Tuesday remercient chaleureusement IPSOS pour leur accueil ! Les Data Tuesday vous donnent rendez-vous le mardi 26 mars à 18h30 (lieu à confirmer) sur le thème : Smart Cities & Data !

Datavisualization.ch Selected Tools

Related: