background preloader

Big Data : Making sense at scale

Big Data : Making sense at scale
D'un récent voyage dans la Silicon Valley (merci aux amis du Orange Institute), je rentre avec une conviction : tout ce que nous connaissions du web va changer à nouveau avec le phénomène des big data. Il pose à nouveau, sur des bases différentes, presque toutes les questions liées à la transformation numérique. En 2008, l’humanité a déversé 480 milliards de Gigabytes sur Internet. En 2010, ce furent 800 milliards de Gygabytes, soit, comme l’a dit un jour Eric Schmidt, plus que la totalité de ce que l’humanité avait écrit, imprimé, gravé, filmé ou enregistré de sa naissance jusqu’en 2003. Ces données ne sont pas toutes des oeuvres. Naviguer dans ce nouveau web demande une nouvelle science. L’actualité de la semaine nous a donné une petite illustration de ce qui se passe à grande échelle. Le web était globalement transactionnel. Le web, aujourd'hui, produit aujourd’hui des masses de données, des masses de sens, qui échappent complètement aux principaux acteurs.

Big Data : les progrès de l’analyse des données La démultiplication des outils de collecte de données (comme le web ou nos téléphones mobiles qui enregistrent très facilement nos déplacements, mais également nos actions, nos relations…) et l’amélioration des outils d’analyses de données offrent aux entreprises des moyens marketing de plus en plus inédits, estime Lee Gomes pour la Technology Review. Et de donner un exemple simple et frappant : celui des Giants de San Francisco, l’équipe de baseball américain championne du monde et championne de la ligue nationale, qui a mis en place une tarification dynamique mise au point par Qcue, permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir). Une tarification dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010. Vers le commerce algorithmique

actuvisu Blog Ressources numériques : des trésors derrière des forteresses Les contenus numériques payants accessibles en bibliothèque passent à côté des usages du web. Du coup, ils ne sont pas adaptés au public, qui les délaisse. Je suis frappé par l’énergie considérable requise pour la gestion des “ressources numériques” dans les bibliothèques publiques. À l’attention des non-bibliothécaires qui lisent ce blog, il s’agit de contenus payants, payés par les bibliothécaires pour leurs usagers qui sont a minima identifiés comme adhérents de la bibliothèque. Nous pensons avec des mots : là où les bibliothécaires ont des “ressources numériques” le reste du monde a le web et des contenus… C’est bien pour ça, soit dit en passant, qu’il ne s’agit pas de “valoriser des ressources numériques” (via des brochures imprimées “attractives”) mais plutôt de répondre à tel ou tel besoin documentaire (par ex. que recommandez vous pour apprendre l’anglais ?) Un vrai far-west fatigant et des résultats décevants Pourquoi est-ce un domaine aussi complexe à gérer pour nous ? Images

A computational journalism reading list [Last updated: 18 April 2011 -- added statistical NLP book link] There is something extraordinarily rich in the intersection of computer science and journalism. It feels like there’s a nascent field in the making, tied to the rise of the internet. The last few years have seen calls for a new class of “programmer journalist” and the birth of a community of hacks and hackers. Meanwhile, several schools are now offering joint degrees. But we’ll need more than competent programmers in newsrooms. I’d like to propose a working definition of computational journalism as the application of computer science to the problems of public information, knowledge, and belief, by practitioners who see their mission as outside of both commerce and government. “Computational journalism” has no textbooks yet. Data journalism Data journalism is obtaining, reporting on, curating and publishing data in the public interest. Tamara Munzner’s chapter on visualization is the essential primer.

Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]

#praTIC : typologie des visualisations du web J’ai eu le plaisir de participer aujourd’hui à la journée PraTIC sur le thème Spatialité et Temporalité du Web, organisée par l’Atelier de Vidéomatique du Laboratoire Paragraphe (UP8), en partenariat avec l’école des Gobelins. Map Marquer - Noun Project Le thème de mon intervention était : Visualisation interactive de données, nouveaux outils et nouvelles mécaniques cognitives pour comprendre le web. Ma présentation interroge les différentes façons de visualiser le web en tant que paysage informationnel. Elle s’appuie sur le constat de Jonathan Stray : nous n’avons pas de carte des contenus sur le web. Ce qui nous pose un irrémédiable problème d’appréhension de la complexité du monde. I have met people who have never seen a world map. Les moteurs recherche de Google (ou autres) nous permettent de chercher et d’accéder aux contenus. Néanmoins, s’il n’existe pas de carte globale de l’information sur le web, il existe de nombreuses visualisations du web, et de ses ressources.

Internet et la technique : l’univers des possibles La neutralité d'Internet est rendue possible grâce à son réseau physique : chaque message, signal ou information est envoyé de la même façon, peu importe l'émetteur. Explication détaillée du maillage technique pour garantir cette neutralité. … ou Internet pour les nuls (moi compris). Après avoir présenté dans ses grandes lignes l’éthos qui anime les concepteurs d’Internet la semaine dernière, il s’agit désormais de comprendre comme cet éthos a débouché sur certaines caractéristiques essentielles. Ces caractéristiques techniques sont, comme on va le voir, au fondement de la malléabilité d’Internet et donc de la liberté de communication rendue possible par le « réseau des réseaux ». Le premier choix technique essentiel consiste à organiser Internet sur une architecture relativement simple et obéissant selon le principe du « bout-à-bout » («end-to-end » en anglais) . IP et transmission des paquets Cette architecture en couches est traditionnellement représentée sous la forme d’un sablier.

Real-Time Data And A More Personalized Web - Smashing Magazine Advertisement As Web designers, we face a daily struggle to keep pace with advances in technology, new standards and new user expectations. We spend a large part of our working life dipping in and out of recent developments in an attempt to stay both relevant and competitive, and while this is what makes our industry so exciting to be a part of, it often becomes all too easy to get caught up in the finer details. Responsive Web design, improved semantics and rich Web typography have all seen their fair share of the limelight over the last year, but two developments in particular mark true milestones in the maturation of the Web: “real-time data” and a more “personalized Web.” Since the arrival of the new Web, we’ve been enraptured by social media. Web gurus and industry analysts are simultaneously arriving at the same conclusion: we are entering a new chapter in the evolution of the Web. Welcome to the new era. Real-Time Data Real-time data is making waves in Web analytics. Summary (al)

EMC World 2011 : Cloud et Big Data à la croisée des chemins Pour la séance inaugurale d'EMC World 2011, Joe Tucci le PDG d'EMC a appelé les entreprises à accélérer leur voyage vers le cloud. L'heure est aussi à la gestion des Big Data, domaine dans lequel les récentes acquisitions d'EMC, Greenplum et Isilon, ont fait quelques annonces. Après une édition 2010 rythmée par l'accompagnement des entreprises dans leur voyage dans le cloud, le millésime 2011 d'EMC World qui se déroule à Las Vegas a pris deux orientations : le cloud et les « Big Data ». Pour le premier, il s'agit à la fois d'accélérer l'adoption de l'informatique en nuage en mode privé, mais aussi vers le cloud hybride. Pat Gelsinger, président et COO d'EMC Une division Big Data en ordre de marche Du côté de Greenplum, acquise en juillet 2010, l'intégration a été rapide. Illustration d'ouverture : Joe Tucci, CEO d'EMC.

Avons-nous besoin d’Info Labs Grâce aux outils de prototypage rapide à commande numérique, à du matériel et du logiciel désormais facilement bricolables, demain, un grand nombre de personnes seront en mesure de concevoir et fabriquer des objets de leur choix, passant rapidement de l’idée au modèle numérique, du modèle au prototype, voire du prototype à l’objet tangible. C’est l’essence même du projet des Fab Labs (Wikipédia), ces espaces de travail, ces ateliers de fabrication ouverts et accessibles à tous. Mais pourquoi s’en tenir aux objets physiques et à la matière programmable ? Le Lab « ouvert » comme modèle Abréviation de Fabrication Laboratory (Laboratoire de fabrication), le Fab Lab est une « plate-forme de prototypage rapide d’objets physiques, “intelligents” ou non », rappelle Fabien Eychenne dans son Tour d’horizon des Fabs Labs publié par la Fondation internet nouvelle génération. Avec plus d’une centaine de Fab Labs dans le monde, leur relative réussite interroge. Certes, les outils existent.

Related: