background preloader

Big Data : Making sense at scale

Big Data : Making sense at scale
D'un récent voyage dans la Silicon Valley (merci aux amis du Orange Institute), je rentre avec une conviction : tout ce que nous connaissions du web va changer à nouveau avec le phénomène des big data. Il pose à nouveau, sur des bases différentes, presque toutes les questions liées à la transformation numérique. En 2008, l’humanité a déversé 480 milliards de Gigabytes sur Internet. En 2010, ce furent 800 milliards de Gygabytes, soit, comme l’a dit un jour Eric Schmidt, plus que la totalité de ce que l’humanité avait écrit, imprimé, gravé, filmé ou enregistré de sa naissance jusqu’en 2003. Ces données ne sont pas toutes des oeuvres. Naviguer dans ce nouveau web demande une nouvelle science. L’actualité de la semaine nous a donné une petite illustration de ce qui se passe à grande échelle. Le web était globalement transactionnel. Le web, aujourd'hui, produit aujourd’hui des masses de données, des masses de sens, qui échappent complètement aux principaux acteurs.

Big Data : les progrès de l’analyse des données La démultiplication des outils de collecte de données (comme le web ou nos téléphones mobiles qui enregistrent très facilement nos déplacements, mais également nos actions, nos relations…) et l’amélioration des outils d’analyses de données offrent aux entreprises des moyens marketing de plus en plus inédits, estime Lee Gomes pour la Technology Review. Et de donner un exemple simple et frappant : celui des Giants de San Francisco, l’équipe de baseball américain championne du monde et championne de la ligue nationale, qui a mis en place une tarification dynamique mise au point par Qcue, permettant de modifier le prix des billets en fonction de la demande, et ce, jusqu’à la dernière minute. L’idée étant d’adapter les tarifs à la demande pour éviter la mévente et mieux exploiter les phénomènes d’enchères (qui profitent plutôt au marché noir). Une tarification dynamique qui a permis une augmentation du chiffre d’affaires du club de 6 % en 2010. Vers le commerce algorithmique

actuvisu Blog Ressources numériques : des trésors derrière des forteresses Les contenus numériques payants accessibles en bibliothèque passent à côté des usages du web. Du coup, ils ne sont pas adaptés au public, qui les délaisse. Je suis frappé par l’énergie considérable requise pour la gestion des “ressources numériques” dans les bibliothèques publiques. À l’attention des non-bibliothécaires qui lisent ce blog, il s’agit de contenus payants, payés par les bibliothécaires pour leurs usagers qui sont a minima identifiés comme adhérents de la bibliothèque. Nous pensons avec des mots : là où les bibliothécaires ont des “ressources numériques” le reste du monde a le web et des contenus… C’est bien pour ça, soit dit en passant, qu’il ne s’agit pas de “valoriser des ressources numériques” (via des brochures imprimées “attractives”) mais plutôt de répondre à tel ou tel besoin documentaire (par ex. que recommandez vous pour apprendre l’anglais ?) Un vrai far-west fatigant et des résultats décevants Pourquoi est-ce un domaine aussi complexe à gérer pour nous ? Images

Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]

#praTIC : typologie des visualisations du web J’ai eu le plaisir de participer aujourd’hui à la journée PraTIC sur le thème Spatialité et Temporalité du Web, organisée par l’Atelier de Vidéomatique du Laboratoire Paragraphe (UP8), en partenariat avec l’école des Gobelins. Map Marquer - Noun Project Le thème de mon intervention était : Visualisation interactive de données, nouveaux outils et nouvelles mécaniques cognitives pour comprendre le web. Ma présentation interroge les différentes façons de visualiser le web en tant que paysage informationnel. Elle s’appuie sur le constat de Jonathan Stray : nous n’avons pas de carte des contenus sur le web. Ce qui nous pose un irrémédiable problème d’appréhension de la complexité du monde. I have met people who have never seen a world map. Les moteurs recherche de Google (ou autres) nous permettent de chercher et d’accéder aux contenus. Néanmoins, s’il n’existe pas de carte globale de l’information sur le web, il existe de nombreuses visualisations du web, et de ses ressources.

Internet et la technique : l’univers des possibles La neutralité d'Internet est rendue possible grâce à son réseau physique : chaque message, signal ou information est envoyé de la même façon, peu importe l'émetteur. Explication détaillée du maillage technique pour garantir cette neutralité. … ou Internet pour les nuls (moi compris). Après avoir présenté dans ses grandes lignes l’éthos qui anime les concepteurs d’Internet la semaine dernière, il s’agit désormais de comprendre comme cet éthos a débouché sur certaines caractéristiques essentielles. Ces caractéristiques techniques sont, comme on va le voir, au fondement de la malléabilité d’Internet et donc de la liberté de communication rendue possible par le « réseau des réseaux ». Le premier choix technique essentiel consiste à organiser Internet sur une architecture relativement simple et obéissant selon le principe du « bout-à-bout » («end-to-end » en anglais) . IP et transmission des paquets Cette architecture en couches est traditionnellement représentée sous la forme d’un sablier.

EMC World 2011 : Cloud et Big Data à la croisée des chemins Pour la séance inaugurale d'EMC World 2011, Joe Tucci le PDG d'EMC a appelé les entreprises à accélérer leur voyage vers le cloud. L'heure est aussi à la gestion des Big Data, domaine dans lequel les récentes acquisitions d'EMC, Greenplum et Isilon, ont fait quelques annonces. Après une édition 2010 rythmée par l'accompagnement des entreprises dans leur voyage dans le cloud, le millésime 2011 d'EMC World qui se déroule à Las Vegas a pris deux orientations : le cloud et les « Big Data ». Pour le premier, il s'agit à la fois d'accélérer l'adoption de l'informatique en nuage en mode privé, mais aussi vers le cloud hybride. Pat Gelsinger, président et COO d'EMC Une division Big Data en ordre de marche Du côté de Greenplum, acquise en juillet 2010, l'intégration a été rapide. Illustration d'ouverture : Joe Tucci, CEO d'EMC.

Avons-nous besoin d’Info Labs Grâce aux outils de prototypage rapide à commande numérique, à du matériel et du logiciel désormais facilement bricolables, demain, un grand nombre de personnes seront en mesure de concevoir et fabriquer des objets de leur choix, passant rapidement de l’idée au modèle numérique, du modèle au prototype, voire du prototype à l’objet tangible. C’est l’essence même du projet des Fab Labs (Wikipédia), ces espaces de travail, ces ateliers de fabrication ouverts et accessibles à tous. Mais pourquoi s’en tenir aux objets physiques et à la matière programmable ? Le Lab « ouvert » comme modèle Abréviation de Fabrication Laboratory (Laboratoire de fabrication), le Fab Lab est une « plate-forme de prototypage rapide d’objets physiques, “intelligents” ou non », rappelle Fabien Eychenne dans son Tour d’horizon des Fabs Labs publié par la Fondation internet nouvelle génération. Avec plus d’une centaine de Fab Labs dans le monde, leur relative réussite interroge. Certes, les outils existent.

Les technomades vivent et lisent léger Nous dirigeons-nous vers une technoculture du prêt, du partage, du streaming? Trop d’objets autour de nous, trop de bruit dans notre champ visuel, dans nos agrégateurs, dans nos résultats de recherche, trop de super-butinage (power-browsing), trop consommer, accumuler, remplir, excéder, évaluer, élaguer, se débarrasser, recycler-réduire-réutiliser, ouvrir la fenêtre, pas quinze fenêtres, respirer, relaxer, se vider l’esprit. C’est le printemps et une saison nouvelle qui s’annonce aux teintes discrètes (chromophobes?) After the bacchanal of post-modernism, the time has again come for neo-minimalism, neo-ascetism, neo-denial and sublime poverty." ou encore: By definition, "neo-minimalists" don’t have an overabundance of things in their lives. Après avoir été pendant trois siècles la valeur suprême de la civilisation occidentale, la propriété cesse d’être à la mode. [T]he ownership society was rotting from the inside out. Like this: J'aime chargement…

La gestion des "Big Data" est aussi un défi économique Gérer de grosses quantités de données est un challenge pour l'ensemble des acteurs économiques. Qui pourrait permettre de faire des gains de productivité et d'augmenter à terme la compétitivité. Les 5 milliards de téléphones mobiles utilisés quotidiennement dans le monde et les milliards de données générées via le web et les applications - 30 milliards sont échangées chaque mois sur Facebook - ouvrent de nouvelles perspectives économiques. Faire des gains de productivité Les entreprises ont tout à y gagner puisque les analystes prévoient qu'une détaillant en ligne qui fera le pari de l'utilisation massives des données pourra espérer une augmentation de presque 60 % de ses marges opérationnelles. Des économies substantielles L'étude illustre également cette tendance en s'appuyant sur l'exemple du secteur médical américain.

Related: