Big Data, grande illusion

La cause serait entendue : après le cloud computing et l’internet des objets, les « big data » constitueraient la prochaine « révolution » apportée par le numérique. Alan Mitchell, cofondateur et directeur de la stratégie du cabinet britannique Ctrl-Shift, n’est pas d’accord. Pour lui, les Big Data auraient presque un côté contre-révolutionnaire : le chant du cygne d’une informatique productiviste, centralisatrice, centrée sur les grandes organisations. « Les Big Data se fondent entièrement sur la statistique : dégager des schémas et des tendances à partir de grandes collections de données. La statistique fournit une manière extraordinairement puissante et utile de remettre en questions les suppositions et les inférences que les cerveaux humains produisent naturellement – et souvent de manière erronée. C’est formidable. « Mais le principal déficit que rencontre notre société ne réside pas dans la capacité de traiter un grand nombre de données, bien au contraire. Et pourquoi pas ?

L’histoire de l’innovation contemporaine c’est les Big Data La lecture de la semaine provient de la vénérable revue The Atlantic et on la doit à Erik Brynjolfsson, économiste à la Sloan School of Management et responsable du groupe Productivité numérique au Centre sur le Business numérique du Massachusetts Institute of Technology et Andrew McAfee auteurs Race Against the Machine (« La course contre les machines où comment la révolution numérique accélère l’innovation, conduit la productivité et irréversiblement transforme l’emploi et l’économie »). Elle s’intitule : « l’histoire de l’innovation contemporaine, c’est les Big Data » (c’est le nom que l’on donne à l’amoncellement des données). En 1670, commence l’article, à Delphes, en Hollande, un scientifique du nom de Anton van Leeuwenhoek (Wikipédia) fit une chose que beaucoup de scientifiques faisaient depuis 100 ans. Il construisit un microscope. Ce microscope était différent des autres, mais il n’avait rien d’extraordinaire. Cependant, malgré leurs forces, les mesures ont un défaut.

Blacklists UT1 ludivine [dot] zhang [at] physique [dot] ut-capitole [dot] fr catherine [dot] zhang [at] physique [dot] ut-capitole [dot] fr louis [dot] zhang [at] physique [dot] ut-capitole [dot] fr elisabeth [dot] zhang [at] physique [dot] ut-capitole [dot] fr morgane [dot] zhang [at] physique [dot] ut-capitole [dot] fr simon [dot] zhang [at] physique [dot] ut-capitole [dot] fr romane [dot] rodriguez [at] physique [dot] ut-capitole [dot] fr linda [dot] rodriguez [at] physique [dot] ut-capitole [dot] fr pauline [dot] verdier [at] physique [dot] ut-capitole [dot] fr louise [dot] diop [at] physique [dot] ut-capitole [dot] fr florence [dot] maury [at] physique [dot] ut-capitole [dot] fr carine [dot] lacaze [at] physique [dot] ut-capitole [dot] fr anna [dot] lacaze [at] physique [dot] ut-capitole [dot] fr anthony [dot] robert [at] physique [dot] ut-capitole [dot] fr celia [dot] martinez [at] physique [dot] ut-capitole [dot] fr patricia [dot] moreau [at] physique [dot] ut-capitole [dot] fr

Mario tout de go | Carnet de bord Prédictions : les données seules ne sont pas suffisantes Par Rémi Sussan le 25/09/12 | 4 commentaires | 1,758 lectures | Impression Quelles relations établir entre la gigantesque masse de données fourbie par les ordinateurs – les fameux Big Data -, les modèles utilisés pour les analyser, et les humains qui les interprètent ? C’est la question que s’est posée Nate Silver, dans une brillante analyse de la science météorologique, parue dans le New York Times. Nate Silver n’est pas un inconnu, loin s’en faut. La météo, un succès ? “En 2008“, commence Silver, “le rédacteur en chef de Wired magazine, Chris Anderson, écrivait avec optimisme que nos bases de données étaient désormais si volumineuses et nos ordinateurs si puissants qu’il n’était plus nécessaire de développer des théories, ni même besoin de méthode scientifique. “Mais”, continue Silver, “si nous considérons notre notre capacité de prédiction comme le meilleur moyen de tester nos connaissances, nous n’avons pas bien réussi. Image : Orage sur Enschede, aux Pays-Bas via Wikimedia Commons.

Réso-nance numérique Big Data : la nécessité d’un débat Il nous a semblé intéressant de traduire, de façon collaborative (via Framapad), l’essai original que viennent de publier danah boyd et Kate Crawford présentant « Six provocations au sujet du phénomène des Big Data ».Ces chercheuses, orientées vers l’ethnographie des usages des technologies de communication, s’interrogent – en toute connaissance de cause [cf. cette étude sur les tweets des révolutions tunisiennes et égyptiennes à laquelle a participé danah boyd]- sur les limites épistémologiques, méthodologiques, mais aussi éthiques des Big Data : champ d’études qui s’ouvre aujourd’hui sur la base des énormes jeux de données que fournit internet, en particulier celles générées par l’activité des usagers des sites de réseaux sociaux, que seuls des systèmes informatiques ont la capacité de collecter et de traiter. 6 provocations à propos des Big Data Traduction : Pierre Grosdemouge (@cultord) & Fred Pailler (@Sociographie) à l’initiative de Laurence Allard. L’ère de Big Data a commencé.

MesInfos : quand les “données personnelles” deviennent vraiment… personnelles Par Renaud Francou le 04/12/12 | 6 commentaires | 2,855 lectures | Impression Que se passerait-il si, demain, les organisations partageaient les données personnelles qu’elles détiennent avec les individus qu’elles concernent, pour qu’ils en fassent ce que bon leur semble ? Quels usages, quelles connaissances, quels services, quels risques aussi, pourraient-ils émerger si les individus disposaient, non seulement du contrôle, mais de l’usage de ces données : leurs finances, leurs achats, leurs déplacements, leurs communications et leurs relations en ligne, leur navigation web, leur consommation d’énergie, etc. ? Voilà tout juste un an, la Fing et un petit groupe d’entreprises, d’acteurs publics et de chercheurs décidaient de chercher ensemble les réponses à ces questions un peu iconoclastes : le projet MesInfos était né. Rééquilibrer la relation entre les individus et les organisations Efficacité économique et empowerment Dans deux grands pays, ce mouvement s’engage déjà. Intéressé ?

Big Data : le grand déséquilibre Pour Stéphane Grumbach (blog, @sgrumbach), directeur de recherche à l’Inria, les Big Data sont désormais un sujet important et dont les enjeux sont régulièrement médiatisés, comme le soulignait la semaine dernière le New York Times en s’intéressant à la consommation énergétique des centres de données. Souvent, le sujet est abordé sous l’angle (important) de la protection des données personnelles. Sur la scène de Lift France 2012, Stéphane Grumbach propose lui de l’aborder sous l’angle de la géographie. Le sujet semble iconoclaste, car la caractéristique même de ces données numériques est d’être par essence reproductibles, liquides, disponibles partout et tout le temps… Pas si sûr estime le chercheur (voir sa présentation). La taille de l’univers numérique est estimée à 2,7 Zettabytes de données et il devrait atteindre 35 Zettabytes en 2020. Image : Stéphane Grumbach sur la scène de Lift France 2012, photographié par Loup Cellard pour la Fing. Présentation de Stéphane Grumbach.

Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]

Big Data - Business intelligence Big Data - B&D France Le Big Data, ce n'est pas simplement utiliser de nouvelles technologies pour la gestion de grande volumétries de données, en comptant sur la créativité de certaines populations d'utilisateurs pour en trouver les bons usages. Cela commence par l'identification, avec les métiers, des questions importantes pour l'amélioration de leurs performances, auxquelles ils ne peuvent trouver de réponse avec les systèmes actuels du fait de données initiales trop volumineuses, trop dispersées ou pas suffisamment structurées pour être utilisables. Cela se poursuit par la mise en oeuvre d'une démarche évolutive "Big Data", destinée à apporter des premières réponses sur des premiers ensembles de données. Cette démarche s'enrichit progressivement en termes de services rendus, de traitements possibles et de prises en compte de nouveaux capteurs de données : nouvelles applications dans l'entreprise, objets intelligents, données dites non structurées (documents, web, intranet...), données externes...

Big Data : beaucoup de bruit pour rien ? S'il y a bien eu un thème à la mode cette année, c'est celui du Big Data. Un concept aussi large que peu compréhensible mais promis à un avenir majeur selon les boules de cristal des analystes. La gestion des données hétérogènes en entreprise, dont l'essor est exponentiel, a évidemment du sens. Mais il faut bien le reconnaître, les directions informatiques ont bien du mal à appréhender cette approche, notamment en termes de méthode. Par où commencer ? Pire, 21 % ne prévoient pas d’intégrer le Big Data à leur politique de gestion documentaire, car, pour 38% d'entre-eux, ils ignorent comment exploiter le volume croissant des informations disponibles. 10 % précisent que les hauts dirigeants ne se sentent pas concernés. "La bonne nouvelle est qu’ils sont réellement enthousiastes quant au potentiel du Big Data et conscients des apports pour leur entreprise. Cette étude en confirme une autre réalisée par Markess.

La mine d'or du Big Data Le Monde | • Mis à jour le | Par Julie Battilana, professeure associée à la Harvard Business School L'explosion du volume des données informatiques, du fait du développement de l'Internet et des nouvelles technologies de l'information, a ouvert de nouveaux horizons aux entreprises. Certaines utilisent déjà une partie de ces données pour prédire le comportement des consommateurs et améliorer leur offre de produits et services. C'est le cas, par exemple, de Google, Facebook, Amazon, Microsoft, Walmart et LinkedIn, qui ont investi dans l'analyse de données informatiques ces dernières années. C'est donc un véritable marché, désigné par le vocable anglo-saxon "Big Data", qui a émergé autour de l'exploitation de la masse de données informatiques disponibles. Cette approche leur permet d'augmenter leur chiffre d'affaires en ajustant leur offre aux attentes de leurs clients potentiels, et de réduire leurs coûts.

Le "Big Data" : un cadeau empoisonné pour les Data Miners ? Techniquement, la possibilité existe : il s’agit par exemple de transformer ces contenus en texte-libre, à partir d’une reconnaissance initiale, puis d’utiliser le text-mining*. Quand on dit « Big Data » on pense plus généralement à la pléthore d’informations existant dans les réseaux sociaux, et que beaucoup de professionnels du marketing aimeraient bien pouvoir mieux exploiter pour leur campagnes, mais quid de la qualité de ces données dites « non-structurées » et de leur utilité pour l’entreprise ? Depuis la naissance de l’informatique, un principe né en 1963 à New York est en effet toujours resté particulièrement vrai de nos jours. Il stipule « Garbage in, Garbage out ». Un input de données aberrantes sera traité par un ordinateur, mais il n’en ressortira qu’un résultat absurde ou une absence de résultat. L’Analytique face au « Big Data » Cette contrainte de base a souvent été oubliée, avec des conséquences qui ont pu être grave pour les entreprises.