background preloader

De la statistique aux big data : ce qui change dans notre compréhension du monde

Par Hubert Guillaud le 19/12/12 | 9 commentaires | 4,776 lectures | Impression Lors de la dernière édition des Entretiens du Nouveau Monde industriel qui avaient lieu les 17 et 18 décembre 2012 au Centre Pompidou, le sociologue Dominique Cardon a proposé une intéressante matrice pour comprendre à la fois les limites de la réutilisation des données ouvertes et celle des “Big Data“. Nous sommes désormais confrontés à un incroyable déluge de données produit par le numérique, reconnaît Dominique Cardon. Mais sont-elles nécessaires ? Depuis quelques années, un ensemble de discours (relayé à la fois par des militants, des citoyens, des entreprises, des pouvoirs publics) se met en place autour “du nécessaire partage des données”. “La structuration des données a-t-elle pour but de mettre en forme, classer, comparer les individus (en maintenant leurs singularités) ou sont-elles comprises, organisées à partir de catégories ?” Image : la cartographie localisée de la criminalité de Londres. Related:  big dataBig DataData Mining

Comment le Big Data va révolutionner 2013 "2012 a été l'année de l'évangélisation, 2013 sera l'année de la mise en place." Chez Atos, géant international du service informatique, pas de doute : cette année verra la multiplication des systèmes d'analyse dits de "Big Data". Plus qu'un concept, cette "grosse quantité de données" (littéralement) renvoie à de nouveaux systèmes informatiques qui promettent de "révolutionner la vie quotidienne". Le Big Data a émergé face à un constat. "Internet a changé le monde des années 1990, le Big Data va changer celui des années 2010", anticipe Chuck Hollis, directeur technique du leader mondial du stockage EMC et gourou du Big Data. Prédire les crises cardiaques Mais dans la pratique, comment s'illustre ce Big Data ? Les applications du Big Data sont nombreuses. "L'analyse des sentiments est très recherchée puisqu'avec des outils de sémantique, nous sommes capables de dégager les différents sentiments manifestés en temps réel sur les réseaux sociaux, même le second degré !" Big Data et politique

Qu'est-ce que le Big Data ? Les 3 V du Big Data Pour bien délimiter le Big Data, le concept a été caractérisé par « Les 3 V » : Volume, Vitesse et Variété. Volume Lorsqu'on parle de volume pour le Big Data, on évoque souvent les 7 téraoctets (7.000 milliards d'octets) générés quotidiennement par Twitter ou les 10 téraoctets de contenus échangés tous les jours sur Facebook. C'est au début des années 2000 que les grands intervenants du Web ont ressenti, bien avant les autres secteurs d'activité, la nécessité de gérer une masse exponentielle d'informations. Variété Le corollaire du volume croissant est une diversification importante des formats et des sources de données. Les décideurs et les DSI français commencent à en prendre conscience, même si leur vision du Big Data semble encore assez parcellaire. Vitesse La vitesse correspond à la fréquence de remontée des informations.

Big Data : pourquoi nos métadonnées sont-elles plus personnelles que nos empreintes digitales A l’occasion du colloque « la politique des données personnelles : Big Data ou contrôle individuel « organisé par l’Institut des systèmes complexes et l’Ecole normale supérieure de Lyon qui se tenait le 21 novembre dernier, Yves-Alexandre de Montjoye (@yvesalexandre) était venu présenter ses travaux, et à travers lui, ceux du MediaLab sur ce sujet (Cf. « D’autres outils et règles pour mieux contrôler les données » ). Yves-Alexandre de Montjoye est doctorant au MIT. Il travaille au laboratoire de dynamique humaine du Media Lab, aux côtés de Sandy Pentland, dont nous avons plusieurs fois fait part des travaux. Nos données de déplacements sont encore plus personnelles que nos empreintes digitales Faire correspondre des empreintes digitales n’est pas si simple, rappelle Yves-Alexandre de Montjoye. Image : illustration de l’unicité de nos parcours repérés via des antennes mobiles. Et Yves-Alexandre de nous inviter à retrouver un de ses collègues du Media Lab. Hubert Guillaud

Vertigineux "big data" Chaque seconde, la masse de données créées sur Internet par les smartphones, ordinateurs et tablettes explose. Appelé "big data" par les experts du Web, cet amas colossal est un marché prodigieux. LE MONDE | • Mis à jour le | Par Sarah Belouezzane et Cécile Ducourtieux Photos, vidéos, sons, chiffres, textes... Tous les jours, ce sont 118 milliards de mails qui sont envoyés à travers le monde, 2,45 milliards de contenus différents qui sont postés sur Facebook. Les humains ne sont pas les seuls responsables de ce déluge d'informations. "Cela fait quelque temps déjà que le nombre de données produites et stockées est important, note Patrice Poiraud, directeur business et analyse chez IBM. Ces données, de plus en plus d'entreprises cherchent à les exploiter. Du coup, des éditeurs de logiciels informatiques ont mis au point des techniques empruntées au calcul scientifique pour "mouliner toutes ces données" de manière exhaustive.

Du Big Data au Valued Data - TRIBUNE Les articles, dossiers, tables rondes et conférences sur le big data se sont multipliés depuis quelques mois. De plus en plus de sociétés s’emparent du phénomène de mode pour revendiquer leur expertise du sujet et s’accaparer les centaines de millions, voire les milliards de dollars promis sur ce « nouveau » marché. Les modes se suivent et se ressemblent : le « tout CRM » à la fin des années 90, le « 1 to 1 » début 2000, le « web 2 »… A chaque fois, ces expressions sont synonymes d’avancées concrètes, d’outils innovants mais aussi de sur-promesses et de raccourcis. Il y a beaucoup de confusion et de fantasmes derrière l’expression « big data ». Mais le flou est entretenu et personne ne sait vraiment de quelles données on parle quand on parle de « big data ». les données provenant des outils de tracking : sites web fréquentés, pages visitées, mots-clés recherchés… ;les données provenant de l’analyse textuelle et/ou sémantique du contenu des réseaux sociaux : qui parle de quoi ?

Big data, l’enjeu du pouvoir Le Big Data, Le Cloud … Internet évolue maintenant si vite que ses nouveaux développements deviennent des enjeux majeurs avant même que le grand public ait eu le temps de les comprendre. Nous nous retrouvons donc à employer, lire, entendre mentionner des terminologies désignant des concepts ou des technologies dont nous savons qu’elles sont cruciales, sans pour autant avoir la moindre idée de leur nature. Un nom qui fait peur, pour un concept bien simple Au même titre que la mystérieuse appellation “Cloud” désigne tout simplement le stockage de données sur des serveurs distants mais bien réels, le concept de “Big Data” recouvre une réalité somme toute assez simple. Depuis une décennie, le volume et la variété des données informatiques que nous produisons ainsi que la rapidité avec laquelle nous les stockons et traitons ont littéralement explosés. C’est simple, en fait. Des ordres de grandeurs défiant la raison Le traitement des données informatiques : enjeu majeur du siècle à venir

Pourquoi nous aimons les données ! Publié le 21 juillet 2014 Aujourd’hui, grâce à la science et l’informatique, les données sont partout et permettent tant de modéliser le climat, que d’anticiper les comportements des consommateurs. C’est sûrement formidable pour certains, mais pas forcément toujours très rassurant… Pourquoi les données ne seraient-elles pas véritablement accessibles, inscrites dans nos usages quotidiens ? Et même, à l’instar des matériaux qui couvrent nos objets, pourquoi ne deviendraient-elles pas objet d’émotion, de plaisir ? Certes, les gouvernements et entreprises, producteurs et exploitants de données ont fait quelques efforts. Des données aux informations Les données n’ont aucun intérêt. « Culture is Data », qui est un rapport non-officiel et foncièrement visuel de la Culture en France en 2012 est un bon exemple. De la « Data Viz » à la « Data Use » L’objet du projet Refact est de permettre à chacun de voir une activité quotidienne sous un autre jour : passer des coups de téléphone, envoyer des SMS.

Vie privée: même quand vous êtes déconnecté, Facebook peut vous traquer Ils n'utilisent pas Facebook et pourtant ils sont épiés. Un rapport publié fin mars révèle que le réseau social traque les utilisateurs déconnectés mais aussi ceux qui ne sont pas inscrits. Il a été commandé par la Commission de la protection de la vie privée de Belgique, l'équivalent de la CNIL, et réalisé par des chercheurs de deux universités belges. Plusieurs médias français s'en sont fait l'écho parmi lesquels Le Monde et Le Figaro. Comment Facebook s'y prend pour pister les internautes, usagers ou non? Contraire à la vie privée Dans le cas de Facebook, ces cookies continuent à agir lorsque l'utilisateur est déconnecté. Plus gênant encore, le rapport révèle que même si un individu n'a jamais été inscrit sur le réseau social, il peut également être concerné. Un problème en passe d'être résolu Comme si cela ne suffisait pas, le rapport pointe également les difficultés pour les internautes de supprimer lesdits cookies.

Data centers: la donnée écolo Il y en a des milliers dans le monde. Plus d’une centaine en France. Les data centers sont la face cachée d’Internet ; on y a recours tous les jours. Quand on consulte un site web, quand on envoie un mail, quand on publie une photo en ligne. En 2011, Google possédait à lui seul 900 000 serveurs. Il y a un an, l’ONG a tiré la sonnette d’alarme, rappelant que les data centers étaient responsables de 2% des émissions de CO2. Eau de mer. Mais comment y parvenir ? OVH a par exemple inventé son propre système de water cooling, ou «refroidissement à eau». Et quid de la chaleur émise en continu par les data centers ? Energies vertes, réduction de la consommation, recyclage de la chaleur… Ces initiatives suffiront-elles à limiter l’impact environnemental des data centers ? L’évolution des composants électroniques devrait aider. «Ondulateurs».

Big Data, le modèle GAFA et sa déclinaison marketing - Dossier : Data driven marketing L’apparition des besoins croissants d’analytics pour traiter de grandes quantités de données est apparue avec les grands noms de la tech. Google en tête, suivi par IBM, Microsoft, Oracle ou même Wikipédia. Leur point commun : avoir à traiter d’immenses quantités de données pour leur activité. L’utilisation du Big Data et des technologies de Data Mining sont alors devenues une réalité du business de nombreuses entreprises dans le web et le digital. Mais aujourd’hui, le Big Data a fait son chemin et ses intérêts dans la proposition de valeur des géants de la Silicon Valley font de nombreux émules, d’abord chez les prestataires de services de Marketing Cloud, ensuite au sein de nombreuses entreprises et start-ups, pour qui les affaires passent de plus en plus souvent par le net. Le Big Data ne s’est pas inventé tout seul : il s’est imposé Il serait mentir que d’affirmer que le succès des géants de la Silicon Valley auraient pu affirmer leur modèle économique sans Big Data.

Vos empreintes numériques Vos empreintes numériques sont censées refléter votre personnalité. Assurez-vous que c’est bien le cas grâce à nos didacticiels faciles à suivre. Chaque jour, que nous le voulions ou non, nous alimentons notre profil en ligne, un profil qui est sans doute plus ouvert au public que nous ne l’imaginons. Grâce à ce profil, des entreprises envoient des contenus ciblés à des marchés et des consommateurs spécifiques ; des employeurs peuvent fouiller votre passé ; des annonceurs suivent vos recherches sur d’innombrables sites web. Donc, quelques soient vos activités virtuelles, il est important que vous sachiez quelles traces vous laissez et quelles en sont les conséquences. Sachant qu’il est impossible de ne laisser AUCUNE empreinte, il n’est pas si difficile, en revanche, d’atténuer l’impact de ces empreintes et de maîtriser votre identité numérique. Voici quelques trucs pour le faire! 1. Vos empreintes numériques sont les traces que vous laissez derrière vous sur Internet. Media sociaux 2. 3.

Data Mining et Analyses Prédictives avec le Logiciel STATISTICA Le Data Mining pour faire la Différence. Certains parlent à juste titre de la période actuelle comme de “l'Ère Analytique”, c'est-à-dire une période au cours de laquelle la révolution de l'information a conduit à l'ère de l'analyse, et où l'enjeu consiste à dégager du sens dans cet incroyable déluge de données. À StatSoft, nous avons maintes opportunités d'échanger, conseiller et former des collaborateurs dans le domaine de l'analyse des données et de la modélisation prédictive dans de nombreuses industries : construction automobile, services financiers, matériel médical, Recherche & Développement et production pharmaceutique, semi-conducteurs, etc... Logiciels La plate-forme STATISTICA d'Analyse des Données et de Data Mining, avec notamment le logiciel STATISTICA Data Miner, offre la gamme d'outils la plus complète, efficace et conviviale pour l'ensemble du processus de data mining – du requêtage des bases de données jusqu'à la production des rapports. Services (Conseil, Formation)

Data et Créa : et si on les mariait ? | L’ADN La mode voudrait que le monde du marketing et de l’innovation soit divisé en deux. à l’image de notre cerveau, il serait partagé entre hémisphère gauche et droit, entre raison et désir, vision analytique et vision créative. Calculatrice ou Crayola. Analyste ou créatif. Et l’on nous demanderait de choisir notre camp. D’un côté : la « dataïfication » du monde et les capacités de plus en plus puissantes des machines marqueraient la victoire des cerveaux analytiques par KO. De l’autre : la data serait une machine de destruction massive. Un peu d'histoire... Les années 1970. Puis, à la fin des années 1970, une bande de jeunes californiens, épris de beat culture, des Nolan Bushnell, Ted Dabney (fondateurs d’Atari), Steve Wozniak, Steve Jobs… se passionnent pour l’informatique. Et dans les années 1980, l’ordinateur devient personnel. IBM et HP se découvrent des pieds d’argile, et sont terrassés par les nouveaux acteurs qui puisent leurs racines dans la révolution culturelle des seventies.

Related: