background preloader

Big data

Facebook Twitter

Data Visualization: Modern Approaches - Smashing Magazine. Big Data vous regarde ! Les données, puissance du futur. LE MONDE | • Mis à jour le | Par Stéphane Grumbach, Stéphane Frénot Nous vivons une période de rupture, celle de la numérisation de tout : l'homme, la société, les organisations, le savoir, les interactions, le corps biologique de chacun, etc. Tout devient donnée numérique, et par là même a vocation à une existence dans le monde virtuel en émergence. L'écart entre le monde des données et le monde réel, bien anticipé par Jorge Luis Borges dans sa nouvelle visionnaire De la rigueur de la science, évoluera pour devenir de plus en plus subtil. Il y a un avant et il y a un après-numérisation. Il nous est aussi difficile d'imaginer les évolutions de la société de l'information qu'il l'était de prévoir au milieu du XIXe siècle les possibilités permises par l'électricité.

Les données constituent les briques de base de la société de l'information. Leur quantité est en croissance exponentielle. Les centres de données consommeront bientôt autant d'électricité qu'un pays comme la France. Nate Silver et les limites du Big Data. VHX. Data Drones Pakistan. Le magazine de la Data : informations, initiatives, projets, applications et perspectives sur la Data en France et en Europe. Guide du datajournalisme. Guide du datajournalisme.

Actualité du Journalisme graphique | Karen Bastien | France. The top 20 data visualisation tools. The top 20 data visualisation tools. Information aesthetics. 6 – Livre blanc sur la data visualisation, le retour de 30 entreprises. 01net le 28/06/13 à 11h50 Si Napoléon est connu pour ses conquêtes et son rôle d’empereur, il l’est beaucoup moins en tant que précurseur involontaire de ce qui est devenu une mode dans le secteur IT, la « data visualisation ».

Charles Joseph Minard, ingénieur civil français, a retracé en 1969 les pertes humaines de la Grande Armée lors de la campagne de Russie. En représentant par un graphique une grande quantité de données (les quelque 600 000 grognards), le trajet effectué et une courbe présentant la variation de température dans le temps, il a fait ce que l’on appelle de la « data visualisation ». SAS définit ce phénomène comme « l’exploration visuelle et interactive et la représentation graphique des données, quelles qu’en soient la volumétrie (du small data au big data), la nature ou la provenance.

L'évolution de la Grande Armée lors de la campagne de Russie, par Charles Joseph Minard. Pourquoi faire de la data visualisation ? © impactvisuel.net. 5 – Rendre visuelles des données brutes. La data-v isualisation c’est LA nouvelle tendance de création de contenu. Un mot anglais (une fois de plus) pour décrire une nouvelle forme de traitement de l’information. Sur le site de France Inter, Julien Baldacchino présente le concept comme « l’art d’exposer, de façon graphique, des données brutes ».

Une infographie, par exemple, est une forme de data-visualisation. Cette nouvelle technique, désormais utilisée massivement notamment par les sites d’informations, a deux fonctions majeures : - Rendre les données, parfois complexes, plus digestes pour le lecteur, accessibles à tous pour créer un lien avec le lecteur - Rendre esthétiques, attractives les données pour obtenir la confiance du lecteur Autrement dit, la data-visualisation c’est créer de l’information esthétique.

Car en 2013, tout site producteur de contenu a bien compris que le visuel est devenu un élément déterminant dans la mise en scène de l’information. Packaging de brique de lait réalisé par Audrée Lapierre. Unnamed St (remix) – Streetmix. Data Visualization. [infographie] Ukraine : la démocratie en dictature ! L’Ukraine, un bien beau pays qui est dans l’actualité en ce moment pour de bien tristes raisons… Malgré les vaillants efforts de l’opposition en Ukraine, le Parlement ukrainien a adopté une loi brutale qui dirige le pays en plein dans la dictature.

Sont interdits en vertu de la nouvelle loi (sous peine d’emprisonnement) de conduire des voitures dans des colonnes qui dépassent cinq véhicules longs, de mettre en place un système sonore (émission ou réception) non déclaré, les « perturbations de masse » sont passibles de 10 à 15 ans d’emprisonnement, des informations sont collectés sur la police ou les juges, j’en passe… (l’image en grand format) Bref, comme souvent je vous invite à rester vigilant autant que possible sur vos droits, vos libertés et à rester informés tout en informant… et à militez avec vos propres moyens, si vous le pouvez! Source Êtes-vous adepte du multitasking ? (voir l’image en grand) Et vous, êtes-vous « multitâche » ? 1 – Data mining et marketing. Le data mining signifie littéralement « forage de données ». Comme dans tout forage, sont but est d’extraire des données disponibles au sein de toute entreprise des informations exploitables d’un point de vue commercial.

Dans le contexte actuel ou le consommateur est considéré comme volatile, ou la concurrence s’intensifie et ou les marchés deviennent saturés, le client devient l’acteur principal de l’entreprise. Des milliers d’informations sont collectées sur les comportements des clients mais sont le plus souvent mal exploitées. Le data mining intervient alors pour exploiter au mieux ces données. 1 . Présentation du data mining Le data mining (appelé également exploitation stratégique de données) est apparu au milieu des années 90 avec le développement des datawharehouse. Le data mining correspond à l’ensemble des techniques et des méthodes qui à partir de données permettent d’obtenir des connaissances exploitables. 2. 3.

Exemples de logiciels (liste non exhaustive) 4. Marketing direct. 9 – Nate Silver et les limites du Big Data. 2 – Ciblage comportemental. Un article de Wikipédia, l'encyclopédie libre. Le ciblage comportemental est une technique de publicité qui consiste à personnaliser les contenus promotionnels, en fonction du comportement des internautes et de l'identification de leurs centres d'intérêt. Le logiciel AdWords de Google en est l'un des exemples les plus connus. Mais on peut aussi citer « Beacon », le système de ciblage comportemental de Facebook, qui a de son côté défrayé la chronique en annonçant la commercialisation du profil de ses membres à des annonceurs[1]. Définition[modifier | modifier le code] L'expression Ciblage comportemental est la traduction française du terme anglo-saxon « Behavioral Targeting », souvent employé sous l'abréviation « BT ».

Origine[modifier | modifier le code] Internet est un média dans lequel chaque utilisateur choisit le contenu qu'il souhaite consulter, ce qui induit une fragmentation de l'audience et donc une problématique de media planning spécifique. Objectifs[modifier | modifier le code] 10 – Nate Silver, saint patron des "nerds"… Il n'est pas encore là que l'assemblée se tait déjà. Dans une atmosphère quasi religieuse, les quelque 250 Londoniens sagement assis face à l'estrade attendent l'arrivée de l'oracle américain, en silence. Démarche un peu gauche et sourire bon enfant, Nate Silver, le saint patron des "nerds" (le sobriquet désigne les obsessionnels du chiffre et des nouvelles technologies), apparaît enfin, avec quelques minutes de retard.

Il est là, costume gris et lunettes rectangles, avec des airs d'oiseau tombé du nid, face aux mines imprégnées de ses fidèles, aussi sûr de ses algorithmes que de son aura. Des mois avant le scrutin présidentiel américain du 6 novembre 2012, il annonçait une confortable victoire de Barack Obama. Faisant ainsi mentir les analystes et autres experts qui pronostiquaient un vote serré. Ce jour-là, à Londres, il est venu faire la promotion de son livre, The Signal and the Noise ("Le Signal et le Bruit", paru aux Etats-Unis en septembre 2012). Il a du pain sur la planche. 11 – Sites de rencontres et SHS… 1 – Exploration de données. Un article de Wikipédia, l'encyclopédie libre. Vous lisez un « bon article ». L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web.

C'est aussi le mode de travail du journalisme de données[1]. L'exploration de données[2] fait suite, dans l'escalade de l'exploitation des données de l'entreprise, à l'informatique décisionnelle. Histoire[modifier | modifier le code] Collecter les données, les analyser et les présenter au client. De 1919 à 1925, Ronald Fisher met au point l'analyse de la variance comme outil pour son projet d'inférence statistique médicale. L'arrivée progressive des micro-ordinateurs permet de généraliser facilement ces méthodes bayésiennes sans grever les coûts. Applications industrielles[modifier | modifier le code] 6 – Les données, puissance du futur.

5 – Données le vertige. Des flots d’octets, un océan de données, un déluge de connaissances… A mesure qu’Internet tisse sa toile, le volume d’informations numérisées n’en finit plus d’exploser. D’ici huit ans, cette masse vertigineuse de «datas» sera 50 fois supérieure à ce qu’elle est aujourd’hui, prédit le cabinet d’études IDC. Et il faudra dix fois plus de serveurs informatiques pour espérer gérer cette déferlante. Pas par crainte d’être submergés, mais plutôt pour être en mesure de retrouver, d’extraire et d’exploiter cette nouvelle manne. Il y a vingt ans, nous stockions encore nos fichiers sur des disques durs de quelques mégaoctets (1 Mo équivaut à 1 000 000 d’octets, soit 106 octets, 1 octet valant 8 bits ; le bit est l’unité de base en informatique, à savoir un 0 ou un 1).

Photo: Emmanuel Pierrot.Vu pour Libération «Capteurs». C’est là qu’intervient une nouvelle discipline : le «big data». Mesagraph fournit ainsi à Canal + une modélisation de son audience à partir des conversations sur Twitter.