background preloader

6 – Livre blanc sur la data visualisation, le retour de 30 entreprises

6 – Livre blanc sur la data visualisation, le retour de 30 entreprises
01net le 28/06/13 à 11h50 Si Napoléon est connu pour ses conquêtes et son rôle d’empereur, il l’est beaucoup moins en tant que précurseur involontaire de ce qui est devenu une mode dans le secteur IT, la « data visualisation ». Charles Joseph Minard, ingénieur civil français, a retracé en 1969 les pertes humaines de la Grande Armée lors de la campagne de Russie. En représentant par un graphique une grande quantité de données (les quelque 600 000 grognards), le trajet effectué et une courbe présentant la variation de température dans le temps, il a fait ce que l’on appelle de la « data visualisation ». SAS définit ce phénomène comme « l’exploration visuelle et interactive et la représentation graphique des données, quelles qu’en soient la volumétrie (du small data au big data), la nature ou la provenance. L'évolution de la Grande Armée lors de la campagne de Russie, par Charles Joseph Minard. Pourquoi faire de la data visualisation ? © impactvisuel.net Related:  Informatique decisionnelleData mining

5 – Rendre visuelles des données brutes La data-v isualisation c’est LA nouvelle tendance de création de contenu. Un mot anglais (une fois de plus) pour décrire une nouvelle forme de traitement de l’information. Sur le site de France Inter, Julien Baldacchino présente le concept comme « l’art d’exposer, de façon graphique, des données brutes ». - Rendre les données, parfois complexes, plus digestes pour le lecteur, accessibles à tous pour créer un lien avec le lecteur - Rendre esthétiques, attractives les données pour obtenir la confiance du lecteur Autrement dit, la data-visualisation c’est créer de l’information esthétique. Car en 2013, tout site producteur de contenu a bien compris que le visuel est devenu un élément déterminant dans la mise en scène de l’information. Packaging de brique de lait réalisé par Audrée Lapierre. Nous sommes tous devenus accros aux chiffres, aux sondages, aux pourcentages,… Les internautes veulent pouvoir s’y retrouver facilement, comprendre à la première lecture, ne pas perdre de temps.

Visualisation de données, dessiner pour informer et comprendre… La datavisualisation est l’étude et la mise en image d’informations, de données et de chiffres bruts. Conçue comme un résumé visuel, elle permet de les rendre plus accessibles et ouvre aussi parfois de nouvelles perspectives. Elle est l’œuvre du datadesigner, qui travaille en collaboration avec le datajournaliste (qui recueille les données), à moins d’assumer lui-même cette fonction de documentation et d’investigation. Le datadesigner s’efforce donc de rendre l’information à la fois claire et compréhensible sous une présentation agréable et esthétique. Quelques repères historiques Soulevant le problème de l’absence de formation à l’élaboration et à la lecture des graphiques, Gaëtan Gaborit nous propose, dans un diaporama publié en mai 2012, une initiation au monde des représentations visuelles. la loi de proximité,la loi de fermeture,la loi de similarité etla loi de symétrie. Lisibilité VS recherche esthétique ? Des modèles à suivre ? Des outils accessibles Références :

1 – Data-visualisation, machine learning… Le data mining est un creuset au sein duquel se retrouvent de nombreuses disciplines connexes. On le réduit très souvent au machine learning, thématique où le plus grand nombre de développements ont été réalisés, mais il ne s’y limite pas. Le data mining fait appel à des méthodes relatives à la manipulation de données, leur visualisation, leur prétraitement. Le machine learning n’intervient que relativement tard dans la chaîne même si c’est généralement l’opération la plus longue. Cet article est le deuxième d’une trilogie portant sur le data mining : 1- Le data mining : des données au savoir2- Data-visualisation, machine learning… le data mining sur tous les fronts3- Enjeux du datamining à l'ère du cloud computing et des réseaux sociaux Parmi les nombreuses étapes d’un processus de data mining, la première est généralement la visualisation de données. A propos de l’auteur : En savoir plus :

La Business Intelligence au service des PME Les solutions de Business Intelligence ("BI") facilitent la prise de décision au quotidien dans une entreprise, sur base d'une analyse des dernières données disponibles. L'AWT et la Fédération du Label Cassis font le point sur ces outils, maintenant accessibles aux PME La Business Intelligence Avant de prendre des décisions, le patron cherche à disposer de données fiables sur la situation de son entreprise, en interne, et par rapport à son environnement économique. Avant la "BI", le système D ... les feuilles de calcul Dans beaucoup de PME, ces données sont reprises sur des feuilles de calcul (comme Excel). Le système a le mérite d'être assez simple à mettre en place, en s'appuyant sur les outils bureautiques du bord, mais souffre de plusieurs problèmes: généralement, ce système est employé sans aucune méthodologie de travail, sans organisation bien établie entre utilisateurs alors qu'un minimum d'articulation structurée est nécessaire entre eux. Pourquoi la Business intelligence? Cassis.

Web Analytics for Social Media inShare0 Everything you learned about Web analytics three years ago is now wrong. What to measure in social media. Most marketers approach social media in the same way they've approached broadcast media for decades. Traditionally, marketers focused on quantity metrics like impressions. Web analytics, like much of the marketing world, has tended to focus on the short term, measuring marketing to do better marketing. But social media is different than transaction, and it calls for a different approach to measurement. We also look at the amount of user-created content, but we're more interested in measures of qualified content consumption. True Business Intelligence On today's crowded Web, the winners are the people who create the most value for both the customer and the business over time. Is it still important to strive for quantity? How Do You Measure Social? And sometimes getting started is the biggest hurdle. The real challenges aren't technological, but operational.

5 – Forêts aléatoires et data mining 0inShare Le module STATISTICA Random Forest est intégré à l’outil de data mining STATISTICA Data Miner. Il reprend les travaux effectués par Breiman et répond aussi bien à des problématiques de classification que de régression. Une Forêt Aléatoire (Random Forest) est constituée d’un ensemble d’arbres simples de prévision, chacun étant capable de produire une réponse lorsqu’on lui présente un sous-ensemble de prédicteurs. Pour les problématiques de classification, la réponse prend la forme d’une classe qui associe un ensemble (classe) de valeurs indépendantes (prédicteur) à une des catégories présente dans la variable indépendante. Concernant la régression, l’arbre est une estimation de la variable dépendante en fonction des prédicteurs. Samuel DODE a rejoint StatSoft France il y a 5 ans.

4 – Le reciblage publicitaire selon Criteo Le numéro un français du reciblage publicitaire était présent au salon E-marketing Paris 2013. Ce « retargeteur » est revenu sur sa technologie, basée essentiellement sur le traitement de Big Data. Criteo est devenu un acteur incontournable du reciblage publicitaire en France. La force de ce spécialiste de la publicité en ligne est de s'appuyer sur une énorme quantité de données récoltées au gré de la navigation de l'internaute sur un site de vente en ligne. Pour y parvenir, la société a développé son propre algorithme, qui analyse les données présentes sur sept Data Centers, en France, aux États-Unis ou encore au Japon. Julien Simon, responsable de la technologie, et en charge de l'infrastructure, explique qu'être un « retargeteur » demande énormément de compétences qui n'ont aucun rapport avec le marketing pur. Au final, la société revendique la capacité d'afficher des bannières personnalisées sur les sites Internet, en les générant à la volée. Plus de 500 000 requêtes HTTP par seconde

Le Big Data dépayse l'industrie du voyage Principal fournisseur de solutions informatiques à destination de l’industrie mondiale du tourisme et du voyage, Amadeus se doit de détecter les tendances fortes des technologies en perpétuel mouvement. Un rôle dévolu à Hervé Couturier, responsable Recherche et Développement chez Amadeus IT Group, qui nous donne son avis sur Big Data. Silicon.fr - Pourquoi Amadeus étudie-t-elle Big Data ? Quel intérêt pour le secteur du voyage ? Hervé Couturier – Le Big Data est l’une des quatre grandes tendances aux côtés du Cloud, de la mobilité et des réseaux sociaux. Hervé Couturier, responsable R&D chez Amadeus IT Group. L’étude montre que notre industrie se trouve face à un tournant majeur : le monde du transport utilise surtout des données très structurées. Peut-on déjà constater des évolutions ? Certains sites Web utilisent déjà des angles différents. Comment interviennent les technologies Big Data ? Levier de ces nouvelles possibilités, les technologies Big Data sont très accessibles. Voir aussi

Springy - A force directed graph layout algorithm in JavaScript.

Related: