background preloader

De la “Data Science” à l’infovisualisation (1/2) : qu’est-ce qu’un data scientist

De la “Data Science” à l’infovisualisation (1/2) : qu’est-ce qu’un data scientist
Par Rémi Sussan le 06/03/13 | 7 commentaires | 2,637 lectures | Impression Comment articuler “Science des données” et visualisation ? C’est à cette question que se sont attaqués une multitude d’experts lors de la journée d’étude PraTIC du 25 février (conçue et organisée par Etienne-Armand Amato, Etienne Perény et Jean-Christophe Plantin pour Gobelins, l’Ecole de l’Image, en partenariat avec le laboratoire Paragraphe de l’Université Paris 8 et l’Observatoire des mondes numériques en sciences humaines). Car il s’agit de deux domaines indissociables, mais, comme l’a expliqué Jean-Christophe Plantin (@JCPlantin, blog), souvent présentés de manière séparée. La science des données est-elle une science ? L’expression “data scientist” a été créée en 2008 par Patil (qui s’occupa de “data science” à Linked-in) et Hammerbacher (qui travailla dans le même domaine pour Facebook) lorsqu’ils ont tenté de qualifier le travail des personnes confrontées à d’énormes masses de données. Modèles de graphes Related:  Big Data - Gestion données de masse

De la “Data Science” à l’infovisualisation (2/2) : rendre tangible la friction des données Par Rémi Sussan le 12/03/13 | 2 commentaires | 1,618 lectures | Impression L’après-midi de la journée d’études PraTic a continué (voir la première partie) avec une intervention passionnante de Paul Edwards, professeur de sciences de l’information et d’histoire à l’université du Michigan, qui s’est penché sur les aspects “matériels” de la collection de données, ce qu’il appelle la “friction des données”. Car celles-ci impliquent un coût en transport, en énergie, qui peut ralentir l’analyse. Il rappelle que dans les années 50, le nombre de cartes perforées au centre de données météorologiques américain était si important qu’on croyait que le bâtiment risquait de s’effondrer sous le poids ! A cette friction des données correspond celle des “métadonnées”, qui racontent comment les données ont été construites. Lorsqu’on travaille dans ce domaine, on cherche à transformer les informations météo, issues du court terme, en tendances climatiques, propres au long terme. Au delà du sens de la vue

Imprimantes 3D En sortira-t-il autre chose que des “Crottbjets” Justin Pickard (@justinpickard) est écrivain, futurologue « gonzo » au sein du collectif de designers Superflux et doctorant au Steps, un centre de recherche international sur les facteurs sociaux, technologiques et environnementaux de la durabilité. Sur la scène de Lift (vidéo), il est venu parler de l’impression 3D, pour tenter de renverser notre perspective sur le phénomène technologique du moment. L’impression 3D est encore chère, bien plus chère que nos imprimantes de bureau. Elle demeure encore réservée aux innovateurs, aux adopteurs précoces. Image : Justin Pickard sur la scène de Lift, photographié par Ivo Näpflin. Justin Pickard choisit d’attaquer par des objets étranges, comme ceux trouvé à l’exposition itinérante 3D Print Show, notamment l’inquiétant Foetus Project de Jorge Lopes Dos Santos, étudiant au Royal College of Art. « En tant que designer, une grande part de l’anxiété que génère l’impression 3D est liée à la désintermédiation du design. Hubert Guillaud

WeDoData Franck Ghitalla, l'as des réseaux LE MONDE SCIENCE ET TECHNO | • Mis à jour le | Par David Larousserie Franck Ghitalla est cartographe. Le métier fleure bon la Renaissance et la conquête des Amériques ou des Indes. Pourtant, rien de vieillot dans son travail de recherche et d'enseignement ou sa personne. Les continents qu'il contribue à cartographier, représenter et analyser sont parmi les plus modernes qui soient : le Web, les réseaux sociaux, les blogs, ou tout autre tas de données gigantesques qu'on veut bien lui confier. Par "carte", il faut entendre une mosaïque de disques plus ou moins gros et colorés, reliés par des arcs plus ou moins épais. Cette technique dévoile parfois l'invisible. Cet ancien professeur de français en lycée, devenu chercheur en linguistique, n'était pas destiné à plonger au coeur des techniques de l'information. Le projet passionne son petit groupe d'étudiants-ingénieurs de Compiègne. "Franck était un peu notre gourou. Il se définit maintenant comme "porteur de projets innovants".

Hadoop Un article de Wikipédia, l'encyclopédie libre. Hadoop a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009. Historique[modifier | modifier le code] En 2004, Google publie un article présentant son algorithme basé sur des opérations analytiques à grande échelle sur un grand cluster de serveurs, le MapReduce, ainsi que son système de fichier en cluster, le GoogleFS. Architecture[modifier | modifier le code] Hadoop Distributed File System[modifier | modifier le code] Une architecture de machines HDFS (aussi appelée cluster HDFS) repose sur deux types de composants majeurs : Le HDFS n'est pas entièrement conforme aux spécifications POSIX, en effet les exigences relatives à un système de fichiers POSIX diffèrent des objectifs cibles pour une application Hadoop. MapReduce[modifier | modifier le code] Hadoop dispose d'une implémentation complète de l'algorithme de MapReduce. HBase[modifier | modifier le code] Article détaillé : HBase.

Infographie : Le temps passé sur Internet Infographie : Le temps passé sur Internet Home » Société » Infographie : Le temps passé sur Internet Voici une infographie bien interessante, que nous apprend-elle ? On passe en moyenne 16 h par mois sur le net… ok, ceux qui lisent ceci doivent exploser les scores, ce n’est qu’une moyenne.La France est 3ème au classement des pays les plus connectés devant les Etats-Unis et encore plus surprenant devant le Japon ! Author: Simon Mari, père de famille, bricoleur du dimanche, blogueur... Share This Post On 12 Comments Guillaume de komment devenir riche 01/03/2012 Intéressant Moi je retiens qu’il faudrait se positionner maintenant sur le marché Chinois Post a Reply forfait mobile 16/03/2012 130 millions de VU pour Yahoo, j’aurai jamais cru ça encore…. ! Submit a Comment Votre adresse de messagerie ne sera pas publiée. NewsLetter Toile*Filante * = Champ requis Vous allez tout trouver ! Toile*Filante c’est : 1510Abonnés243Fans536posts2954commentaires Commentaires récents

Dataviz : les outils gratuits indispensables mar132012 La visualisation des données (dataviz) est devenu la nouvelle marotte des rédactions connectées. m0le'o'blog vous propose une petite sélection des meilleurs outils gratuits. Révolu, le temps où les connaisseurs d'Excel étaient les seuls à pouvoir transformer des tableurs complexes en graphiques lisibles par tous ? Beaucoup de développeurs en font le pari en lançant leurs propres applications. m0le'o'blog en sélectionne quelques-unes pour vous. Comble du luxe, elles sont toutes gratuites ! Cliquez sur le titre pour arriver sur la page d'accueil des applications. Image : capture d'écran sur tableausoftware.com La société Tableau Software fait le pari d'un logiciel tourné sur la visualisation des données. Avantages le large éventail de visualisations disponibles, notamment gréographiquesla possibilité de travailler offline une fois le logiciel installél'exportation sur Internet optimisée Inconvénients Image : capture d'écran de create.visual.ly Jusqu'à présent, Visual.ly

Humanitarianism in the Network Age: Groundbreaking Study My colleagues at the United Nations Office for the Coordination of Humanitarian Affairs (OCHA) have just published a groundbreaking must-read study on Humanitarianism in the Network Age; an important and forward-thinking policy document on humanitarian technology and innovation. The report “imagines how a world of increasingly informed, connected and self-reliant communities will affect the delivery of humanitarian aid. Its conclusions suggest a fundamental shift in power from capital and headquarters to the people [that] aid agencies aim to assist.” The latter is an unsettling prospect for many. To be sure, Humanitarianism in the Network Age calls for “more diverse and bottom-up forms of decision-making—something that most Governments and humanitarian organizations were not designed for. Systems constructed to move information up and down hierarchies are facing a new reality where information can be generated by any-one, shared with anyone and acted by anyone.” Summary communities first

Apache™ Hadoop® Les 50 chiffres à connaître sur les médias sociaux en 2012 L’heure est aux traditionnels bilans de fin d’année ! Même si elle n’est pas encore tout à fait terminée, on peut dire que 2012 aura été une année plutôt riche en ce qui concerne les média sociaux : le milliardième membre sur Facebook, la montée en puissance de Pinterest, les levées de fonds toujours plus énormes… Les chiffres traduisent l’engouement pour les médias sociaux, dont l’usage ne faiblit pas. Mais que faut-il retenir de cette année 2012 ? Nous avons compilé ici 50 chiffres marquants, qui résument bien ce qu’il s’est passé sur les médias sociaux au cours des 12 derniers mois. En attendant 2013… Facebook Twitter Youtube 4 milliards de vidéos sont vues chaque jour935 millions : le nombre de vues de la vidéo Gangnam style aujourd’hui… Le milliard approche.Youtube a fêté ses 7 ans en mai 201272 heures de vidéos sont uploadées chaque minute sur Youtube700 vidéos Youtube sont partagées sur Twitter toutes les minutesEn moyenne, un visiteur de Youtube y passe 15 minutes par jour Pinterest

We’re witnessing the rise of the graph in big data GraphLab, a popular open source project dedicated to graph analysis and machine learning, is trying to capitalize on the excitement around graphs by spinning off a commercial entity, GraphLab Inc. GraphLab creator — and University of Washington machine learning professor — Carlos Guestrin will lead the new Seattle-based company, which has raised $6.75 million from Madrona Venture Group and NEA. Graph analysis is among the hottest techniques around for making sense of large datasets, primarily by determining how tightly different data points are related or how similar they are. The term “graph” came into the broader lexicon along with social networks, which built social graphs to assess the relationships among their millions of users, but the technique has much broader uses. My LinkedIn social graph One of Ayasdi’s graph-like data maps Google also famously uses a graph-processing system called Pregel as part of PageRank.

Captain Dash, futur super héros du Big Data J’ai rencontré Gilles Babinet un soir d’avril pour évoquer avec lui sa nouvelle aventure : Captain Dash. Armé de ma tablette (sur laquelle j’avais préalablement chargé l’application idoine), j’ai découvert, démonstration à l’appui, qu’un Captain Dash pouvait en cacher un autre… « L’institutionnel c’est bien, mais la start-up c’est génial ! » Gilles Babinet, vous le connaissez déjà (voir la superbe transcription d’une de ses dernières présentations sur la révolution de la société par Internet, retranscrite par Michael Tartar). C’est ainsi que l’ex fondateur de Eyeka est reparti à l’aventure, et ce n’est pas un vain mot : « cela représente 2 ans et demi de développement » a-t-il dit. [mon “univers” statistique avec Captain Dash] Réinventer le tableau de bord La mission de Captain Dash, c’est de devenir le super-héros du tableau de bord. [le mode battle] à l’assaut des grands comptes Tout cela est fort beau, mais ce n’est pas là que notre super héros frappe le plus fort ! WordPress:

Nouvelles manières de s'informer: la TV désormais vulnérable Toujours moins de journaux imprimés, moins de magazines et de radio, mais aussi désormais de moins en moins de TV. Tel est le principal enseignement de l'étude dont le monde des médias aux Etats-Unis parle en ce moment : l'évolution de la manière dont les Américains aujourd'hui s'informent, décryptée, comme tous les deux ans, par le Pew Research Center. Contrairement aux autres médias d'information, la télévision avait bien résisté à l'essor d'Internet et reste encore aujourd'hui la principale source d'infos aux USA. Mais elle perd progressivement du terrain, notamment vis-à-vis des nouvelles générations qui s'informent de plus en plus via des terminaux mobiles (x 2 en deux ans) et les réseaux sociaux (x 3). Parmi les adultes de moins de 30 ans, les réseaux sociaux arrivent désormais à égalité avec la télévision! A noter aussi pour la télévision: L'info en ligne: toujours plus mobile et plus sociale

Related: