background preloader

Vers un monde de données ?

Vers un monde de données ?
Nous sommes entrés dans un monde de données, dans un monde où les données sont en passe de devenir l’essence même de la connaissance et de l’information. La donnée (data) est la plus petite part d’information accessible, à la manière des zéros et des uns qui constituent les bits d’information à l’heure du numérique. Elle est déterminée par des valeurs, par des champs qui s’appliquent à elle et la qualifie. Avec l’informatisation de notre quotidien, tout devient données. Les données sont le moteur du web sémantique de Tim Berners-Lee (ce web de données ou web 3.0) comme du web² de John Battelle et Tim O’Reilly. C’est le moteur du web implicite, celui qui comprend le moindre de nos clics. Ces données deviennent intelligentes par leur recoupement et leurs capacités à adapter notre environnement au contexte que les machines perçoivent de nous via leurs capteurs. Ces données sont multiples, hétéroclites, hétérogènes, mais elles se relient les unes aux autres. Hubert Guillaud

Big data Un article de Wikipédia, l'encyclopédie libre. Une visualisation des données créée par IBM[1] montre que les big data que Wikipedia modifie à l'aide du robot Pearle ont plus de signification lorsqu'elles sont mises en valeur par des couleurs et des localisations[2]. Croissance et Numérisation de la Capacité de Stockage Mondiale de L'information[3]. Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l'analyse et la visualisation des données doivent être redéfinis. Certains supposent qu'ils pourraient aider les entreprises à réduire les risques et faciliter la prise de décision, ou créer la différence grâce à l'analyse prédictive et une « expérience client » plus personnalisée et contextualisée. Dimensions des big data[modifier | modifier le code] Le Big Data s'accompagne du développement d'applications à visée analytique, qui traitent les données pour en tirer du sens[15]. Volume[modifier | modifier le code] Variété[modifier | modifier le code]

Vivre avec, dans et autour de l’'information La lecture de la semaine il s’agit d’un texte de danah boyd signalé par un auditeur fidèle de l’émission Régis Barondeau que je remercie à cette occasion. Je parle souvent de danah boyd ethnographe américaine spécialisée dans l’étude des réseaux sociaux et particulièrement dans l’usage qu’en font les jeunes Américains. Dans ce texte, qui date de 2009, danah boyd étend son champ d’intérêt. Son objet est ici d’interroger une notion qu’elle appelle le flow qu’on pourrait traduire par le « flux »», et les conséquences de cette injonction à être dans le flux. danah boyd commence par noter qu’être dans « le flux » est l’attitude qui convient, l’attitude qui est en adéquation avec un paysage de l’information qui est dessiné par les réseaux. Image : danah boyd sur scène à la Web 2.0 Expo à New York en novembre 2009, photographiée par James Duncan Davidson. danah boyd commence par examiner la manière dont le paysage de l’information s’est transformé ces dernières années. Le bilan est sombre.

The World According to LINQ Erik Meijer editor's note: This article uses many mathematical symbols that may not render propery in your browser. If the symbols do not display, you may wish to read the article in PDF format Programmers building Web- and cloud-based applications wire together data from many different sources such as sensors, social networks, user interfaces, spreadsheets, and stock tickers. Mathematicians long ago observed similarities between seemingly different mathematical structures and formalized this insight via category theory, specifically the notion of monads9 as a generalization of collections. LINQ was introduced in C# 3.0 and Visual Basic 9 as a set of APIs and accompanying language extensions that bridge the gap between the world of programming languages and the world of databases. Take, for example, Apache's Hadoop5 ecosystem. Standard Query Operators and LINQ The standard File.ReadAllText method provides the content of the file as a single giant string. Datacentric Interpretation

Ce qu’implique de vivre dans un monde de flux A la Web 2.0 Expo qui se tenait mi-novembre à New York, la sociologue danah boyd a, comme à son habitude, fait une brillante présentation sur les conséquences qu’il y a à vivre dans un monde de flux, notamment en commençant à en dresser la liste des limites. Explorons dans ses pas – partiellement, mais fidèlement -, son « Streams of Content, Limited Attention : The Flow of Information through Social Media » (Flux de contenus, attention limitée : le flot d’information dans les médias sociaux). Image : danah boyd sur scène à la Web 2.0 Expo à New York en novembre 2009, photographiée par James Duncan Davidson. Vivre dans des flux Nous vivons dans des flux, comme l’expliquait Nova Spivack, c’est-à-dire dans un monde où l’information est partout. « Cette métaphore est puissante », rappelle danah boyd. « L’idée suggère que vous viviez dans le courant : y ajoutant des choses, les consommant, les réorientant. » 4 fausses idées sur la révolution numérique 1. 2. 3. 4. Inattention ? Hubert Guillaud

Big Data, Speed and the Future of Computing Big data is, yes, about more data — the rising flood from corporate databases, Web browsing trails, sensors and social network communications. But it is just as much about speed. If “big data” is more than a marketing term, it has to be the raw material for making smarter decisions, faster. And that means, as the big-data industry evolves, the need for groundbreaking new approaches to computing, both in hardware and software. A simple example: the Watson question-answering computer that beat two human “Jeopardy!” The speed requirement meant I.B.M.’s Watson had to do its near-instant data digging in memory instead of finding data on hard disks. But getting answers quickly in the world of big data necessitates this new approach, called in-memory processing. Early signs of the move toward this new architecture can be seen in recent announcements of new computer appliances designed for high-speed data applications. Mr. In discussing the path over the next decade, Mr.

État des lieux de l’OpenData en France Cet état de l’art a été initialement publié en anglais sur le site de l’Open Knowledge Foundation, le 20 janvier 2010. L’OKFN est une organisation anglaise en pointe sur l’OpenData. Elle est notamment à l’origine du projet WhereDoesMyMoneyGo.org, de l’OpenDefinition pour des standards de données ouvertes et du registre de données participatif CKAN. Ce registre, en cours de traduction dans plusieurs pays européens, est repris par le gouvernement anglais pour l’architecture de son projet data.gov.uk. La France traîne des pieds… Aucun doute possible : pour ce qui est d’ouvrir ses données, la France est largement en retard par rapport à de nombreux pays. Alors que les États-Unis et le Royaume-Uni ont énormément avancé au cours des deux dernières années en dévoilant leurs projets data.gov et data.gov.uk, la France et la plupart des pays d’Europe méditerranéenne restent très conservateurs en matière de données publiques. Quelques avancées de l’État mais un accès peu ouvert

Est-ce que le déluge de données va rendre la méthode scientifique obsolète ? Nous voici entré dans l’ère des Big Data des ensembles de données tellement gigantesques qu’ils nécessitent de nouveaux outils techniques et scientifiques pour les comprendre et en tirer du sens. Un déluge de données qui pose des questions profondes sur leur collecte, leur interprétation, leur analyse… Dans ce siècle des réseaux, la science des algorithmes, censée extraire le sens de ces amas d’information doit apprendre à comprendre ce qu’elle analyse. L’enjeu des Big Data nous adresse des questions scientifiques, mais aussi politiques et éthiques. Les Big Data, c’est le dossier de la semaine d’InternetActu qui commence par un retour sur un article fondateur de 2008 qui posait les bases de la révolution à venir. « Il y a soixante ans, les ordinateurs ont rendu l’information lisible. Image : La fin de la théorie scientifique ? Les réactions compilées par les contributeurs experts de la cyberculture de The Edge sont également intéressantes. Hubert Guillaud

"Regards citoyens" révèle les secrets des administrations, actualité Tech & Net : Le Point Regards citoyens est une association qui publie des données publiques que l'administration voudrait parfois garder pour elle. À son actif, le projet NosDéputés.fr notamment, qui avait suscité la colère du président de l'Assemblée nationale car il mettait en lumière l'absentéisme de certains élus. Vendredi 26 novembre, l'association lance une "chasse aux trésors" pour recenser les données publiques disponibles et lancer de nouveaux projets. Le Point.fr s'est entretenu à Paris avec l'un des fondateurs de Regards citoyens, Tangui Morlier. Son cheval de bataille : l'OpenData. Le Point.fr : Qu'est-ce que l'OpenData ? Tangui Morlier : L'OpenData, c'est l'accessibilité des données publiques. Pourquoi cette "chasse aux trésors" des données publiques ? Nous voulons recenser les données existantes et ce qu'on a le droit de faire avec. Concrètement, comment faites-vous pour récolter les données ? C'est plus ou moins simple selon les cas. Justement, comment ça marche à l'étranger ?

CheckMyMetro : la RATP retire ses menaces mais conserve son plan de métro Fin du conflit entre la RATP et l'application CheckMyMetro. La régie autonome des transports parisiens indique ne plus s'opposer au maintien de l'application depuis que le plan de métro n'y figure plus. De son côté, l'éditeur propose de créer une carte du métro de Paris libre de droit. Contacté par la rédaction, la direction de la RATP nous confirme que le conflit semble être clos : « Nous ne nous opposons plus à cette application. Pour rappel, l'application CheckMyMetro proposait la carte du métro parisien ainsi que des horaires de transports. Par la suite, le p-dg de l'application, Benjamin Suchar avait porté le débat sur le terrain de l'ouverture des données publiques aux utilisateurs d'un service : « je souhaite provoquer le débat sur l'utilisation des données à destination du public, une discussion générale sur l'Opendata doit être menée » nous expliquait-il.

CheckMyMetro ouvre le débat sur les données publiques Depuis quelques semaines, l'application CheckMyMetro était dans le collimateur de la RATP. Non pas parce qu'elle permettait de signaler la présence de contrôleurs, de musiciens ou encore d'événements particuliers dans les couloirs du métro et les rames, mais parce qu'elle utilisait les données protégées par le droit d'auteur, notamment les cartes du métro ainsi que les horaires. Ces données sont fournies gratuitement au public par la RATP, mais ne peuvent pas être exploitées de manière commerciale sans l'accord de la Régie Autonome des Transports Parisien. Finalement, le développeur de l'application, Benjamin Suchar, et la Régie parisienne ont réussi à trouver un terrain d'entente.

Avis d’expert : OpenData : un enjeu d’intérêt national par Toussaint Roze – Tribune e-Business La réutilisation des données publiques constitue un enjeu de développement économique important pour les PME. De nombreuses entreprises sont prêtes à lancer des projets innovants et économiquement viables de réutilisation de ces données. L'OpenData (réutilisation des données publiques) est un sujet d'actualité forte en ce moment mais il existe peu d'exemples concrets de sa mise en oeuvre. L'OpenData est pourtant comparable, par l'ampleur de sa portée, à la révolution de l'avènement d'Internet. Les données publiques constituent par leur variété, leur qualité, leur exhaustivité une pépite incroyable. Dans un pays où l'on s'efforce de trouver des relais de croissance, notamment en compensant le déficit de PME (qui sont créatrices d'emplois), l'ouverture des données publiques représente un potentiel d'innovations exponentiel. oilà pourquoi, la question du gratuit/payant ne peut pas être la base sur laquelle juger les projets. Les impacts pour l'économie d'un pays sont évidents.

Une certaine idée de l’open data Le 13 juillet dernier est sorti un rapport produit par 4 élèves de l'école des Ponts ParisTech, intitulé "Pour une politique ambitieuse des données publiques". Il résume parfaitement une certaine idée de l'Open Data. L’open data est à la mode. Le conseil général de Gironde vient de lancer son site DataLocale, la Saône-et-Loire a annoncé l’ouverture d’un portail pour octobre, celui du gouvernement sortira dans quelques mois. Dans ce contexte est sorti un rapport très complet, intitulé Pour une politique ambitieuse des données publiques produit par quatre élèves de l’école des Ponts ParisTech : Romain Lacombe, François Vauglin, Pierre-Henri Bertin et Alice Vieillefosse. Il fait la synthèse des enjeux de l’open data et fournit une série de 16 recommandations pour la mise en oeuvre de la politique de l’État. Romain Lacombe, qui travaille aujourd’hui à Etalab en tant que chargé de l’innovation et du développement, explique à OWNI la genèse et le but de ce rapport. Quel en était l’objectif ?

Related: