background preloader

OpenData : Apprendre à réutiliser des données

OpenData : Apprendre à réutiliser des données
Bien que l’on parle de la possibilité de réutilisation des données ouvertes (open data), cela demeure nébuleux pour la plupart des citoyens qui ne maîtrisent pas le développement informatique. L’Ecole des données (School of Data), initiative de l’Open Knowledge Foundation vise à donner plus de pouvoir à la société civile en fournissant en ligne des éléments pédagogiques pour apprendre à réutiliser les données. Cette éducation critique au numérique par le faire s’avère essentielle au sein des EPN. 14 leçons traduites pour apprendre à réutiliser les données Dans sa version en anglais, School of Data publie un ensemble de leçons conçues sans pré-requis ainsi que des « expéditions » de données pour réutiliser les données disponibles sur un thème déterminé et ainsi contribuer à former les acteurs de la société civile au maniement de celles-ci. Le projet francophone de l’Ecole des données souhaite : 14 cours de l’école des données ont été traduits dès 2013 et sont disponibles sur GitHub. Related:  Données

Work With Data rend les données publiques exploitables et accessibles Dernière mise à jour le 7 janvier 2023 Comment rendre les données publiques accessibles à tous les citoyens ? Comment les utiliser ? On en parle beaucoup depuis quelque temps déjà. Work With Data est une plateforme créée par deux jeunes français qui change quelque peu la donne. Une source inépuisable de données publiques accessibles à tous La plateforme Work With Data est le type de site dans lequel on peut vite oublier l’heure en sautant d’une ressource à l’autre tant il est riche. Work With Data, pour réussir ce travail, collecte des données à partir de sources fiables et les structure dans un modèle unique. Des données publiques fiables structurées et mises en relation de manière intelligente Work With Data se concentre uniquement sur les données publiques dans le but de les rendre accessibles à tous. Toutes ces sources sont complexes dans leur état brut. Une encyclopédie des données publiques accessible à tous L’utilisation de Work With Data est gratuite les 30 premiers jours.

Le text-mining comme service aux chercheurs – Carnet'IST Lorsque les doctorants débutent leur thèse, ils sont souvent confrontés à un volume important de documents qu’ils collectent au cours de leurs recherches bibliographiques ou dont ils héritent de leurs pairs qui leur confient leur « bibliothèque ». Cela peut représenter des centaines de documents. C’est avec cette problématique qu’une doctorante nous a sollicitée : elle devait « lire » plus de 650 documents. Il s’agissait des rapports d’activités d’un groupement de recherche, associés à de nombreux rapports intermédiaires, notes techniques et versions préliminaires d’articles. Nous partageons dans ce billet la solution que nous avons mise en œuvre pour elle pour la faire avancer plus vite dans ses recherches. L’exploration de corpus de publications scientifiques est passionnante et prometteuse. Repérer les documents les plus pertinents d’un corpus Revenons-en à notre corpus de documents, somme toute modeste, au vu des projets envisageables dans ce domaine. Le principe est simple donc :

Open data : La DILA ouvre 4 nouveaux jeux de données Ouverture des données de jurisprudence Dans la continuité de sa politique d’ouverture des données publiques annoncée en 2014, suite au comité interministériel pour la modernisation de l’action publique (CIMAP) du 13 décembre 2013, supprimant plusieurs redevances dont celles applicables à certaines données juridiques diffusées sur www.legifrance.gouv.fr, la DILA ouvre les bases de données de jurisprudence qu’elle diffuse sur Légifrance pour le compte du Conseil d’Etat et de la Cour de Cassation. Les données de jurisprudence mises à disposition sont des données publiques comprenant des données personnelles non nominatives. Pour définir le cadre juridique de cette catégorie de données , la DILA, Etalab, la CNIL et la CADA ont mis en place un groupe de travail en juin 2014 après la première vague d’ouverture des données juridiques disponibles sur Legifrance. Les travaux de ce groupe ont abouti à la formalisation d’un "CAVEAT" . La DILA a désormais 80 jeux de données sous licence ouverte.

Données publiques : un peu de réalisme, SVP Le denier classement de l’open Knowledge fondation (OKF) fait reculer la France de la 3ème à la 10ème place dans l’ouverture de ses données en open data (1). De nombreuses raisons sont invoquées, mais il semble surtout qu’après une première vague 2011-2014 qui a vu l’Etat diffuser gratuitement des données issues majoritairement de bases de données pré-existantes, ce qui est, somme toute assez facile, ce dernier peine à passer à la seconde phase. La raison principale nous paraît être, au-delà des enjeux démocratiques ou budgétaires, qu’on « n’a pas assez mesuré l’impact de la création de l’économie et du service public de la donnée » (2). Encore faut-il combattre quelques poncifs et clarifier de nombreux points pour s’assurer que la France va exploiter au mieux cette nouvelle loi et pouvoir répondre au défi de l’ouverture des données par défaut qui se profile au Parlement. 1 – Distinguer les types de données Les autres types de données que nous dénommerons ici les « données actuelles ».

Prospectibles Droit de l'information Archives Les plateformes occupent une place de plus en plus prépondérante dans l’activité numérique actuelle. Que ce soit sur des applications mobiles ou à propos de nouveaux services publics ou associatifs, on retrouve cette même notion à la définition un peu floue. Définition et réglementation Sur Wikipédia, on est un peu déçu : entre plateforme pétrolière et géologique, la plateforme en informatique est décrite comme « une base de travail à partir de laquelle on peut écrire, lire, utiliser, développer un ensemble de logiciels ». Dans l’avant-projet de la loi Lemaire, cité dans l’article de Marc Rees dans NextInpact : la régulation proposée vise des activités « consistant à classer ou référencer des contenus, biens ou services proposés ou mis en ligne par des tiers, ou de mettre en relation, par voie électronique, plusieurs parties en vue de la vente d’un bien, de la fourniture d’un service, y compris à titre non rémunéré, ou de l’échange ou du partage d’un bien ou d’un service ». Références

L’open data Le Web actuel est configuré comme une série de données ou ‘documents’. Alors que les documents puisent dans des sources riches en données, celles-ci sont masquées par une page destinée à être vue par des humains. Lors de ce module, nous verrons ce qui se passerait si l’on supprimait toutes les pages et les documents du Web. Imaginez que vous n’avez que les données brutes, toutes ouvertes, toutes utilisables et toutes liées par un réseau ou ‘Web’ de données. Ce module traite aussi du Web des données ouvertes et liées (‘ The Web of Linked Open Data’) et explique comment les 5 étoiles du ‘Linked Open Data’ (les données ouvertes et liées) donnent des consignes pour arriver à faire de cette vision une réalité. Dans ce module, nous allons explorer les points suivants : Qu’est-ce que le Web des données ? Cliquez ici pour en savoir plus

Réutilisation des données publiques : des promesses vertigineuses Dossiers d'actualitéMis à jour le 14/04/2017 Copyright : Flickr CC by sa Perspecsys Photos L'open data, ou, dit en français, l'ouverture des données publiques est devenue une obligation pour toutes les collectivités locales de plus de 3500 habitants depuis l'adoption de la loi pour une République Numérique (loi du 7 octobre 2016). La "loi Lemaire" achève un chapitre législatif intense autour de l'open data (loi Valtere, loi Macron...). Les plus grosses collectivités se sont déjà lancées ; les autres vont devoir le faire. Elles devront résoudre les questions relatives aux licences, aux formats, aux processus internes, à l'animation d'un écosystème de start up et d'innovateurs...

Manipulation et gestion de données — Bibliothèques Universitaires Besoin de rédiger un plan de gestion de données, de publier une bibliographie interactive, de constituer un corpus documentaire, d’enrichir ou de nettoyer un jeu de données ? Les BU accompagnent la manipulation et la gestion des données utilisées et produites dans le cadre d’activités de recherche. Un service évolutif Voir la plaquette présentant les services à la recherche Ce service sera déployé progressivement à partir de janvier 2016. Il s’adresse à tous les enseignants-chercheurs, chercheurs, doctorants, techniciens ou ingénieurs travaillant dans un laboratoire de l’université, quelle que soit la nature de leur projet (collectif ou individuel).Nous proposons une aide pour : Identifier et utiliser de données produites par des tiers,Manipuler et traiter des données,Gérer et mettre en valeur les données produites. La réalisation de traitement de données et de métadonnées est proposée à titre expérimental. Exemples d’actions possibles Nous pouvons notamment vous accompagner pour : Limites

13 cours gratuits pour tout savoir de l'open data Le Portail européen des données propose un programme de cours en ligne totalement gratuit pour devenir incollable sur l'ouverture des données publiques. Encore méconnu dans le grand public, l'open data peut désormais s'apprendre en ligne. Et gratuitement. Le Portail européen des données propose une série de treize cours en ligne consacrés à l'ouverture des données publiques. Au programme : qu'est-ce que l'open data, quel type de licence choisir, quels sont les formats informatiques les plus appropriés, comment nettoyer les données, avec quelle plateforme travailler... Une définition de l'open data A la question de savoir ce qu'est l'open data, le Portail européen des données apporte cette définition : "il s’agit de données auxquelles tout le monde peut accéder et que tout le monde peut utiliser et partager. Côté logiciels, le Portail propose un lien vers la plateforme enigma.io qui permet d'indexer et de présenter les données ouvertes.

Tout savoir sur l'Open Data - OpenDataSoft Plus qu’une tendance et véritable enjeu pour les institutions, la donnée ouverte est considérée comme un vecteur de transparence, de lien social ou encore d’évaluation. Vous souhaitez connaître ce phénomène ? Cet article vous propose justement de tout savoir sur l’Open Data (ou données ouvertes) en France et à travers le monde. L’Open Data : une histoire, un mouvement Tout savoir sur l’Open Data : commençons par une définition Les données ouvertes ou Open Data sont des informations accessibles librement et gratuitement, sous la forme de fichiers respectant des formats interopérables. Ces données ouvertes peuvent être d’origine publique : émanant des services publics, de collectivités, de communes. La notion d’Open Data n’est d’ailleurs pas le fruit du hasard. Open Data et citoyenneté, vers la naissance d’un mouvement L’Open Data, c’est, avant tout, une philosophie, une volonté citoyenne, celle de considérer l’information publique comme un bien commun. Les principes et critères de l’Open Data

AnalogIST - Analyse des Logs de l'IST avec ezPAARSE [AnalogIST] Statistiques d'utilisation - AnalogIST/ezPAARSE Le projet ezPAARSE, porté entre 2012 et 2015 par une collaboration avec l'INIST-CNRS et l'Université de Lorraine, est désormais terminé. Nous avons entamé le projet ezMESURE au début de l'année 2016, qui prend la suite d'ezPAARSE en mettant à contribution les instances qui sont déjà déployées dans les établissements pour proposer un entrepôt national et des interface de visualisation des données collectées. Ligne de vie complète du projet (2012-2015) (document PDF)Rapport général ezPAARSE 2012­2015, annexe du rapport d'activités Couperin pour 2015 (document PDF)Sensibilisation à la mise en place d'une politique d'archivage des fichiers de logs du proxy d'un établissement (documents PDF, page 1 et page 2)Présentation succinte de MESURE et d'AnalogIST/ezPAARSE (document PDF) Tweets de @ezpaarse Décembre 2015 : Livraison de la version stable 2.7.0Comité technique pour la fin de la phase 3cloture officielle du projet ezPAARSE et réflexions sur le projet qui lui succède : ezMESURE Octobre 2015 :

» A Librarian’s Guide to OpenRefine ACRL TechConnect Blog Academic librarians working in technical roles may rarely see stacks of books, but they doubtless see messy digital data on a daily basis. OpenRefine is an extremely useful tool for dealing with this data without sophisticated scripting skills and with a very low learning curve. Once you learn a few tricks with it, you may never need to force a student worker to copy and paste items onto Excel spreadsheets. As this comparison by the creator of OpenRefine shows, the best use for the tool is to explore and transform data, and it allows you to make edits to many cells and rows at once while still seeing your data. Here’s an example of a project that I did in a spreadsheet and took hours, but then I redid in Google Refine and took a lot less time. In OpenRefine this is a much simpler task, since you can use it to find everything that probably is the same thing despite the slight differences in spelling, punctuation and spelling. Installation and Basics Some ideas for librarians (A) Typos

Related: