background preloader

Open_data, web de données, indexation

Facebook Twitter

Joconde - espace professionnel - vocabulaires scientifiques - télécharger les vocabulaires. Pourquoi le dogme de la gratuité des données publiques freine la diffusion de l’open data. Données publiques Publié le 11/01/2013 • Mis à jour le 14/01/2013 • Par Auteur associé • dans : Dossiers d'actualité, France, Opinions.

Pourquoi le dogme de la gratuité des données publiques freine la diffusion de l’open data

Le data journalism, langage d'information émergent. Le data journalism, langage d'information émergent [vendredi 01 juin 2012 - 17:00] Les Data Journalism Awards ont été décernés hier pour la première fois, récompensant les meilleurs projets de ce genre émergent.

Le data journalism, langage d'information émergent

"Raconter une histoire à partir de données" : voilà comment on pourrait définir de manière simple le data journalism. La révolution des données ouvertes. Les moteurs de recherche auront-ils bientôt réponse à tout? Alors que les moteurs de recherche (Google, Bing…) permettent toujours d’obtenir un certain type de réponses (des liens identifiant les sites où se trouve peut-être l’info que l’on recherche), les initiatives se sont multipliées récemment pour améliorer leur pertinence et leurs champs de réponses.

Les moteurs de recherche auront-ils bientôt réponse à tout?

Google, qui ne cesse de chercher à perfectionner son algorithme – récemment en intégrant des résultats de son réseau social Google+ -, est en train de lancer Knowledge Graph. Via ce système, en plus de donner des liens renvoyant vers des sites, Google donnera instantanément des informations puisées dans diverses bases de données (dont celles de Wikipedia et du CIA World Factbook). Par exemple, pour une requête sur une personnalité, il fournira ses dates de naissance et de décès, ses domaines d’activité, le nom de ses parents, une liste de ses réalisations, des photos. La Tribune des Archives. Open Data : 20 questions qui se posent au gouvernement français « Suite aux élections législatives du 17 juin 2012, le gouvernement possède désormais la majorité parlementaire nécessaire à la mise en œuvre de sa politique, notamment en matière d’ouverture des données publiques.

Open Data : 20 questions qui se posent au gouvernement français «

Plusieurs éléments semblent propices au développement d’une politique nationale ambitieuse sur le sujet : Nous avons donc, pour la première fois au pouvoir, des responsables qui non seulement connaissent la définition de l’open data – ce n’était pas gagné – mais qui en plus ont développé des démarches d’ouverture dans leurs précédentes fonctions, apparemment convaincus de l’intérêt social et économique du sujet. Or malgré ces expériences et notes d’intention, aucune stratégie gouvernementale n’a encore été dévoilée. Web sémantique. La majorité du Web est destiné à être lu.

Web sémantique

Il n'est pas fait pour être manipulé de façon intelligente par des programmes informatiques, en général incapables de caractériser les informations qu’ils parcourent.Le Web sémantique vise à faciliter l'exploitation des données structurées, pour donner du sens au contenu des pages Web, en permettant leur interprétation par des machines. Il ne s’agit pas d’un web à part, mais plutôt d’une extension ou d’une amélioration du Web courant où chaque donnée acquiert un sens défini, afin de créer un réseau d'informations structurées, disponibles en ligne et facilement réutilisables. Accueil. L’accueil est un des mots polysémiques dont les bibliothécaires raffolent (comme service public, par exemple).

Accueil

Il désigne tantôt l’activité d’accueil (médiation, interaction) accomplie dans les bibliothèques, tantôt les services proposés à des publics spécifiques (et en fonction de leur spécificité), tantôt les opérations et outils de fidélisation ou d’extension des publics (communication, horaires, tarification…). Partager ne veut pas dire ouvrir. Suite à plusieurs rencontres, faites aussi bien au sein du collectif ou d’autres engagements personnels ou professionnels, je rencontre, lis ou entend régulièrement des personnes intéressées par le partage de données ou de contenus en ligne, en particulier dans le milieu muséal ou patrimonial.

Partager ne veut pas dire ouvrir

Certains sont encore sceptiques quant aux avantages, craignant, qui pour son image, qui pour ses euros : pour une fois, ce billet ne les concerne (presque) pas. D’autres ont franchi le pas et se sont décidés à ouvrir leurs données, à les émanciper, à les rendre « libres ». Chouette ! « On a tout mis sous licence Creative Commons »

Les mauvaises données des marchés. Le portail français d'ouverture des données publiques, data.gouv.fr publie sur son site des données truffées d'erreurs, donc inutilisables.

Les mauvaises données des marchés

Le problème, identifié il y a plusieurs semaines, n'a toujours pas été traité. Nous avons demandé à Etalab, la mission chargée de la coordination du site, de s'expliquer. Depuis peu, le site data.gouv.fr met en avant sur sa page d’accueil trois sets de données particulièrement attractifs : la liste des attributaires des marchés publics d’État pour les années 2008, 2009 et 2010. Or ces données contiennent de nombreuses erreurs (montants invalides, cases vides, informations incomplètes, etc.), rendant tout le fichier inutilisable. Une petite boulette qui récuse même la notion de “donnée ouverte” pourtant au cœur même du mouvement Open Data dont se revendique data.gouv.fr.

Open data : un moteur de l'économie numérique. Banaliser l’Opendata. A dénombrer le nombre de colloques et de communiqués sur le sujet, force est de constater que le mouvement de l’open data est bien enclenché en France, comme en témoigne du reste la carte de France de l’open data remise à jour par Libertic.

Banaliser l’Opendata

Si plus de 900 jeux de données sont désormais en libre accès, les retombées économiques promises par les experts semblent cependant encore loin. L’avenir du livre… est dans les données. Une définition simple du web sémantique. Pour paraître savant, il m’arrive de temps à autre de présenter BaseClip très vaguement : « on fait du web sémantique »… Je me doute bien que dans 99,99% des cas mon interlocuteur ne sait pas ce qui se cache derrière cette phrase, quand bien même il aurait déjà vu ou entendu l’expression.

Une définition simple du web sémantique

Logo BaseClip Mais alors le web sémantique, qu’est-ce que c’est ? Pour comprendre il faut commencer par s’intéresser à deux concepts de linguistique qui sont mis en opposition : la syntaxe et la sémantique. En somme la syntaxe porte sur la forme des phrases, c’est à dire les caractères et les mots employés, tandis que la sémantique concerne le fond, le sens. La BnF et le Centre Pompidou cultivent le web sémantique. Le 03/05/2012, par Quentin Renard, Terminaux et Systèmes, 468 mots Dans le but de faciliter l'accès à leurs différents catalogues, la Bibliothèque Nationale de France et le Centre Pompidou adoptent le web sémantique dans la conception de leurs sites internet. Les responsables de ces projets s'expriment à l'occasion des conférences SemWeb.Pro du 02 mai 2012, à Paris.

Romain Weinz, expert métadonnées de la Bibliothèque National de France (BnF) et Emmanuelle Bermès, Chef du service multimédia du Centre Pompidou, travaillent autour d'un enjeu commun : ouvrir un catalogue provenant de divers silos de données à l'internaute. A l'occasion des conférences SemWeb.Pro du 02 mai 2012, à Paris, chacun a développé sa façon de penser. Huis clos. Le Département de Saône-et-Loire libère ses données. Retour sur le Web de données. J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...).

Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie. Il s'agit d'une introduction générale en trois parties dont ce billet est la troisième et dernière : Le web des données. Frustration 1 : les liens ne sont pas typés Les pages Wikipedia de Jean-Paul Sartre et Paris sont liées par un lien hypertexte. Les atouts de la connaissance libre. Wikimédia France signe un partenariat avec la BnF.

Communiqué de presse 7 / 04/ 2010 Format PDF. Présentation de Wikimedia France. Wikimédia France — Association pour le libre partage de la connaissance est une association à but non lucratif de droit français (loi 1901), dont le but est de soutenir en France la diffusion libre de la connaissance et notamment les projets hébergés par la Wikimedia Foundation comme l'encyclopédie Wikipédia, la médiathèque Wikimedia Commons, le dictionnaire Wiktionnaire et plusieurs autres projets liés à la connaissance.

Créée le 23 octobre 2004, elle regroupe des utilisateurs et des participants des projets Wikimedia. Elle est reconnue comme une association locale par la Wikimedia Foundation. Présentation de SemanticPedia à SemWebPro 2012. Lod-datasets_2010-09-22_colored.png (1481×964) Jean-Michel Salaün - Une approche documentaire du Web. Données publiques / Open Data. Valorisation des données publiques culturelles, moteur d’une économie numérique.

L’accès, l’organisation, de l’espace public numérique est l’objet d’une concurrence accrue entre les acteurs du secteur et questionne les modèles économiques établis jusqu’alors. L’un des enjeux apparaît ainsi être pour ces acteurs le développement de services innovants et attrayants permettant une mise à disposition au public de contenus dans un environnement Internet interopérable et sans frontière. Cette problématique trouve un écho particulier à l’heure où la réflexion s’intensifie autour des sujets liés à la diffusion et la valorisation des contenus culturels et plus encore des données publiques culturelles, sur Internet et les réseaux. Le secrétariat général du ministère de la Culture et de la Communication s’est pleinement investi de cette réflexion déterminante. De la description des documents à l’exploitation des données : le projet data.bnf.fr.

HDA-Lab : expérimenter le tagging sémantique. Une expérimentation sur des données du site Histoiredesarts.culture.fr Le site histoiredesarts.culture.fr recense 5000 ressources éducatives en ligne produites par 350 institutions culturelles. Cet annuaire, mis en œuvre en septembre 2010, a pour vocation d’aider la communauté éducative (enseignants, médiateurs culturels…) à trouver des documents fiables dans le domaine de l’histoire des arts. Il s’inscrit dans le dispositif développé par le ministère de la Culture et de la Communication (MCC) pour soutenir le programme d’enseignement de l’histoire des arts de l’Education Nationale.

Www.archivesdefrance.culture.gouv.fr/static/4698. Journée d'étude sur l'Ouverture et réutilisation des données culturelles. Journée d’étude du 19 avril. Archives « Archives masala. Conference.ifla.org/past/ifla77/149-bermes-fr.pdf. Www.archivesdefrance.culture.gouv.fr/static/4997. Le Web de données - Une playlist. Dailymotion Sign in. HdA Lab > Accueil. Etalab, mission chargée de l'ouverture des données publiques et du développement de la plateforme française Open Data. Web sémantique, Web de données : présentation.

Gallica, la Bibliothèque numérique de la BnF. Mrim.imag.fr/publications/2005/KEF05/kefi_inforsid2005.pdf. Carnet de recherche visuel, par Patrick Peccatte. Site web des Archives départementales du Cantal - actualités - nouveautés - Nouveautés - Nouveautés. Adbs 5 à 7 : une nouvelle norme pour le thesaurus.