background preloader

DBpedia

DBpedia
Un article de Wikipédia, l'encyclopédie libre. DBpedia est un projet universitaire et communautaire d'exploration et extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et sous forme de données normalisées au format du web sémantique des contenus encyclopédiques de chaque fiche encyclopédique. DBpedia vise aussi à relier à Wikipédia (et inversement) des ensembles d'autres données ouvertes provenant du Web des données : DBpedia a été conçu par ses auteurs comme l'un des « noyaux du Web émergent de l'Open data »[2] (connu également sous le nom de Web des données) et l'un de ses possibles points d'entrée. Ce projet est conduit par l'université de Leipzig, l'université libre de Berlin et l'entreprise OpenLink Software. Historique[modifier | modifier le code] Le projet a été lancé par l'université libre de Berlin et l'université de Leipzig, en collaboration avec OpenLink Software. Contenus[modifier | modifier le code]

MusicBrainz - The Open Music Encyclopedia Linked Data | Linked Data - Connect Distributed Data across the Voyage de DBpedia en Wikidata à bord d’un bot | Do-zo L’idée est de récupérer les informations des fichiers image des œuvres d’art de DBpedia et de les publier automatiquement dans Wikidata, le principe pouvant être appliqué à bien d’autres données. Short | Les sources (fichier zip, 6 ko) Ce billet n’a pas l’ambition d’être un tutoriel mais plutôt une relation de codage en cours sans autre prétention que celle d’être déjà arrivé à faire quelque chose. Comme il n’a pas été aisé d’y parvenir, il est possible que malgré leurs défauts, voire même leurs erreurs, ces quelques notes puissent être utiles. C’est l’occasion aussi de voir à nouveau que non seulement le web sémantique existe déjà, qu’il fonctionne même et que, cerise sur gâteau, il peut être très utile. Les grandes étapes : I. Techno : SparQL DBpedia, qu’est-ce que c’est ? TL;DR, on va dire que DBpedia est une version base de données libre de certaines informations de Wikipédia avec une structure intelligible et partagée. Exemple de requête SparQL Ce qui peut se traduire ainsi en SparQL :

À propos de data.bnf.fr (data.bnf.fr) Current Version This site, which has been available online since July 2011, is continuously being developed and undergoes regular updates. The version currently displayed is Version [1.3] of data.bnf.fr, posted online on 2014/03/25. How to retrieve data from data.bnf.fr: download the data.bnf.fr dump file as of 2014/03/25. Summary: A presentation of the project Roadmap Content and selection policy HTML pagesA new data modelOur data in RDFExternal linksHow does it work? To contact the team:data@bnf.fr A presentation of the project The data.bnf.fr project endeavours to make the data produced by Bibliothèque nationale de France (French National Library) more useful on the Web. With data.bnf.fr, you can: reach BnF resources directly from a Web page, without any previous knowledge of the services provided by the library;get oriented in the BnF resources and possibly find external resources. The objective is to put forward the BnF's collections and to provide a hub between different resources. Roadmap

Contrer les idées reçues sur le Web sémantique | Les petites cas La médiatisation d'un nouveau concept, d'une nouvelle notion, d'une nouvelle technologie et de nouvelles perspectives s'accompagne immanquablement d'analyses plus ou moins farfelues, d'incompréhensions et d'interprétations erronnées (parfois volontairment pour profiter du buzz). Le Web sémantique n'échappe à cette tendance. A l'instar de James Hendler qui a publié sa FAQ non officielle sur le Web sémantique, je vous propose de mon côté de revenir sur quelques idées reçues sur le Web sémantique. « Le Web sémantique consiste à faire des documents XML valides par rapport à un schéma XML » Cette idée reçue, qui provient de la confusion entre RDF et XML, est alimentée par un abus de langage utilisé régulièrement par les promoteurs d'une stricte application des standards (X)HTML?/CSS?, à savoir le recours au terme « sémantisation » pour désigner une utilisation correcte des éléments (X)HTML pour encoder les différentes portions d'information d'une page Web.

l'Informathèque - Influences entre artistes : le cas DBpedia L'article précédent interrogeait la question des relations entre auteurs d'un point de vue conceptuel et pour tout dire un peu théorique. Il est temps de voir en pratique les sources qui peuvent être interrogées pour accéder à des relations d'influence ou de collaboration entre créateurs. Observations A terme, il sera possible de faire les requêtes qui suivent sur le chapitre français. Aujourd'hui les seules relations qui existent concernent la philosophie. allons donc exploiter le chapitre US qui est plus complet. Comme dans notre premier article sur DBpedia, nous allons d'abord observer une fiche wikipedia. Pourquoi autant de propriétés pour désigner les mêmes choses? Parce que les propriétés commençant par dbpedia:owl sont normalisés grâce à un mapping propre à chaque classe (ici writer) dans le cadre d'une ontologie structurant les données de dbpedia. Et l'intérêt des classes? Les propriétés influenced et influencedBy sont ainsi définies dans la classe Artist. Les requêtes? Pourquoi ? ?

Objectifs et élaboration de RDA Ressources : Description et Accès (RDA) est le code de catalogage qui remplace les Règles de catalogage anglo-américaines, 2e éd. (AACR2). Il a été publié en juin 2010, sous la forme d'un site web : RDA Toolkit. RDA se présente comme « une nouvelle norme pour la description des ressources et les accès, conçue pour le monde numérique » <>. Il affiche clairement son objectif : prendre en compte le nouvel environnement numérique des catalogues, qu’il s’agisse des ressources décrites, des catalogues eux-mêmes, informatisés et accessibles sur le web, ou des outils mis à la disposition des catalogueurs pour documenter leur travail. Surtout, RDA constitue une initiative essentielle pour rénover les règles de catalogage pour : faire évoluer la structure des catalogues afin de les adapter au contexte actuel de la recherche d’information ; permettre aux catalogues de rendre les services attendus désormais par les usagers. Comment est élaboré RDA ? RDA et l'IFLA

Les petites cases | Fourre-tout personnel virtuel de Got l'Informathèque - Enrichir son catalogue avec dbPedia ? Décembre 2012, Google propose le knowledge graph à ses utilisateurs français. Octobre 2012, l'Inria, le Ministère de la Culture et Wikimédia officialisent l'existence du dbpdia français sous le nom de code sémanticpédia. Ca bouge ! Et nos catalogues ? Comment les enrichir automatiquement avec dbpedia ? Pour répondre à cette question ouverte par Lully sur son blog, j'ai tenté quelques observations et expériences avec le langage d’interrogation SPARQL. Certaines des requêtes que vous aurez l'occasion de rencontrer peuvent sembler inutilies, des pages wikipédia existent pour décrire les mêmes résultats. L’idée de départ est de récupérer la biographie des auteurs, musiciens et réalisateurs, ainsi que les prix et distinctions dont ils sont lauréats. Exploration du graphe d’un auteur. Observons la ressource Milan Kundera. Analyse quantitative des prix représentés Soient 166 prix dont 31 prix avec plus de 10 lauréats et 55 avec 1 seul lauréat. Cette solution était la plus attirante. En conclusion .

l'Informathèque - Enrichir son catalogue avec dbPedia... Comment ? Enrichir son catalogue avec dbPedia... Comment ? Nous avons vu dans l'article précédent qu'il était possible d'exploiter les données de dbpédia pour enrichir les pages de nos catalogues. Très bien, maintenant, nous allons voir quelques astuces de développement pour ça. Les prérequis sont de connaître un peu : le javascript et jquery un langage serveur Je plaisante Les web services Pour faire communiquer des applications serveurs entre elles, les fameux services web sont communément utilisés. Communiquer avec dbpedia Dbpedia est un webservice. Dans le cas d'une application client-serveur, pas de problèmes. Nous allons en effet utiliser l'architecture AJAX qui est depuis quelques années l'un des piliers sur lequel s'appuient la plupart des sites que vous utilisez tous les jours. Un autre problème à régler : La notion de sécurité cross domain (Entre domaines). La solution : JSONP ( JSON with padding, c’est-à-dire préformaté). Plugin Vous pouvez accéder au code du plugin sur github. Voir aussi :

Related: