background preloader

Web de données

Facebook Twitter

Le Knowledge Graph de Google n'est pas sémantique, il est "sémantique" | Content Spining. Cette note fait suite à un article du JDN « La recherche sémantique, le défi SEO de 2013 ? » (signé par Virgile Juhan), présentant l’opinion de « l’expert » SEO David Degrelle. Impossible de laisser un commentaire, le texte s’affiche comme définitif et interdit tout débat. Comme si nous en savions assez sur la question pour que l’opinion prétende au marbre de la vérité.

C’est parce que je n’en suis pas convaincu que le débat, aussi modeste soit-il, est poursuivi ici. Grâce au Knowledge Graph (KG) de Google, nous serions de plain-pied dans le « web sémantique ». Le but derrière KG serait de « mieux comprendre le sens des mots, leur subtilité et leur intention, pour toujours mieux répondre aux questions de l’internaute et donc à ses requêtes ».

Une question majeure qui mérite d’être traitée dans une large perspective, les réponses trop hâtives pouvant être trompeuses. L’encodage de l’alphabet A partir d’inférences et d’itérations, les machines permettent aussi d’écrire. Et pour cause. Ceci n’est pas le Web sémantique. Le Google Knowledge Graph a fait du chemin depuis sa première annonce au printemps dernier. Beaucoup de choses ont été écrites sur la portée de l’événement, qui entérinerait l’adhésion officielle de Google aux principes de base du Web sémantique, résumés par la formule choc things, not strings. Avec des chiffres qui se veulent impressionnants : des centaines de millions de choses et des milliards de faits (propriétés des choses et relations entre elles). Selon une déclaration de Larry Page le mois dernier, le Knowledge Graph n’est encore qu’à 1% de ses objectifs. Au passage le patron de Google souligne que la tâche est ardue, en particulier dans ses aspects multilingues.

Nul ne peut nier que le Knowledge Graph ajoute une vraie valeur à la recherche, avec une expérience utilisateur agréable et fluide qui permet de rebondir par exemple d’un peintre à ses oeuvres, de celles-ci aux musées où elles sont exposées etc. "La trahison des images" version Google Knowledge Graph. Qu’est-ce que le Web Sémantique ? Utiliser la plateforme Datalift pour publier un jeu de données sur le Web - Datalift Wiki. From Datalift Wiki La plateforme Datalift a été conçue pour publier des jeux de données de qualité ***** sur le Web. Le processus de publication peut être réalisé par l'utilisateur à l'aide de l'Espace de travail (workspace) en enchaînant différentes étapes selon la nature des données initiales et le but final poursuivi.

Une fois publié, l'utilisateur peut utiliser le Point d'entrée (SPARQL endpoint) pour accéder aux données produites à l'aide du langage de requête SPARQL. Le "workspace" (Espace de travail) Workspace L'Espace de travail (ou workspace) permet aux utilisateurs de créer et gérer leurs projets d'élévation de données. Le "SPARQL endpoint" (Point d'accès SPARQL) SPARQL endpoint Le Point d'entrée (ou endpoint) est une interface qui permet de requêter les données publiées dans le(s) triplestore(s). Ajouter des politiques d'accès sur les données publiées Principe Mise en œuvre Les caractéristiques principales du module de contrôle d'accès sont les suivantes: user.uid1 = uid1pwd, datalift. URI Debugger. Defining the Semantic Web in a Few Sentences. A Quora user posed this challenge to the network: “How do you explain semantic web to a nine-year old child in one sentence?” The challenge was followed by a quote from Albert Einstein: “If you can’t explain it to a six year old, you don’t understand it yourself.”

Some of the best responses so far include, “A web where computers better understand the real meaning of the words we use to communicate with them.” “Hi Timmy, the web is like one giant big book written by a lot of people. And the semantic web is another book describing how the first book should be read.” We at Semantic Web recently offered up a challenge of our own: give us your best elevator pitch answering the question, “What is the Semantic Web?” Sandro Hawke, W3C – for a general audience David Wood, Talis – for journalistic research Mark Montgomery, Kyield – for enterprise decision makers Gordon Brown, UK Prime Minister (not an official pitch) – for government and citizenry Image: Courtesy Flickr/ ricardodiaz11. Le web sémantique : un projet pour amener le web à son plein potentiel.

Le web sémantique (généralement associé au terme « web 3.0 »), est une notion que l’on rencontre de plus en plus. Que désigne cette association des mots « web » et « sémantique » qui appartiennent tous deux à des disciplines relativement éloignées que sont l’informatique et la linguistique ? Le web du futur sera-t-il « intelligent » et capable de juger de la pertinence d’une réponse en analysant la sémantique de la question correspondante ? Nous offrira-t-il la possibilité d’exploiter l’ensemble des contenus du web de façon parfaitement pertinente et précise ? Le web sémantique est un projet initié en 2001 par Tim Berners Lee1, inventeur du World Wide Web. Ce projet s’est développé sous l’égide du W3C qui est un organisme de standardisation des formats informatiques utilisés sur internet. A l’origine et depuis lors, son ambition a été de développer un ensemble de technologies visant à décrire et exploiter de manière systématique la sémantique des ressources du web.

Les ontologies T. What is the Structured Web? The structured Web is object-level data within Internet documents and databases that can be extracted, converted from available forms, represented in standard ways, shared, re-purposed, combined, viewed, analyzed and qualified without respect to originating form or provenance. Over the past few months I have increasingly been writing about and referring to the structured Web. I have done so purposefully, but, so far, with little background or explication. With the inauguration of this occasional series, I hope to bring more color and depth to this topic [1]. Literally, over the past year, I have been learning and documenting on AI3 my attempts to understand the basis, concepts and tools of the emerging semantic Web.

In that process, I have come to define my own outlines of the Web past, present and future. Within this world view, I see the structured Web as today’s current imperative and reality. Confusing Terminology Surrounding Obvious Change Academic v. Lowering Our Sights. Un petit panorama des triplestores. Concepts élémentaires Un triplestore (ou triple store) est une base de données destinée au stockage des données du web de données : les triplets. Ces derniers sont des déclarations dont la structure est invariablement de la forme de sujet-prédicat-objet, par exemple “Jean a 3 enfants”, “Jean est marié à Marie”. Dans un triplestore, le format des triplets est celui de métadonnées RDF (Resource Description Framework).

Tout comme dans une base de données relationnelle classique, on stocke l’information dans un triplestore et on la récupère à l’aide d’un langage de requête. Mais contrairement à la base de données relationnelle, le triplestore est optimisé pour travailler en entrée et en sortie (stockage et récupération) de très nombreux triplets. Performance Certains triplestores peuvent stocker des milliards de triplets. La page du W3C LargeTripleStores donne une liste de triplestores remarquables pour leur performance. Implémentation Catalogue Sources : Jena Semantic Web Framework. RDFa Lite 1.1. Status of This Document This section describes the status of this document at the time of its publication. Other documents may supersede this document. A list of current W3C publications and the latest revision of this technical report can be found in the W3C technical reports index at This is an Editorial Revision of the Recommendation published on the 7th of June, 2012.

See the separate section for the changes. W3C is expected to address errata in a future Edited Recommendation of RDFa 1.1 Lite. This document is the culmination of a series of discussions between the World Wide Web Consortium, including the RDFa Working Group, the Vocabularies Community Group, the HTML Working Group, and the sponsors of the schema.org initiative, including Google, Yahoo! This document was published by the RDFa Working Group as a Recommendation. Please see the Working Group's implementation report. This document is governed by the 14 October 2005 W3C Process Document. 1. 2. Example 1. Using RDFa to Annotate Images. RDFa in the Browser. RDFa 1.1 pour corriger les erreurs de jeunesse ? RDFa. Introduction à RDFa. Résumé Le Web actuel est conçu essentiellement pour une consommation humaine. Et même lorsque des données interprétables font leur apparition sur le Web, elles sont typiquement distribuées dans un fichier séparé, avec un format séparé et une correspondance très limitée entre les versions homme et machine.

En conséquence, les navigateurs Web ne peuvent fournir qu'une aide minimale aux humains pour l'analyse et le traitement des données web : les navigateurs voient seulement l'information de présentation. Nous introduisons RDFa, qui fournit un ensemble d'attributs XHTML pour prolonger les données visuelles par des indications intelligibles aux machines (machine-readable). Nous montrons comment exprimer des ensembles de données simples et plus complexes avec RDFa, et en particulier comment transformer le texte et les liens intelligibles aux humains (human-readable) en données intelligibles aux machines sans répéter le contenu.

Ce document n'est qu'une introduction à RDFa. 1 Introduction ... Interopérabilité. (LOV) Linked Open Vocabularies. Richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored.html. Welcome to the Bibliographic Ontology Website | The Bibliographic Ontology. Time Ontology in OWL. Abstract This document presents an ontology of temporal concepts, OWL-Time (formerly DAML-Time) [4,10], for describing the temporal content of Web pages and the temporal properties of Web services. The ontology provides a vocabulary for expressing facts about topological relations among instants and intervals, together with information about durations, and about datetime information. We also demonstrate in detail, using the Congo.com and Bravo Air examples from OWL-S [11], how this time ontology can be used to support OWL-S, including use cases for defining input parameters and (conditional) output parameters. A use case for meeting scheduling is also shown. In the appendix we also describe a time zone resource in OWL we developed for not only the US but also the entire world, including the time zone ontology, the US time zone instances, and the world time zone instances.

Status of this Document This section describes the status of this document at the time of its publication. Time Zones. SKOS Simple Knowledge Organization System - home page. SKOS is an area of work developing specifications and standards to support the use of knowledge organization systems (KOS) such as thesauri, classification schemes, subject heading lists and taxonomies within the framework of the Semantic Web ... [read more] Alignment between SKOS and new ISO 25964 thesaurus standard (2012-12-13) ISO 25964-1, published in 2011, replaced the previous thesaurus standards ISO 2788 and ISO 5964 (both now withdrawn). Members of the Working Group responsible for ISO 25964 have gone on to consider the implications for SKOS users. From Chaos, Order: SKOS Recommendation Helps Organize Knowledge (2009-08-18) Today W3C announces a new standard that builds a bridge between the world of knowledge organization systems - including thesauri, classifications, subject headings, taxonomies, and folksonomies - and the linked data community, bringing benefits to both.

Call for Review: SKOS Reference Proposed Recommendation (2009-06-15) OWL API. RDF pour les nuls. Préambule du 27 août 2007 : à la suite d'un bon billet de David sur RDF, je voulais ajouter en commentaire la référence vers ce billet que j'avais écrit le 8 septembre 2006 ; je me suis alors aperçu qu'il n'avait pas été récupéré lors de l'import de mon ancien blog. Comme j'avais un peu la flemme de rechercher dans mes archives persos, mon sauveur se nomme Internet Archive dont le crawler salutaire avait indexé cette page.

Qu'il en soit remercié. Le voici donc republié en l'état, en espérant que les commentateurs de l'époque m'excuseront le fait que je ne récupère pas leur prose ;-). Pour vous faire apprécier pleinement toute la substantifique moelle du prochain billet, je me suis dit qu'il serait peut-être utile de réexpliquer le principe général de RDF1. Je voulais rassembler toute cela en un billet, mais ça faisait un peu long, alors j'ai séparé les choses. RDF n'est pas un langage de programmation, ni même un langage à balises permettant de structurer une information. Les métadonnées sémantiques : RDF, RDFa et les microdonnées « archivEngines. Le W3C (World Wide Web Consortium) débute dès 1994 ses travaux sur le Web sémantique ou Web des données. Il s’agit d’un projet à long terme visant à répertorier les connaissances stockées dans les pages du web afin d’en permettre la restitution par des applications.

Les langages sémantiques RDF, RDFa et les microdonnées sont successivement spécifiés. Implémentés dans les logiciels des bibliothèques, des éditeurs, des centres d’archivage et des musées, mais aussi dans les gestionnaires de contenu, ils peuvent servir pour les échanges de métadonnées entre logiciels ou être reconnus par les moteurs de recherche. RDF (Resource Description Framework) Le langage pilier du web sémantique RDF est publié sous forme de recommandation en 1999.

Une assertion peut être représentée à l’aide d’un graphe dans lequel sujet et objet sont les noeuds et le prédicat est la flèche. Une représentation équivalente de RDF en XML est la suivante : RDFa (Ressource Description Framework in attributes) <? <! Like this: 4. Quelques applications et outils RDF. Map4rdf – Maps viewer of RDF resources with Geometrical Information. Recently we have seen a large increase in the amount of geospacial data that is being published using RDF and Linked Data principles . Efforts such as the W3C Geo XG , and most recently the GeoSPARQL initiative are providing the necessary vocabularies to publish this kind of information on the Web of Data. Is a mapping and faceted browsing tool for exploring and visualizing RDF datasets enhanced with geometrical Information. is an open source software. Just configure it to use your SPARQL endpoint and provide your users with a nice map-based visualization of your data. The geospatial aspects of the data can be modelled using either the data model from W3C Geo XG or the geometrical data model proposed by GeoLinkedData provides: Faceted browser interface.

Geospatial and geometrical visualization using Google Maps and Open Street Maps. Visualization of geometries (LineStrings, Polygons, etc) when using the GeoLinkedData data model. Visualization of statistical data using SCOVO. Query Filtering. ChronoSIDORE : explorons les données d’ISIDORE avec SPARQL #2 – sp.Blog, le blog de Stéphane Pouyllau. Posté le 31 août 2012 ChronoSIDORE n’est pas le nom d’une nouvelle espèce de dinosaures, c’est le nom d’une application web qui utilise les ressources d’Isidore. ChronoSIDORE est donc un petit « mashup » que j’ai programmé pendant mes congés d’été. L’idée est double, poursuivre l’exploration concrète des possibilités d’un outil comme Isidore et donner des idées à d’autres personnes, en particulier dans le monde des bibliothèques et de la documentation, pour développer d’autres mashups s’appuyant soit sur l’API d’Isidore soit sur son SPARQL endpoint.

Que propose-t-il ? ChronoSIDORE, accessible sur www.stephanepouyllau.org/labs/isidore/chronosidore, propose une autre façon de « voir » les ressources d’Isidore ; différente des vues traditionnelles en « pages de résultats » comme cela est le cas dans les bases de données bibliographiques ou catalogues. Comment fonctionne-t-il ? ChonoSIDORE réalise en fait plusieurs tâches : Quelques limites Stéphane. Timeline. Gephi, an open source graph visualization and manipulation software. Le tutoriel SPARQL. GeoSPARQL SWG. GeoLinkedData.es - map4rdf. Protocol.