background preloader

Destination web sémantique

Destination web sémantique
Travaillant actuellement sur un projet de gestion sémantique de l’information, je me suis rendu compte que peu de personnes savent exactement de quoi il s’agit et que même les experts ne sont pas forcement d’accords sur la définition de cette discipline. Web sémantique & enrichissement sémantique Il faut d’abord bien faire la différence entre la notion de web sémantique et celle d’enrichissement sémantique de l’information. Le web sémantique est une évolution coordonnée du web (lancée entre autre par le W3C), une initiative collective dans laquelle chacun à son niveau travaille pour rendre les contenus web plus intelligibles, plus accessibles par les programmes et les machines.L’enrichissement sémantique de l’information est une méthode de travail consistant à donner du sens aux fichiers/informations afin qu’elles soient traitées plus intelligemment par les machines et les applications. L’enrichissement sémantique est une étape vers le web sémantique. L’enrichissement sémantique de l’info

Petite histoire du Web sémantique J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...). Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie. Si le Web sémantique commence à être médiatisé aujourd'hui, ses fondements sont plus anciens, ils remontent aux origines même du Web et ont connu plusieurs évolutions dont l'histoire permet de mieux appréhender les enjeux. Le Web est né au CERN, le centre européen de recherche nucléaire, à la fin des années 1980 porté, entre autres, par Tim Berners-Lee, alors chercheur dans ce laboratoire.

Web sémantique : quelles applications aujourd'hui ? Conçues il y a quelques années pour enrichir la recherche et l'exploitation des résultats sur le web, les technologies derrière le web sémantique poursuivent leur ascension. Intégration progressive aux moteurs de recherche et réseaux sociaux, développement de moteurs de recherches dimensionnés aux besoins spécifiques des entreprises, adoption croissante par les sites d'e-commerce. Qu'il s'agisse d'optimiser l'accès aux informations pertinentes, d'améliorer le référencement d'un site, où d'optimiser le ciblage marketing, le web sémantique recoupe aujourd'hui des besoins transversaux et bénéficie de l'intérêt grandissant des principaux acteurs du web. Le point sur un marché en plein essor, et sur ses applications à l'horizon 2011. Les fondamentaux du web sémantique Les champs d'applications du web sémantique Les langages derrière le web sémantique sont actuellement utilisés dans différents domaines d'applications : La recherche/le classement bibliographique/documentaire En savoir plus

Web sémantique, marketing ou réalité ? Quel peut-être l'apport du traitement automatique des langues au Web sémantique ? Contexte : La notion de « Web sémantique » prend de plus en plus d’importance et constitue une des voies d’évolution majeure du Web. L’ambition est de structurer fortement l’information, pour qu’elle soit interprétable par des machines et pas seulement par des lecteurs humains comme aujourd’hui, ouvrant ainsi la voie à de nouvelles possibilités de traitement et de travail collaboratif. Les recommandations en cours d’élaboration par le W3C sur le Web sémantique proposent de structurer, coder, catégoriser l’information en utilisant nativement des langages XML spécifiques comme RDF ou OWL. Elles ne disent rien en revanche sur la façon de transposer dans ces formalismes l’information contenue dans les textes. Pour Lingway, éditeur de logiciels documentaires basé sur l’ingénierie linguistique, il n’y aura pas de Web sémantique sans Traitement Automatique des Langues (TAL).

Blog Le comité de programme de SemWeb.Pro a enfin rendu sa copie. La concurrence était rude, puisqu'il a fallu sélectionner 9 présentations sur les 20 reçues. L'accent a été mis sur les retours d'expérience pour démontrer que le web sémantique est déjà une réalité. Comme prévu des acteurs de l'industrie et de la recherche présenterons leurs travaux. La matinée sera consacrée aux outils et techniques et l'après-midi aux contenus et utilisations. La journée commencera par une présentation d'Ivan Herman, responsable des activitées liées au Web sémantique au W3C, qui fera le point sur les travaux en cours au W3C et les perspectives des différents groupes de travail. L'après-midi débutera par une table ronde consacrée à l'ouverture des données publiques, à laquelle participeront des représentants de la Bibliothèque nationale de France, des services de l'Etat français, du projet DataLift financé par l'ANR, etc. L'enregistrement en ligne a pris du retard mais sera ouvert d'ici le 1er décembre.

Livre Le Web sémantique - Revue I3 : Information - Interaction - Intelligence - Numéro hors série, 2004 - J. Charlet, P. Laublet, C. Reynaud - Une revue en sciences du traitement de l'information - A Journal in Sciences of Information Engineering - Librai Le développement du Web sémantique ne peut se faire qu'en s'appuyant sur un ensemble de recherches, d'origine parfois anciennes et provenant de secteurs différents. Un certain nombre de thèmes sont apparus essentiels à discuter et à analyser afin de mieux comprendre et de mieux faire comprendre les projets, les réalités et les perspectives ouvertes par le projet du Web sémantique. Ils sont au nombre de six et sont repris dans la structure du rapport : (2) langages du Web sémantique, (3) Méta-données et annotations dans le Web sémantique, (4) ontologies pour le Web sémantique, (5) Intégration de sources de données, (6) adaptation et personnalisation dans le Web sémantique et (7) Web services sémantiques. Ces thèmes doivent être vus comme des angles d'approche différents des recherches sur le Web sémantique qui en associent souvent plusieurs simultanément.

Les meilleurs cours et tutoriels sur le Web sémantique Ceci est un tutoriel introductif à la fois au framework de description de ressources (RDF, Resource Description Framework) du W3C et à Jena, une API Java pour RDF. Il est écrit pour le développeur peu familier à RDF et qui apprend le mieux en prototypant ou, pour d'autres raisons, désire aller rapidement à l'implémentation. Une certaine habitude à XML et à Java est requise. Implémenter trop vite, sans d'abord comprendre le modèle de données de RDF, mène à la frustration, à la déception. Cependant, étudier le modèle de données seul est assez difficile et mène généralement à des énigmes métaphysiques tortueuses.

Web sémantique, Web de données : présentation On désigne généralement par le terme de Web sémantique un ensemble de technologies développé par le W3C (l'un des principaux organismes de normalisation du Web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines. Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes. Le Web sémantique Le terme de Web sémantique a été proposé par Tim Berners Lee en 2001 (« The Semantic Web », Scientific American Magazine , May 17, 2001) pour désigner une évolution du Web qui permettrait aux données disponibles (contenus, liens) d’être plus facilement utilisables et interprétables automatiquement, par des agents logiciels . Le Web de données Autres ressources majeures :

Le Web Sémantique en entreprise : comment et à quels niveaux ? - Clever Link - Veille - Clever Age 2006 Bien qu’elle ait été lancée par le W3C dés 1998, l’initiative du Web sémantique [1] reste encore aujourd’hui marginale face aux problématiques courantes du Web, comme par exemple la publication de contenu. Pourtant, le WS est déjà riche de nombreux langages et outils qui peuvent trouver leur place au sein de l’entreprise, et améliorer la manière dont celle-ci traite, organise et publie ses données. Web "sémantique" ? Le terme de web sémantique, rencontré de manière assez courante dans le domaine de l’informatique du Web, recouvre des concepts encore flous pour de nombreuses personnes. Dans un entretien accordé au Courier de L’UNESCO en 2000, le créateur du Web, Tim Berners Lee, expliquait simplement : J’ai un double rêve pour le Web. Un panel d’outils variés structurent le Web sémantique La sérialisation en RDF-XML de l’assertion "Paris est située en France" pourrait s’écrire de la manière suivante : <rdf:Description about="#paris"> <schema:pays>France</schema:pays> </rdf:Description> <! <!

Powerset : recherche en langage naturel et Web sémantique Powerset : recherche en langage naturel et Web sémantique Je dédie ce billet à mon père, Bernard Le Ray, parti pour un monde meilleur il y a 35 ans aujourd'hui. Est-ce l'avenir de la recherche sur le Web ? Est-ce que ce sera une alternative de poids à Google ? Voilà plus d'un an que le lancement de l'outil était annoncé pour fin 2007, or nous y sommes. La semaine dernière, son fondateur, Barney Pell, a donné une conférence intitulée : POWERSET - Natural Language and the Semantic Web accompagnée d'une présentation fort intéressante, où il nous explique plusieurs des notions sous-jacentes à la vision ambitieuse de Powerset. - interpréter le Web- l'indexer- interpréter la requête- chercher- trouver Et pour trouver, on va puiser dans différentes sources intégrées : Exemple : sites Web, flux, blogs, archives, métadonnées, vidéos, podcasts, bases de données, etc. Donc quelle serait la différence entre Google et Powerset ? L'idée est de rendre les documents plus intelligents :

C Semantic Web Activity The Semantic Web is a web of data. There is lots of data we all use every day, and it is not part of the web. I can see my bank statements on the web, and my photographs, and I can see my appointments in a calendar. But can I see my photos in a calendar to see what I was doing when I took them? Why not? The Semantic Web is about two things. See also the activity news for an account of recent events, publications, etc. The following groups are part of the Semantic Web Activity. Active Groups Semantic Web Coordination Group The Semantic Web Coordination Group is tasked to provide a forum for managing the interrelationships and interdependencies among groups focusing on standards and technologies that relate to this goals of the Semantic Web Activity. RDFa Working Group The mission of the RDFa Working Group, formerly known as the W3C RDF Web Application Working Group, is to support the developing use of RDFa for embedding structured data in Web documents in general. RDF Working Group

Le web sémantique pour l'amélioration du moteur de recherche Google Le Web sémantique est l'étude du sens et de la forme du langage par des métadonnées. Selon le Wall Street Journal, Google apporterait dans les semaines qui viennent un important changement de son algorithme prenant plus en compte le Web sémantique. Aujourd'hui, l'algorithme de Google tente de déterminer l'importance d'un site web en fonction des mots que le site contient et du nombre de liens pointant vers celui-ci. Mais ce nouvel algorithme utilisant la sémantique serait à même de « comprendre » les requêtes demandées. Pour comprendre le système du Web sémantique, prenons un exemple :En partant de l'idée qu'un internaute fasse une recherche sur "le contrôle des médias en Iran" nous recherchons la sémantique de ces mots :Média = radio, télévision, internet, ...Contrôle = maîtrise, censure,...Iran = Téhéran, La sémantique permettrait de faire ressortir la même page dans les résultats de recherche avec la requête "censure de la radio à Téhéran"

Related:  conceptsveille