background preloader

Les meilleurs cours et tutoriels sur le Web sémantique

Les meilleurs cours et tutoriels sur le Web sémantique
Ceci est un tutoriel introductif à la fois au framework de description de ressources (RDF, Resource Description Framework) du W3C et à Jena, une API Java pour RDF. Il est écrit pour le développeur peu familier à RDF et qui apprend le mieux en prototypant ou, pour d'autres raisons, désire aller rapidement à l'implémentation. Une certaine habitude à XML et à Java est requise. Implémenter trop vite, sans d'abord comprendre le modèle de données de RDF, mène à la frustration, à la déception.

Destination web sémantique Travaillant actuellement sur un projet de gestion sémantique de l’information, je me suis rendu compte que peu de personnes savent exactement de quoi il s’agit et que même les experts ne sont pas forcement d’accords sur la définition de cette discipline. Web sémantique & enrichissement sémantique Il faut d’abord bien faire la différence entre la notion de web sémantique et celle d’enrichissement sémantique de l’information. Le web sémantique est une évolution coordonnée du web (lancée entre autre par le W3C), une initiative collective dans laquelle chacun à son niveau travaille pour rendre les contenus web plus intelligibles, plus accessibles par les programmes et les machines.L’enrichissement sémantique de l’information est une méthode de travail consistant à donner du sens aux fichiers/informations afin qu’elles soient traitées plus intelligemment par les machines et les applications. L’enrichissement sémantique est une étape vers le web sémantique. L’enrichissement sémantique de l’info

Sparql : premier pas (installation de l ’outil) Petit préambule Premier billet d’une série que j’espère longue, visant à une petite autoformation personnelle de moi-même pour l’utilisation de SPARQL. Sparql, c’est le langage permettant d’interroger des bases exposant leurs données selon les préconisations du linked data. Grosso modo, je sais à quoi ressemblent des triplets (qu’ils soient sous forme de turtles, RDFa ou RDF/XML). Je suis loin d’avoir des projets précis sur l’utilisation, par exemple pour notre opac, de sources de données structurées en linked data. J’arrive à exploiter des API non pas pour des web services, mais pour des usages "perso" (càd des manipulations de données sur mon poste, le plus souvent à usage professionnel tout de même), parce que je maîtrise XSL. Pour SPARQL, il faut que ce soit pareil : commencer en utilisant ce langage pour des besoins très limités, voire complètement fictifs, afin d’avancer peu à peu. Je ne doute pas d’être à l’occasion ridicule pour ceux qui sont bien plus avancés. Tutoriel Outil

Web sémantique, Web de données : présentation On désigne généralement par le terme de Web sémantique un ensemble de technologies développé par le W3C (l'un des principaux organismes de normalisation du Web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines. Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes. Le Web sémantique Le terme de Web sémantique a été proposé par Tim Berners Lee en 2001 (« The Semantic Web », Scientific American Magazine , May 17, 2001) pour désigner une évolution du Web qui permettrait aux données disponibles (contenus, liens) d’être plus facilement utilisables et interprétables automatiquement, par des agents logiciels . Le Web de données Autres ressources majeures :

Petite histoire du Web sémantique J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...). Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie. Il s'agit d'une introduction générale en trois parties dont ce billet est la première : Si le Web sémantique commence à être médiatisé aujourd'hui, ses fondements sont plus anciens, ils remontent aux origines même du Web et ont connu plusieurs évolutions dont l'histoire permet de mieux appréhender les enjeux. Diapo de la présentation de Tim Berners-Lee à WWW94 Le premier « Layer cake »

Cours d'informatique pour littéraires Voici quelques documentations et fichiers d'exemples destinés à des personnes de culture littéraire, et sans connaissances de programmation. Ces cours sont censés aider les personnes motivées par Linux ou Unix, Perl, LaTeX (et les formats bibliographiques associés), mais rebutées par les documentations existantes. Leur fonction principale est de mettre en confiance les personnes de bonne volonté, et de leur permettre de réaliser en quelques heures des programmes Perl complets (orientés lexicométrie) et des documents LaTeX de qualité. La documentation Linux est volontairement très légère, juste suffisante pour apprivoiser ce système d'exploitation, son ancètre Unix et son dérivé Mac. Suivant les situations, ces documentations sont proposées aux formats pdf ou html, et parfois le source est aussi publié: façon de se familiariser avec LaTeX ou Perl... Les fichiers au format html ont été produits avec le logiciel tth, mais son résultat nécessite malgré tout un petit toilettage.

3. Métadonnées La qualité des données des bases de données - un phénomène très ancien (erreurs des copistes) qui ne fait que s'amplifier avec les années, les volumes aujourd'hui massifs (Big Data) ainsi que les usages, directs et plus encore indirects (réutilisation extensive des données). Histoire vécue. J'ai perdu ma carte Navigo/Velib (je suis parisienne...). En fait pas exactement 2 mn, car cela a pris 5 mn pour me retrouver dans la base de données... Premier point : Avec mon nom (unique occurrence nom+prénom sur Paris), je voyais l'agente de la RAPT hésiter. Ma date de naissance s'est probablement "perdue" à la faveur d'un changement de système informatique. Deuxième point : Une fois résolue ce qui semblait une "erreur de saisie par mon collègue", mais toujours hésitante sur l'unique fiche qui s'affichait sous ses yeux, elle finit par me demander "Est-ce bien vous, là ?" Et oui, c'est bien moi ... au début des années 1980, la photo de ma première carte Orange !

Le web sémantique pour l'amélioration du moteur de recherche Google Le Web sémantique est l'étude du sens et de la forme du langage par des métadonnées. Selon le Wall Street Journal, Google apporterait dans les semaines qui viennent un important changement de son algorithme prenant plus en compte le Web sémantique. Aujourd'hui, l'algorithme de Google tente de déterminer l'importance d'un site web en fonction des mots que le site contient et du nombre de liens pointant vers celui-ci. Pour comprendre le système du Web sémantique, prenons un exemple :En partant de l'idée qu'un internaute fasse une recherche sur "le contrôle des médias en Iran" nous recherchons la sémantique de ces mots :Média = radio, télévision, internet, ...Contrôle = maîtrise, censure,...Iran = Téhéran, La sémantique permettrait de faire ressortir la même page dans les résultats de recherche avec la requête "censure de la radio à Téhéran" Grâce au Web sémantique les résultats du moteur seront plus pertinents, plus « intelligents » et ce système pourrait affecter des millions de sites.

SharedCanvas sémantique web « Punktokomo ; En Octobre 2010, l’ABES a inauguré IdRef, avec l’ambition de promouvoir l’utilisation des autorités Sudoc au-delà du Sudoc, et même au-delà des seules applications ABES comme Calames ou STAR. Parmi les moyens techniques mis au service de cette stratégie, figurait l’exposition sur le Web des données d’autorité au moyen de pages HTML et RDF dédiées et d’une batterie d’URL pérennes associées. Depuis ce matin, ces pages sont considérablement enrichies. IdRef, lié à Sudoc. Jusqu’à maintenant, ces pages HTML et RDF reflétaient seulement le contenu des notices d’autorité UNIMARC. Ainsi, à la page suivante : vous trouverez quelques informations sur Paul Veyne, tirées de sa notice d’autorité (version UNIMARC en XML), mais aussi la liste raisonnée de tous les documents qui lui sont liés. Pour obtenir la version RDF/XML de ces données, il suffit d’ajouter l’extension .rdf à l’URL précédente : Merci

HDA-Lab : expérimenter le tagging sémantique Une expérimentation sur des données du site Histoiredesarts.culture.fr Le site histoiredesarts.culture.fr recense 5000 ressources éducatives en ligne produites par 350 institutions culturelles. Cet annuaire, mis en œuvre en septembre 2010, a pour vocation d’aider la communauté éducative (enseignants, médiateurs culturels…) à trouver des documents fiables dans le domaine de l’histoire des arts. Il s’inscrit dans le dispositif développé par le ministère de la Culture et de la Communication (MCC) pour soutenir le programme d’enseignement de l’histoire des arts de l’Education Nationale. Un workflow d’édition des notices du site est en cours d’intégration dans le système d’information du MCC (projet « HDABO »). Cet outil, qui remplacera l’actuelle base de données centralisée, permettra aux 350 contributeurs institutionnels, de créer et mettre à jour leurs notices via une interface Web dédiée. L’intérêt et les limites des tags Web 2.0 Les tags « sémantiques » Exemple :

Related: