background preloader

Web semantique

Facebook Twitter

Demain, l’intelligence des données. Par Hubert Guillaud le 07/09/07 | 19 commentaires | 10,284 lectures | Impression Quand on regarde l’avenir, on a souvent tendance à penser que le changement le plus radical reposera sur l’internet des objets, une intelligence qui va bouleverser notre relation avec eux et leurs relations entre eux. Bien sûr, parce qu’on va les tenir dans nos mains, parce qu’ils vont bouger sous nos yeux, ces changements-là seront spectaculaires. Pourtant, demain, il n’y a pas que les objets qui seront intelligents : il y aura aussi les données. Et l’impact de ce changement pourrait bien être tout aussi radical. Voilà longtemps que Tim Berners-Lee nous explique que le web sémantique est l’avenir du web (voir la traduction de l’article originale dans la lettre de l’URfist de Toulouse de novembre 2001 .pdf). L’intelligence des données (au sens, plutôt, que l’on donne à “intelligence économique”), c’est d’abord leur abondance et leur accessibilité, même si chaque donnée demeure elle-même tout à fait brute.

Le document numérique à l'heure du web de données. Séminaire INRIA, 1er au 5 octobre 2012. Ne serions-nous pas en train d'assister à l'éclosion du web sémantique ? Le paysage informationnel poursuit en effet une mutation qui nous conduit à interroger à nouveau la nature même du document : où commence-t-il, où finit-il ? Et d'ailleurs finit-il vraiment ? Quelles en sont les frontières constitutives ? Pour cela, il nous faut comprendre l'environnement dans lequel il évolue désormais : le web de données.

À l'occasion du séminaire IST proposé par l'Inria en 2012, des contributions de spécialistes de disciplines diverses sont ici réunies pour nous aider à clarifier différentes notions qui se croisent et se confondent parfois (web sémantique, web de données, linked data...) et nous permettre d'appréhender ce qui forge et structure aujourd'hui un « document », dans ses aspects tant techniques que sémantiques, sans oublier les dimensions sociétales et juridiques. Ainsi posé, le document apparaît bien comme une pièce de ce gigantesque ensemble de données. Web sémantique. C Semantic Web Activity. The Semantic Web is a web of data.

There is lots of data we all use every day, and it is not part of the web. I can see my bank statements on the web, and my photographs, and I can see my appointments in a calendar. But can I see my photos in a calendar to see what I was doing when I took them? Can I see bank statement lines in a calendar? Why not? Because we don't have a web of data. Because data is controlled by applications, and each application keeps it to itself. The Semantic Web is about two things. See also the activity news for an account of recent events, publications, etc. The following groups are part of the Semantic Web Activity. Active Groups Semantic Web Coordination Group The Semantic Web Coordination Group is tasked to provide a forum for managing the interrelationships and interdependencies among groups focusing on standards and technologies that relate to this goals of the Semantic Web Activity.

RDFa Working Group RDF Working Group Linked Data Platform Working Group. Qu’est-ce que le Web Sémantique ? Le Web de données : perspectives pour les métiers de l'information documentation. Référentiels et données d’autorité à l’heure du Web sémantique. Les meilleurs cours et tutoriels sur le Web sémantique. Ceci est un tutoriel introductif à la fois au framework de description de ressources (RDF, Resource Description Framework) du W3C et à Jena, une API Java pour RDF. Il est écrit pour le développeur peu familier à RDF et qui apprend le mieux en prototypant ou, pour d'autres raisons, désire aller rapidement à l'implémentation. Une certaine habitude à XML et à Java est requise. Implémenter trop vite, sans d'abord comprendre le modèle de données de RDF, mène à la frustration, à la déception.

Cependant, étudier le modèle de données seul est assez difficile et mène généralement à des énigmes métaphysiques tortueuses. Web sémantique, Web de données : présentation. On désigne généralement par le terme de Web sémantique un ensemble de technologies développé par le W3C (l'un des principaux organismes de normalisation du Web) visant à faciliter l'exploitation des données structurées, notamment en permettant leur interprétation par des machines. Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes.

Le Web sémantique Le terme de Web sémantique a été proposé par Tim Berners Lee en 2001 (« The Semantic Web », Scientific American Magazine , May 17, 2001) pour désigner une évolution du Web qui permettrait aux données disponibles (contenus, liens) d’être plus facilement utilisables et interprétables automatiquement, par des agents logiciels . Le Web de données Autres ressources majeures : 3. Métadonnées. La qualité des données des bases de données - un phénomène très ancien (erreurs des copistes) qui ne fait que s'amplifier avec les années, les volumes aujourd'hui massifs (Big Data) ainsi que les usages, directs et plus encore indirects (réutilisation extensive des données). Histoire vécue. J'ai perdu ma carte Navigo/Velib (je suis parisienne...). Le fonctionnement des systèmes d'information de la RATP a bien évolué : en 2000 (avec la carte Navigo de l'époque), cela m'avait pris 3 semaines ; ce matin, en 2 mn, j'avais une nouvelle carte.

En fait pas exactement 2 mn, car cela a pris 5 mn pour me retrouver dans la base de données... Premier point : Avec mon nom (unique occurrence nom+prénom sur Paris), je voyais l'agente de la RAPT hésiter. Elle avait avec ce nom quelque chose d'approchant mais avec une date de naissance incroyable ... 11/11/11. 2011 impossible, et 1911, cela semblait improbable tout de même ! Enfin, mon ancienne carte est redevenue ma nouvelle carte. Sémantique web « Punktokomo ; En Octobre 2010, l’ABES a inauguré IdRef, avec l’ambition de promouvoir l’utilisation des autorités Sudoc au-delà du Sudoc, et même au-delà des seules applications ABES comme Calames ou STAR. Parmi les moyens techniques mis au service de cette stratégie, figurait l’exposition sur le Web des données d’autorité au moyen de pages HTML et RDF dédiées et d’une batterie d’URL pérennes associées.

Depuis ce matin, ces pages sont considérablement enrichies. IdRef, lié à Sudoc. Et inversement. Jusqu’à maintenant, ces pages HTML et RDF reflétaient seulement le contenu des notices d’autorité UNIMARC. Ainsi, à la page suivante : vous trouverez quelques informations sur Paul Veyne, tirées de sa notice d’autorité (version UNIMARC en XML), mais aussi la liste raisonnée de tous les documents qui lui sont liés. Pour obtenir la version RDF/XML de ces données, il suffit d’ajouter l’extension .rdf à l’URL précédente : Merci. Information numérique : défintions et enjeux. Alors que j'étais en train de préparer une nouvelle formation, je suis retombé sur différents diaporamas que j'avais constitués à l'époque où je travaillais sur la pérennisation de l'information numérique.

Comme je n'en aurai plus vraiment l'utilité, je me suis dit qu'il pourrait être intéressant de les partager, plutôt que les laisser dans un recoin de mon disque dur. Last but not least, cela me permettait d'alimenter ce blog, largement en déshérence ces derniers temps... Ce diaporama est le résultat de la fusion d'une formation que j'avais mise au point pour présenter les enjeux de la pérennisation de l'information numérique à mes collègues d'Atos Origin, lorsque je travaillais sur le projet SPAR de la BnF et d'une présentation de ces problématiques à destination de décideurs. Vous reconnaîtrez peut-être certaines diapos de Manue, en particulier la fameuse disquette. Placé sous licence CC-BY, ce diaporama est à votre disposition.