Data

TwitterFacebook
Get flash to fully experience Pearltrees
Modélisation

http://www.figoblog.org/node/1955 Il y a quelques temps, j'ai failli aller au salon Documation pour parler d'identifiants pérennes. Finalement, comme ça n'intéressait personne, la présentation a été annulée... En plus pour une fois je m'étais donné la peine de faire quelque chose de nouveau, au moins en partie.

Identifiants pérennes

http://www.comeetie.fr/galerie/velib/ + infos Cette visualisation permet d'explorer plus de 2 500 000 déplacements enregistrés sur le réseau Vélib en Avril 2011. Les données ont été fournies par JC-Decaux, cyclocity et la mairie de paris dans le cadre d'un partenariat avec l'ifsttar . La carte représente le nombre de départs ou d'arrivés de Vélib de chacune des stations durant la plage temporelle sélectionnée grâce aux différents menus.

Un mois de Vélib.

RDF

SPARQL

This is the Watson Web interface for searching ontologies and semantic documents using keywords. This interface is subject to frequent evolutions and improvements. If you want to share your opinion, suggest improvement or comment on the results, don't hesitate to contact us ... At the moment, you can enter a set of keywords (e.g. "cat dog old_lady"), and obtain a list of URIs of semantic documents in which the keywords appear as identifiers or in literals of classes, properties, and individuals.

Watson Semantic Web Search

http://watson.kmi.open.ac.uk/WatsonWUI/
Des vocabulaires tels que GoodRelations et schema.org permettent de décrire des produits sur le web de données et, pour des articles tels que livres ou tickets de spectacle, les moteurs de recherche sont capables de retourner des offres commerciales incluant vendeur, prix et évaluations. Mais supposez que vous vouliez acheter une voiture, une citadine par exemple, avec toit ouvrant, climatisation, et connecteur MP3. Là, les choses se compliquent. Ces choix ne définissent pas complètement un produit, et vous souhaitez probablement comparer les offres sur de multiples critères : leur prix, mais aussi, par exemple, leurs systèmes de navigation ou leurs émissions de CO2. Plusieurs constructeurs ont entrepris de décrire leur gamme sur le web de données . Cela pose d'intéressantes questions. http://www.semweb.pro/tag/ontology?rql=Any%20X%20ORDERBY%20CD%20DESC%20LIMIT%2015%20WHERE%20T%20tags%20X%2C%20T%20eid%202488%2C%20X%20modification_date%20CD&vtitle=ontology

ontology

Linked Data and URI:s for Enterprises: Mind maps just begging for RDF triples and formal models

http://kerfors.blogspot.com/2012/09/mind-maps-just-begging-for-rdf-triples.html Earlier this week CDISC English Speaking User Group (ESUG) Committee arranged a webinar : "CDISC SHARE - How SHARE is developing as a project/standard” with Simon Bishop, Standards and Operations Director, GSK. I did find the comprehensive presentation from Simon, and his colleuage Diane Wold, very interesting. Interesting as the presentation in an excellent way exemplifies how "Current standards (company standards, SDTM standards, other standards) do not current deliver the capability we require" Also, I do find the presentation interesting as it exemplifies mind maps as a way forward as "Diagrams help us understand clinical processes and how this translates into datasets and variables." (Quotes from slide 20 in the presentation : Conclusions.)
http://jena.apache.org/tutorials/ The following tutorials take a step-by-step approach to explaining aspects of RDF and linked-data applications programming in Jena. For a more task-oriented description, please see the getting started guide. Quelques uns des tutoriels de Jena sont aussi disponibles en français. Vous pouvez les voir en suivant ces liens: Os tutoriais a seguir explicam aspectos de RDF e da programação em Jena de aplicações linked-data. Veja também o guia getting started - em inglês.

Jena - Jena tutorials

Technologies | Knowledge Media Institute | The Open University

Technologies All Technologies [72] Hot [22] Active [19] Classics [31] Research Themes http://kmi.open.ac.uk/technologies/theme/semantic-web-and-knowledge-services
http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-2 Ce billet constitue la suite du précédent billet dont je vous conseille la lecture préalable si ce n'est déjà fait. Bien que le Web permette de dépasser ces contingences physiques et donc les concepts de document et de structures hiérarchiques , nous sommes restés et restons encore pour une large partie de notre production dépendants de ce paradigme . Qu'est-ce-qu'une édition électronique sur le Web aujourd'hui, si ce n'est le portage d'un document issu de nos habitudes d'écriture (donc documentaire et hiérarchique) au support numérique.

Les carcans de la pensée hiérarchique et documentaire (2)

Les carcans de la pensée hiérarchique et documentaire (1)

http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-1 Dans un billet intitulé « Comment organiser l'information pour y naviguer efficacement » , j'essayais d'analyser en quoi l'organisation hiérarchique de l'information, issue des pratiques d'organisation physique de l'information , que ce soit dans un livre-codex ou sur un système de fichiers, influençait notre pratique du Web et comment, peu à peu, l'hypertexte et certaines pratiques, alors naissantes, comme la folksonomie ou la multiplication des métadonnées pouvaient permettre de dépasser ce paradigme pour démultiplier les accès à l'information et donc son exploitation. Je vous propose de revenir sur ces questions pour comprendre en quoi il est nécessaire aujourd'hui pour appréhender au mieux les enjeux du Web de données de s'abstraire de ce paradigme pour aller vers un nouveau modèle d'organisation et de modélisation de l'information .
http://www.lespetitescases.net/quel-evenement-ou-comment-contextualiser-le-triplet L'absence de contextualisation est le principal reproche adressé à RDF par ses adversaires et il est vrai qu'au premier abord cela constitue son principal défaut. En effet, le modèle du triplet à la base de RDF ne permet pas a priori d'exprimer des informations sur le contexte d'application de l'assertion , au contraire d'autres mécanismes de modélisation des connaissances qui offrent nativement des systèmes pour préciser la portée d'une assertion, à l'image, par exemple, des Topic Maps avec l'élément "scope" . Ce défaut semble renforcé par deux postulats de base de RDF : chaque assertion exprimée est vraie et chaque triplet est indépendant .

Quel événement !? Ou comment contextualiser le triplet

J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...). Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie.

Petite histoire du Web sémantique

Retour sur le Web de données

J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...). Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie.

Big Data : un nouvel air souffle sur la Business Intelligence

Abed Ajraou, Responsable du Centre de Compétence EIM, Devoteam 21 in Share Ce n’est plus trahir un secret que d’affirmer que la Business Intelligence, dite traditionnelle, atteint ses limites : • Un datawarehouse de quelques téraoctets est très compliqué à maintenir et à faire évoluer. • Les données non-structurées n’ont jamais été abordées par la Business Intelligence – pensant que les données structurées étaient suffisantes pour la prise de décision – tel un nombrilisme méprisant. • La BI temps réel – grand paradigme de ces dernières années – n’a été atteinte qu’au prix d’architectures ultra-complexes, coûteuses et dont le retour sur investissement a toujours été contesté. Pourquoi remuer le couteau dans la plaie de la Business Intelligence aujourd’hui ? Pour au moins deux bonnes raisons : 1. Se limiter à quelques téraoctets dans l’entrepôt de données n’est aujourd’hui plus possible.

Data Protocols: community-based, light-weight data protocols for collaborative, distributed work with data

We’re pleased to announce Data Protocols , a community-driven effort to develop simple, light-weight protocols and formats for distributed and collaborative work with data. If you’re interested in the project got check out the Knight News Challenge Data Protocols application and give our proposal the thumbs up ! What’s the Idea The civic and open data community is hampered by a lack of simple standards for interaction between services and tools.

Semantics in the Real World: Where to Begin? - Enterprise Semantics Blog - Cambridge Semantics

A lot of the chatter in the semantics community is jargon-heavy, very technical, or both. To a newcomer trying to evaluate what problem, if any, might benefit from semantic technologies (and even which to apply!), this can be very confusing. As part of Semantic University , we decided to include some introductory content to help people identify what kinds of appilcations could benefit from Semantic Web technologies, as free from jargon as possible.
web semantic