background preloader

Problèmes et critiques

Facebook Twitter

Metacrap. 0.1.

Metacrap

Version History Version 1.3, August 26 2001. Fixed typos. First published version. Version 1.2, May 23 2001. Version 1.1, May 18 2001. Version 1.0, May 15 2001. 1. Metadata is "data about data" -- information like keywords, page-length, title, word-count, abstract, location, SKU, ISBN, and so on. Semantics Incorporated: Slow Adoption of Linked Data: Why? Linked Open Data Caching – Establishing a Baseline with HTTP « W.

The other day I was pondering on Linked Open Data Source Dynamics and as a starting point I wanted to learn more about the caching characteristics of LOD data sources.

Linked Open Data Caching – Establishing a Baseline with HTTP « W

Now, in order to establish a baseline, one should have a look at what HTTP, one of the pillars of Linked Data, offers (see also RFC2616, Caching in HTTP). So, I hacked a little PHP script that takes 17 sample resources from the LOD cloud (from representative datasets ranging from DBpedia over GeoSpecies to W3C Wordnet). The results of the LOD caching evaluation are somewhat deflating: more than half of the samples do not support cache control and less than 20% support Last-Modified or ETag headers. I know, I know, this is just a very limited experiment. And yes, very likely there are not yet that many applications out there consuming Linked Data and hence using up the whole bandwidth. Critiques du Web² (1/4) Oui, les données valent de l’or.

Critiques du Web² (1/4)

C’est aussi comme cela qu’on peut lire le Web à la puissance deux (Web²) de Tim O’Reilly et John Battelle. Mais si c’est effectivement le cas, si nous sommes tous assis sur un capital dont on mesure mal l’exploitation qui peut en être faite, pourquoi faudrait-il les libérer ? Que gagne-t-on à les partager ? Image : Illustration de Boris Müller pour le festival de littérature allemand de 2006 montrant les relations entre les lettres dans un poème, mis en avant par l’australien Andrew Vande Moere, l’auteur du cultissime blog infosthetics sur l’esthétisme de la visualisation de données, pour un article de PingMag sur la beauté de cette nouvelle discipline de représentation de l’information.

Or l’ouverture des données ne va pas de soi pour les organisations. Indéniablement, la question de leur ouverture deviendra à l’évidence un sujet conflictuel. Critiques du Web² (2/4) La question de la libération des données publiques se superpose à celle de leur utilisation.

Critiques du Web² (2/4)

Cette libération – bien qu’encore timide – produit-elle aujourd’hui ce qu’on en attend ? A-t-elle des effets pervers ? Faudrait-il mieux en travailler les conditions, les licences ? Comment la rendre féconde ? Comment, en particulier, l’accompagner de manière à ce qu’elle ne profite pas uniquement à quelques autorités publiques ou quelques entreprises équipées de puissants moyens informatiques, et en dehors d’elles, au mieux, à quelques lobbies ou groupes militants très bien organisés ? Quelle est la valeur de la libération des données ? Critique du Web² (3/4) La technologie nous forcera-t-elle à choisir entre la vie privée et la liberté, comme l’affirmait David Brin dans son livre Transparent Society (Wikipédia) ?

Critique du Web² (3/4)

Il n’y a pas ou plus, d’un côté des données personnelles et de l’autre des données qui ne disent rien des individus : un très grand nombre de données apparemment anonymes peuvent acquérir un “caractère personnel”, c’est-à-dire aider indirectement à savoir quelque chose sur un individu précis. Les champs de données permettent de plus en plus d’identifier leurs émetteurs, tant et si bien qu’on peut se demander à l’avenir si le concept de données anonymes a encore une pertinence. Semantic Web: Difficulties with the Classic Approach. Summary: The original vision of the semantic web as a layer on top of the current web, annotated in a way that computers can "understand," is certainly grandiose and intriguing.

Semantic Web: Difficulties with the Classic Approach

Yet, for the past decade it has been a kind of academic exercise rather than a practical technology. This article explores why; and what we can do about it. Update: Part 2 is available now Top-Down: A New Approach to the Semantic Web The semantic web is a vision pioneered by Sir Tim Berners-Lee, in which information is expressed in a language understood by computers. In essence, it is a layer on top of the current web that describes concepts and relationships, following strict rules of logic. Contrer les idées reçues sur le Web sémantique. La médiatisation d'un nouveau concept, d'une nouvelle notion, d'une nouvelle technologie et de nouvelles perspectives s'accompagne immanquablement d'analyses plus ou moins farfelues, d'incompréhensions et d'interprétations erronnées (parfois volontairment pour profiter du buzz).

Contrer les idées reçues sur le Web sémantique

Le Web sémantique n'échappe à cette tendance. A l'instar de James Hendler qui a publié sa FAQ non officielle sur le Web sémantique, je vous propose de mon côté de revenir sur quelques idées reçues sur le Web sémantique. « Le Web sémantique consiste à faire des documents XML valides par rapport à un schéma XML » Cette idée reçue, qui provient de la confusion entre RDF et XML, est alimentée par un abus de langage utilisé régulièrement par les promoteurs d'une stricte application des standards (X)HTML? /CSS? , à savoir le recours au terme « sémantisation » pour désigner une utilisation correcte des éléments (X)HTML pour encoder les différentes portions d'information d'une page Web.