background preloader

Les technologies du Web sémantique

Les technologies du Web sémantique
J'ai écrit le texte de ce billet en guise d'introduction aux technologies du Web sémantique pour le projet de publication selon les règles du Web de données du thésaurus pour l'indexation des archives locales publié par les Archives de France que j'ai mené pour Atos Origin avec le Service Interministériel des Archives de France au printemps 2010 (et sur lequel il faudra que je trouve le temps de revenir sur ce blog pour vous en dire plus...). Claire Sibille, conservateur en chef au SIAF, m'a très gentiment donné l'autorisation de republier ces textes sur mon blog. Je l'en remercie. Il s'agit d'une introduction générale en trois parties dont ce billet est la seconde : Le Web sémantique désigne, en premier lieu, une activité du W3C, l'organisme de normalisation du Web, visant au développement de technologies de mise à disposition des données structurées en vue de leur traitement par les machines sur le Web. L'architecture du Web par Christian Fauré Les triplets pour décrire et exprimer <!

Google's Hummingbird updated explained - what should it mean for SEOs? Google's Hummingbird update explained - what should it mean for your SEO? Last week Google announced its new Hummingbird algo update, putting lots of SEOs into doubts and concerns – what should this algo change mean to you and your website? To make sure you don't get down into panic and plan your SEO strategy wisely, we've put up this short guide to explain what Hummingbird update is, how it affects your rankings and how to adapt your SEO strategy to benefit from the changes. So, what do we know about Hummingbird? Though announced on September 26 only, Hummingbird was in fact released a month before that and is said to affect 90% of search queries. Unlike Penguin and Panda, Hummingbird is not a penalty-based update (aimed at cleaning the SERPs from low-quality content), but a change in the way Google reacts to different types of queries, which lets the search engine now get the actual meaning behind a query, rather than the separate terms in it. 1. What's happening? Informational 1. 1. 1.

Le web sémantique : un projet pour amener le web à son plein potentiel Le web sémantique (généralement associé au terme « web 3.0 »), est une notion que l’on rencontre de plus en plus. Que désigne cette association des mots « web » et « sémantique » qui appartiennent tous deux à des disciplines relativement éloignées que sont l’informatique et la linguistique ? Le web du futur sera-t-il « intelligent » et capable de juger de la pertinence d’une réponse en analysant la sémantique de la question correspondante ? Nous offrira-t-il la possibilité d’exploiter l’ensemble des contenus du web de façon parfaitement pertinente et précise ? Le web sémantique est un projet initié en 2001 par Tim Berners Lee1, inventeur du World Wide Web. Ce projet s’est développé sous l’égide du W3C qui est un organisme de standardisation des formats informatiques utilisés sur internet. Web semantique et ontologies - source : Samuel Huron/Flikr Les ressources et leur sémantique Les ontologies Les facteurs de diffusion du web sémantique _ L’effort de standardisation Sources : T. Notes :

Olivier Le Deuff: Quelques députés plutôt sympathiques mènent une campagne en faveur du vote à 16 ans. On y retrouve notamment Paula Forteza dont j’apprécie le travail et qui présente clairement des atouts appréciables et une réflexion qui mériteraient de la voir mener une équipe ministérielle voire un gouvernement (on a le droit de rêver !). Plusieurs aspects me gênent dans cette initiative car j’y vois plusieurs erreurs à la fois en matière de connaissance du terrain (notamment des jeunes générations), mais également en ce qui concerne les conséquences directes et indirectes qui sont des revers de la médaille de la proposition.Je ne comprends toujours par comment les politiques ne saisissent pas ou font semblant de ne pas saisir qu’une décision n’est jamais isolée et qu’elle produit des effets systémiques dont on perd souvent le contrôle. Il est vrai que la politique est surtout devenu un art de la rustine, art itératif et communicationnel qui peine à se projeter sereinement. Première remarque.

web semantique Carrot2 Search Results Clustering Engine Carrot2 organizes your search results into topics. With an instant overview of what's available, you will quickly find what you're looking for. Choose where to search: Type your query: More options More advanced options Hide advanced options Loading... Top results of about for web semantique Cluster with documents Our apologies, the following processing error has occurred: org.carrot2.source.etools.IpBannedException: org.apache.http.client.HttpResponseException: Forbidden If the error persists, contact us. v3.9.3-SNAPSHOT | build 13 | 2014-04-11 12:13 © 2002-2014 Stanislaw Osinski, Dawid Weiss Query: web semantique -- Source: Web ( results, ms) -- Clusterer: Lingo ( ms) About Carrot2: Carrot2 is an Open Source Search Results Clustering Engine. 1x Show in clusters Open in new window Show preview x

Long Tail et Semantic clustering - Sites web et recherche sémantique / Traitement du Langage Naturel (TLN) sur Viadeo Le phénomène de la "Long Tail" tel qu'il a été décrit par Chris Anderson en Octobre 2004 ( ) se retrouve parfaitement à travers les recherches effectuées par les internautes SUR les sites internet. Nous (inbenta) avons pu réaliser une analyse sémantique sur les recherches effectuées par les internautes sur les moteurs de recherche interne de sites internet de grand compte (trois sites internet dans le secteur bancaire et deux sites internet d’assurance – étude réalisée courant deuxième semestre 2009). Détail du processus : Lors de cette analyse sémantique, ces sites internet de grands comptes possédaient un moteur de recherche à mots clefs au fonctionnement semblable à celui du célèbre moteur de recherche Google. Nous avons analysé les historiques de recherche effectuées par les internautes sur une durée d'un mois. Cela constituait en moyenne 60 000 recherches pour chaque site internet. Semantic Clustering :

Hummingbird's Unsung Impact on Local Search Though I no longer actively consult for clients, there seems to have been a significant qualitative shift in local results since Google's release of Hummingbird that I haven't seen reported on search engine blogs and media outlets. The columns I have seen have generally espoused advice to take advantage of what Hummingbird was designed to do rather than looked at the outcome of the update. From where I sit, the outcome has been a slightly lower overall quality in Google's local results, possibly due in part to a "purer" ranking algorithm in local packs. I'll be working with Dr. To do the analysis, I performed manual searches for five keywords, both geo-modified and generic, in five diverse markets around the country. I also performed an even smaller analysis using three keywords that returned carousel results (thanks to SIM Partners for this sample list of keywords): "golf course," "restaurant," and "dance club." 1. 2. 3. 4. 5. 6. 7. What does all this mean?

Google Hummingbird (colibri), nouvel algo du moteur de recherche Par Olivier Duffez, Vendredi 18 octobre 2013 Du fin fond du garage où Google a démarré, lors d'une conférence de presse pour fêter les 15 ans de Google, Amit Singhal a annoncé qu'ils ont sorti un nouvel algo pour leur moteur de recherche, intitulé Hummingbird ("colibri"). Voici en quoi consiste cet algoet ce que ça change pour vous... Mise à jour de l'article du 18 octobre : La conférence de presse a eu lieu dans le garage des débuts de Google (photo Danny Sullivan) : Le garage des débuts de Google, chez Susan Wojcicki L'algo Hummingbird (colibri) Voici tout ce qu'on sait pour l'instant (c'est encore un peu tôt)... Image de colibri projetée par Google pendant sa conférence de presse, pour l'annonce de l'algo Hummingbird Qu'est-ce que l'algo colibri et de quand date-t-il ? Il s'agit bien d'un algorithme visant à sélectionner les réponses à afficher dans les résultats de Google, c'est même l'ensemble du processus qui a été revu. Quel rapport avec Caffeine, Panda et Pingouin ?

Les vrais enjeux de la recherche sémantique pour Google avec Knowledge Graph Avec le déploiement à l'international de Knowledge Graph ou Graph du savoir, Google se lance dorénavant dans la recherche sémantique. Ainsi, dorénavant, les résultats de recherche ne seraient plus uniquement fonction des mots clés, des backlinks et autres facteurs de classement actuels.La recherche sémantique faisant appel à la compréhension du sens des mots compris dans la requête de l'internaute pour lui produire une liste de résultats directs et pertinents sur la page de résultats elle-même. Une évolution majeure pour Google Le lancement de la recherche sémantique pourrait affecter les millions de sites web ayant Google comme principale, voire unique source de trafic. La recherche sémantique constitue donc une évolution majeure du moteur de recherche Google, depuis sa création. Pour plus de détails sur cette fonctionnalité, je vous renvoie à cet article : Google : la recherche sémantique le rendra plus fort !. Recherche sémantique : une manne financière Un moyen de retenir les internautes

Building SEO-Focused Pages to Serve Topics & People Rather than Keywords & Rankings - Whiteboard Friday With updates like Hummingbird, Google is getting better and better at determining what's relevant to you and what you're looking for. This can actually help our work in SEO, as it means we don't have to focus quite so intently on specific keywords. In today's Whiteboard Friday, Rand explains how focusing on specific kinds of people and the topics they're interested in can be even more effective in driving valuable traffic than ranking for specific keywords. Howdy, Moz fans and welcome to another edition of "Whiteboard Friday." So, historically, SEO has really been about keyword rankings. This can be a little bit problematic because it can mean that we ignore things like social and content marketing opportunities and email marketing opportunities. We create some landing pages for each of these terms and phrases. And then we decide "Yeah, I'm not ranking so well for this keyword. But even still, you might have "bowling shoes" and "shoes for going bowling." Links are certainly one of them.

Google: Hummingbird Algorithm Affects 90% Of Searches I keep coming back to this episode 227 from TWiG and in the video, Matt Cutts talked about the Hummingbird algorithm at exactly one hour and twenty minutes into the video. He spent maybe a minute or so talking about it. Matt Cutts said that the Hummingbird algorithm actually effects 90% of all searches but he said only to a small degree. So while Panda may have impacted 10% or so and Penguin closer to 3% or so, Hummingbird impacted 90%. But Matt Cutts said only to a small degree where users should not notice. Here is the snippet of what Matt Cutts said: Hummingbird effects 90% of all searches but usually to a small degree because we are saying, this particular document isn't really about what the user is searching for. I know Google has told us searchers and SEOs should not have noticed any impact to rankings and traffic based on this algorithm update. With such a large footprint, 90%, it had to on some degree. Forum discussion at Google+.

Can George Loewenstein’s curiosity theory finally make behavioural economics work in MR? | The Irrational Agency Blog Behavioural economics keeps coming up in market research conversations. Surprisingly, I’ve never heard in that context one of the most important names in the discipline: George Loewenstein. Loewenstein’s work provides deep psychological insight into how consumers choose and value the products they buy. And one of his long-term research projects might have unlocked a key secret of why people want what they want: the theory of curiosity. He is not one of the best known researchers among the general public: unlike Dan Ariely, Richard Thaler or Daniel Kahneman, he hasn’t written a book for popular consumption. Loewenstein’s research has its own core message: people’s preferences are not straightforward. Simplistic marketing, like simplistic economics, assumes that we can explain all consumer purchases in a simple way: people have fixed desiresthey know what those desires are and how strong they areonce they become aware of products that can satisfy their desires, they buy those products

A Guided Tour of the Zoo: Pandas, Penguins & Hummingbirds Google Semantic Search | Book Review A decade ago, search was all about keywords. Search engine algorithms relied on pure text based analysis of the pages of your site to figure out what your site was about. This approach ended up failing because spammers found ways to manipulate those algorithms. Then, Google came along with an algorithm that analyzed links to your site from other sites to see how authoritative you were on a topic. The link based algorithms are better, but they still have a high dependency on analyzing the keyword strings on web pages to understand what they are about. There are two major problems with this approach: 1. 2. The concept with semantic search is to develop algorithms that deal with both of these problems. These are all relationships that humans understand quite intuitively, and that search engines are working to understand as well. There is more to context than just this simple example. Now, let's show off a little bit of semantic search in action with the following query: "How tall is it?"

Related: