background preloader

Searching

Facebook Twitter

Couperin

PirateBay. FranckRibéry. Par Véronique, Vendredi 23 avril 2010 Google vient d'obtenir un (nouveau) brevet sur l'indexation basée sur l'analyse des extraits de phrases.

Cette méthode, basée sur les syntagmes, apporte quelques nouveautés dans l'indexation des pages web. Après le traitement des mots, Google en vient à celui des groupes de mots (bientôt la phrase ?). Il ne s'intéresse pas à proprement parler à la syntaxe (la construction de la phrase type sujet, verbe et complément) mais à la phraséologie c'est à dire à la modélisation de groupes de mots, à la relation des mots qui sont associés dans une requête ou dans un document.

L'indexation par mots uniques ou par bouts de phrases.