“Capitalisme linguistique” et mécanisation du langage. Dans un article publié récemment sur son blog, Frédéric Kaplan se penche en détail sur le coeur de métier de Google, à savoir la publicité textuelle.
Il fait un rappel très pédagogique (et très bienvenu : c’est vraiment complexe) sur le fonctionnement d’AdWords, puis concentre son propos sur les technologies de TAL mises en oeuvre par Google : “Le vrai et le seul modèle commercial qui fait vivre Google est la spéculation sur les mots. C’est avant tout un algorithme d’enchérissement sur les mots qui a rendu Google riche. Nous pouvons sous cette lumière reinterpréter tous les outils de complétion/correction automatique qui petit à petit tendent à accroître leur contrôle sur la langue elle-même.
Ces nouvelles prothèses linguistiques ramènent la langue dans le domaine où elle est le mieux exploitable commercialement. Mon analyse diverge de celle de Frédéric Kaplan lorsqu’il parle de “spéculation linguistique”. “What I get a lot is: ‘Why are you against the Semantic Web?’ Imprimer ce billet. Webinaire-P%C3%A9dauque-du-8-novembre-2012. Quand les mots valent de l’or, par Frédéric Kaplan. Le succès de Google tient en deux algorithmes : l’un, qui permet de trouver des pages répondant à certains mots, l’a rendu populaire ; l’autre, qui affecte à ces mots une valeur marchande, l’a rendu riche.
La première de ces méthodes de calcul, élaborée par MM. Larry Page et Sergey Brin alors qu’ils étaient encore étudiants en thèse à l’université Stanford (Californie), consistait en une nouvelle définition de la pertinence d’une page Web en réponse à une requête donnée. En 1998, les moteurs de recherche étaient certes déjà capables de répertorier les pages contenant le ou les mots demandés.
Mais le classement se faisait souvent de façon naïve, en comptabilisant le nombre d’occurrences de l’expression cherchée. Au fur et à mesure que la Toile s’étendait, les résultats proposés aux internautes étaient de plus en plus confus. . — L’enchère sur un mot-clé. . — Le calcul du score de qualité de la publicité. . — Le calcul du rang. Le capitalisme linguistique ou le commerce des mots.
Qu’entend-t-on par capitalisme linguistique?
Est-ce un jargon obscur réservé aux spécialistes du web? Pas vraiment. Nous avons tous entendu parler de près ou de loin du concept d’enchères de mots clés de Google, selon lequel chaque mot clé a une valeur correspondant au prix qu’un annonceur est prêt à payer pour un clic. Nous avons également tous utilisé la fonction de recherche intuitive de Google grâce à laquelle il suffit de taper les premières lettres d’un mot pour qu’une suite de mots statistiquement probables vous soit proposée.
Il ne s’agit là pas seulement d’un service à l’utilisateur : un mot mal orthographié est sans valeur économique car peu de personnes feront des enchères à son sujet. A l’inverse, une suite de mots statistiquement probables et souvent recherchés constitue un gain immédiat pour Google. En effet, il semblerait qu’en faisant de chaque mot une marchandise, nous nous dirigions tout droit vers une uniformisation et une modélisation de la langue.
Conséquence?