background preloader

Google: Le plus grand corpus linguistique de tous les temps

Google: Le plus grand corpus linguistique de tous les temps
Lorsque j'étais étudiant, à la fin des années 70, je n'aurais jamais osé imaginer, même dans mes rêves les plus fous, que la communauté scientifique ait un jour les moyens d'analyser des corpus de textes informatisés de plusieurs de centaines de milliards de mots. A l'époque, j'étais émerveillé par le Brown Corpus, qui comportait la quantité extraordinaire d'un million de mots d'anglais américain, et qui après avoir servi à la compilation de l'American Heritage Dictionary, avait été mis assez largement à disposition des chercheurs. Ce corpus, malgré sa taille, qui apparaît maintenant dérisoire, a permis une quantité impressionnante d'études et a contribué largement à l'essor des technologies du langage... J'ai eu la chance d'avoir pu accéder à l'étude avant publication, et j'ai eu quelque peu le vertige... Et pour le français ? Je ressens aujourd'hui la fascination qu'ont eue sans doute les astronomes qui ont braqué pour la première fois Hubble vers un coin inexploré de l'univers. Related:  Dictionnaires & ressources

CRISCO - Dictionnaire des synonymes Après deux semaines de fermeture, nous avons décidé de rouvrir l’accès au DES afin de permettre à nos utilisateurs de le consulter en cette période de confinement – nous pensons notamment aux élèves de l’enseignement primaire et secondaire, ainsi qu’aux étudiants et professionnels qui en font un usage quotidien. Toutefois, notre vigilance reste entière, et nous nous réservons la possibilité de procéder à une nouvelle fermeture du Dictionnaire Électronique des Synonymes,au moment de la discussion de la Loi de Programmation Pluriannuelle de la Recherche au parlement. Nous vous invitons à prendre connaissance de nos revendications.

Culturonomics : juste une question de corpus ? A quoi sert de numériser des millions d'ouvrages depuis 2005 ? A ça. Disposer de 4% de tous les livres publiés depuis 2 siècles. 7 langues. 2 milliards de mots. 5,2 millions de livres numérisés "inside" (voir l'article du NYTimes). Deux corpus. "Ensemble de données exploitables dans une expérience d'analyse ou de recherche automatique d'informations." Dans le domaine du droit, le corpus : "C'est l'élément matériel de la possession, le pourvoir de fiat exercé sur une chose. Du premier corpus, celui de Google, on ne pourra que se réjouir, pour ce qu'il représente de potentialités ouvertes dans l'aventure linguistique comme compréhension du monde. Du second corpus, celui de Facebook, on ne peut que continuer à raisonnablement s'alarmer. "Il n’y a rien que l’homme soit capable de vraiment dominer : tout est tout de suite trop grand ou trop petit pour lui, trop mélangé ou composé de couches successives qui dissimulent au regard ce qu’il voudrait observer. Et donc ? Moralité.

Dictionnaire Un article de Wikipédia, l'encyclopédie libre. Un dictionnaire est un ouvrage de référence contenant l’ensemble des mots d’une langue ou d’un domaine d’activité généralement présentés par ordre alphabétique et fournissant pour chacun une définition, une explication ou une correspondance (synonyme, antonyme, cooccurrence, traduction, étymologie). Le mot dictionnaire est porté par un vaste choix d'ouvrages de référence. Le présent article concerne essentiellement les dictionnaires unilingues qui décrivent ou normalisent une langue. Étymologie[modifier | modifier le code] Le mot dictionnaire, d'abord écrit avec un seul n, est dérivé du latin dictio : « action de dire, propos, mode d'expression ». Contenu des dictionnaires[modifier | modifier le code] Les renseignements linguistiques sont de trois ordres : Définition[modifier | modifier le code] Dans la pratique, les définitions incorporent aussi des propriétés non essentielles, mais qui aident le lecteur à identifier ce dont il est question.

Etymologie - dictionnaire étymologique, origine des mots dans toutes les langues LEXILOGOS Étymologie Racines indo-européennes • University of Texas : Indo-European lexicon • racines indo-européennes d'après le dictionnaire de Jules Pokorny • index par langues • index par thèmes : champs sémantiques • American heritage dictionary : dictionnaire des racines indo-européennes • racines sémitiques • Tower of Babel : racines indo-européennes, par Sergueï Starostine • dictionnaire proto-celtique-anglais • Indogermanisches etymologisches Wörterbuch : dictionnaire étymologique de l'indo-européen par Julius Pokorny (1959) • Dictionnaire des racines celtiques par Pierre Malvezin (1903) • Manuel pour l'étude des racines grecques et latines avec une liste des principaux dérivés français, par Anatole Bailly (1869) • Französisches etymologisches Wörterbuch (FEW) eine Darstellung des galloromanischen Sprachschatzes : dictionnaire étymologique français, une représentation du trésor lexical galloroman (langues d'oïl, langues d'oc, francoprovençal) par Walther von Wartburg (1922-2002) Étymologie - latin

Online Etymology Dictionary Canal Académie Conjugaison Larousse en ligne - Accueil pallier CONSTRUCTIONLe verbe est transitif direct et l'on doit dire pallier qqch (et non *pallier à) : pallier une défaillance, une faute, c'est étymologiquement les cacher, les couvrir comme avec un manteau (pallium, en latin). EMPLOIrecommandation N'utiliser le mot que dans son sens strict de « masquer un défaut, une difficulté » ou de « porter superficiellement remède à un mal, sans s'attaquer à ses causes profondes ». remarque Du sens de « voiler, couvrir », le mot est passé à celui de « remédier de manière incomplète ou provisoire à ». L'évolution actuelle de la langue tend à effacer l'idée d'insuffisance ou de caractère provisoire du remède, qu'il serait pourtant souhaitable de conserver, en raison notamment du sens du dérivé palliatif, « expédient, moyen provisoire ».

Thèmes de citations @import url(" Plan du site Accès membres : merci de vous identifier Mot de passe oublié ? actualité magazines encyclopédie services copains boutique photos quiz Bienvenue Prénom - Déconnexion Services gratuits : Inscription | Citations Tous les thèmes Tous les auteurs Vos préférées Les plus commentées Derniers avis Exploration Top recherches Biographies Dictionnaire Expressions Histoire Musique Inventions Noms de famille Noms propres Pratique Prénoms Proverbes Villes Dictionnaire sur iPhone Actualité Argent Automobile Bricolage Cinéma Consommation Cuisine Femmes Guides d'achat Guide des plages High-tech Insolite Internet Juniors Livres Mer et Voile Nantes Nature Paris Photo numérique Restaurant Santé Savoir Science Sport Télévision Vidéo Voyage Week-end Les mieux notées | Les plus commentées | Art (389 citations) Littérature Peinture Poésie Spectacle Condition humaine (10966 citations) Age adulte Ages de la vie Apparences Autodérision Avenir Bonheur / malheur Destin Echecs Mort

Citations - 127 000 citations proverbes et dictons - Dicocitations ressources textes du Moyen-Age : index Photl : plus de 500 000 photos gratuites et libres de droit Illustrer un site ou un article de blog avec de belles photos, gratuites, en respectant le droit d’auteur, ce n’est pas toujours facile. Heureusement, des sites web entiers répertorient les meilleures images libres de droit. Focus sur Photl, un outil bien pratique pour trouver des photos de qualité. Sur Photl, vous pouvez rechercher une photo gratuite et libre de droit avec un mot clé. Les conditions d’utilisation des photos présentes sur Photl sur plutôt claires : Les photos sont gratuites pour un usage non-commercial uniquementVous pouvez payer pour utiliser les images pour un usage commercialLa résolution des photos gratuite est de 1920x1280px ou 849x565pxVous pouvez payer pour télécharger les images en plus haute résolutionVous pouvez télécharger jusqu’à 10mb de photos par jour gratuitementVous n’avez pas le droit de revendre les images téléchargées sur Photl

Internet Archive: Digital Library of Free Books, Movies, Music & Wayback Machine Dictionnaire de l'Académie française Dans le cadre du projet de base de données du Dictionnaire de l'Académie française, sous la direction de R. Wooldridge et I. Leroy-Turcan, le Projet ARTFL, de l'Université de Chicago et le Laboratoire de Traitement Automatique de la Langue Française du CNRS, collabore à la saisie des données, à la mise en forme éditoriale exigée et au développement des moteurs de recherche sur plusieurs éditions du Dictionnaire de l'Académie française. A terme, les éditions combinées formeront une base de données commune offrant à l'utilisateur la possibilité de consulter chaque édition séparément, ou, de manière à visualiser l'évolution du dictionnaire au cours du temps, toutes les versions en même temps. Plusieurs éditions sont disponibles : La 1ère Édition, 1694 La 4ème Édition, 1762 La 5ème Édition, 1798 La 6ème Édition, 1835 La 8ème Édition, (1932-1935) La 9ème Édition Nous invitons toutes les personnes intéressées à utiliser ces dictionnaires.

Related: