background preloader

Corpus

Facebook Twitter

Recherche corpus

SDL Trados Studio plugin. Language corpus management and query system. BootCaT. Course: Using Corpora For Language Research. CRTT - Linguistique et traduction-Corpus. L’extraction terminologique à partir d’un corpus de textes techniques. 1Le présent article propose une méthode d’extraction terminologique à partir de corpus bilingues comparables.

L’extraction terminologique à partir d’un corpus de textes techniques

Dans ce cas précis, il s’agit d’articles de spécialité du domaine de la sécurité informatique, articles écrits en langue anglaise et en langue française. Cette méthode fait appel à des outils disponibles sur internet et chaque étape est décrite afin d’offrir au lecteur une vision globale des procédés suivis. La méthode décrite peut être transposée à d’autres domaines et appliquée à d’autres corpus de spécialité, voire à une littérature de spécialité qu’un traducteur peut avoir à traiter dans son travail auprès d’organisations ou d’entreprises.

Sans aucune prétention d’exhaustivité, l’article met en lumière une méthode rapide, basée sur des outils gratuits, donc disponibles pour tous. 2Un nombre grandissant de textes de spécialité au format électronique sont disponibles sur internet. Figure 1 : Liste de mots dans le corpus français Figure 2 : Concordance du mot operating. CRTT - Linguistique et traduction-Corpus. AntConc 3.4.0 Tutorial 1: Getting Started. Laurence Anthony's AntConc. [bnc] British National Corpus. Corpus. Un article de Wikipédia, l'encyclopédie libre.

Corpus

Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie[1], etc. §Le corpus en linguistique[modifier | modifier le code] On parle de corpus pour désigner l'aspect normatif de la langue : sa structure et son code en particulier. "Corpus" est généralement opposé à "status" (ou statut), qui correspond aux conditions d'utilisation de la langue. §Le corpus en littérature[modifier | modifier le code] Le corpus regroupe un ensemble de textes ayant une visée commune.

§Le corpus dans la science[modifier | modifier le code] Les corpus sont des outils indispensables et précieux en traitement automatique du langage naturel. D'un point de vue informatif, ils permettent d'extraire des tendances et notamment de construire des ensembles de n-grammes. corpus, sur le Wiktionnaire. Corpus français  : 700 millions de mots en ligne. Si je lui dis « capteur », il répond « megapixels, infrarouge, photosites » ou encore « température ».

Corpus français  : 700 millions de mots en ligne

Lui, c'est Corpus français, une banque de données en ligne pour explorer le lexique français contemporain écrit. Complément logique du sacro-saint dictionnaire, il a la particularité de s'adresser aux chercheurs comme au grand public. Corpus français répertorie la bagatelle de 37 millions de phrases, soit quelque 700 millions de mots issus de la presse francophone, des pages web et de l'encyclopédie Wikipédia. Sa consultation permet de découvrir des phrases exemples autour d'un mot-clé, de constater la fréquence d'utilisation de ce mot et, mieux encore, de repérer son association à d'autres mots dans le français écrit. Des graphes indiquent la proximité sémantique entre le mot-clé et les termes qui lui sont le plus souvent liés.

Replacés dans différents contextes, les mots prennent tout leur sens et deviennent de véritables sésames pour appréhender la langue française autrement. Ciel-f : Le premier corpus écologique du français langue mondiale. Corpus français - Université de Leipzig. Corpus of Contemporary American English (COCA)