background preloader

Corpus

Facebook Twitter

Recherche corpus

SDL Trados Studio plugin. Language corpus management and query system. BootCaT. Course: Using Corpora For Language Research. CRTT - Linguistique et traduction-Corpus. L’extraction terminologique à partir d’un corpus de textes techniques. 1Le présent article propose une méthode d’extraction terminologique à partir de corpus bilingues comparables.

L’extraction terminologique à partir d’un corpus de textes techniques

Dans ce cas précis, il s’agit d’articles de spécialité du domaine de la sécurité informatique, articles écrits en langue anglaise et en langue française. Cette méthode fait appel à des outils disponibles sur internet et chaque étape est décrite afin d’offrir au lecteur une vision globale des procédés suivis. La méthode décrite peut être transposée à d’autres domaines et appliquée à d’autres corpus de spécialité, voire à une littérature de spécialité qu’un traducteur peut avoir à traiter dans son travail auprès d’organisations ou d’entreprises. Sans aucune prétention d’exhaustivité, l’article met en lumière une méthode rapide, basée sur des outils gratuits, donc disponibles pour tous. 2Un nombre grandissant de textes de spécialité au format électronique sont disponibles sur internet.

Figure 1 : Liste de mots dans le corpus français Figure 2 : Concordance du mot operating. CRTT - Linguistique et traduction-Corpus. AntConc 3.4.0 Tutorial 1: Getting Started. Laurence Anthony's AntConc. Older Versions All previous releases of AntConc can be found at the following link.

Laurence Anthony's AntConc

<.exe> files are for Windows. <.zip> files are for Macintosh OS X. <.tar.gz> files are for Linux. All previous releases Development Version Screenshot Viewer User Support Development Roadmap My current tentative plans. Citing/Referencing AntConc Use the following method to cite/reference AntConc according to the APA style guide: Anthony, L. For example if you download AntConc 3.4.3, which was released in 2014, you would cite/reference it as follows: Anthony, L. (2014). Note that the APA instructions are not entirely clear about citing software, and it is debatable whether or not the "Available from ... " statement is needed. Word frequency lists Lemma lists Lemma list. Books/papers/websites related to AntConc Interesting applications of AntConc. [bnc] British National Corpus.

Corpus. Un article de Wikipédia, l'encyclopédie libre.

Corpus

Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie[1], etc. §Le corpus en linguistique[modifier | modifier le code] On parle de corpus pour désigner l'aspect normatif de la langue : sa structure et son code en particulier.

"Corpus" est généralement opposé à "status" (ou statut), qui correspond aux conditions d'utilisation de la langue. §Le corpus en littérature[modifier | modifier le code] Le corpus regroupe un ensemble de textes ayant une visée commune. §Le corpus dans la science[modifier | modifier le code] Les corpus sont des outils indispensables et précieux en traitement automatique du langage naturel. D'un point de vue informatif, ils permettent d'extraire des tendances et notamment de construire des ensembles de n-grammes. Corpus français  : 700 millions de mots en ligne.

Si je lui dis « capteur », il répond « megapixels, infrarouge, photosites » ou encore « température ».

Corpus français  : 700 millions de mots en ligne

Lui, c'est Corpus français, une banque de données en ligne pour explorer le lexique français contemporain écrit. Complément logique du sacro-saint dictionnaire, il a la particularité de s'adresser aux chercheurs comme au grand public. Corpus français répertorie la bagatelle de 37 millions de phrases, soit quelque 700 millions de mots issus de la presse francophone, des pages web et de l'encyclopédie Wikipédia.

Sa consultation permet de découvrir des phrases exemples autour d'un mot-clé, de constater la fréquence d'utilisation de ce mot et, mieux encore, de repérer son association à d'autres mots dans le français écrit. Centre National de Ressources Textuelles et Lexicales. Ciel-f : Le premier corpus écologique du français langue mondiale. Corpus français - Université de Leipzig. Corpus of Contemporary American English (COCA)