background preloader

Corpus, concordanciers, fréquenciers

Facebook Twitter

Corpus | ORTOLANG. Centre National de Ressources Textuelles et Lexicales. Frantext Issu de la base Frantext, le corpus Frantext « textes libres de droits » offre à la communauté scientifique, un large champ d’investigation où sont réunies 500 œuvres de la littérature française couvrant la période du 18e au 20e siècle. Le traitement informatique des données textuelles en format TEI XML a été réalisé par le laboratoire ATILF. L'interface de recherche permet d'effectuer des sélections au sein du corpus par genre de texte, auteur, période… Corpus journalistique de l'Est Républicain Dans le cadre d'un accord de collaboration avec L'Est Républicain, le CNRTL offre après en avoir assuré le traitement informatique, l'accès à un nouveau corpus de type journalistique.

Ce corpus est constitué des données textuelles correspondant à deux années de toutes les éditions intégrales du quotidien régional. Projet d'Etiqueteur Robuste pour l'Ecrit et pour l'Oral (PERCEO) Traitement de Corpus Oraux en Français (TCOF) Le Pèlerinage de Vie humaine de Guillaume de Digulleville. Sans titre.

Corpus d'apprenants du français

Hansard Corpus: British Parliament, 1803-2005. Redirection vers K2. Google Ngram Viewer. Explorationdecorpus.corpusecrits.huma-num. OU TROUVER DES LIVRES NUMÉRIQUES (EBOOK) SUR LE. Les corpus - Scientext. Apprentissage sur corpus. Centre National de Ressources Textuelles et Lexicales.

Corpus français - Université de Leipzig. WebCorp: The Web as Corpus. WebCorp Live lets you access the Web as a corpus - a large collection of texts from which examples of real language use can be extracted. More... Have you tried WebCorp LSE? Our large-scale search engine with more search options, part-of-speech tags and quantitative analyses. More details... Enter the word or phrase you wish to search for in this box. A case insensitive search will match both upper and lower case variants of the search terms. Span will choose the number of words or characters to display as the left and right contexts of the search term. WebCorp works 'on top of' existing web search engines.

You can also specify a language or market for the pages to search, as classified by the web search engine. Show URLs will display a link to and other meta-information for each matching web page. Pages will tell you the maximum number of web pages WebCorp will search. One concordance line per web page will retrieve only one match from each page searched. WebCorp Linguist's Search Engine. Le projet Elicop. ELICOP Corpus Search. Projet Phonologie du Français contemporain - Moteur PFC-EF. VISL Corpuseye. CORPUS CONCORDANCE FRENCH. Compleat Lexical Tutor. FREQUENCY HOME. Leeds collection of Internet corpora. The Internet corpora used here were developed using the same methodology as outlined in Sharoff, S. (2006) Creating general-purpose corpora using automated search engine queries.

In Marco Baroni and Silvia Bernardini, (eds), WaCky! Working papers on the Web as Corpus. Gedit, Bologna, Steps 2 and 3 above use customised versions of tools from Marco Baroni's BootCat, which also has a very extensive description of installation requirements and tool functions. Have a look at them. The English CC corpus has been compiled from webpages with the Creative Commons permissive licences.

The Perl scripts are free software. The interface and corpora were developed by Serge Sharoff; contact me at s.sharoff, if you have further queries. SACODEYL European Youth Language. Linguee | Dictionnaire anglais-français (et autres langues) Google Fight : make a fight with Googlefight. CORPORA: 1.9 billion - 45 million words each: free online access.