Lemmatisation et Racinisation en Français : Flexion, Lemme et Racine d’un mot | Blog Onyme Lemmatisation et Racinisation en Français : Flexion, Lemme et Racine d’un mot | Blog Onyme Par: Benoît TROUVILLIEZ Introduction Nous allons nous intéresser à deux techniques largement employées dans le cadre de l’analyse sémantique : La lemmatisation et la racinisation parfois appelée stemmatisation. Nous verrons notamment quelques outils utiles dans le cas du Français. Si vous voulez en savoir plus sur ce qu’est l’analyse sémantique, vous pouvez consulter cet article du blog qui explicite ce terme et quelques autres. Les Flexions et le Lemme
Etude de l’ontologie EuroWordnet | Blog Onyme Etude de l’ontologie EuroWordnet | Blog Onyme Par: Benoît TROUVILLIEZ Rappel EuroWordnet est un projet visant à construire des ontologies similaires au projet Wordnet de l’université de Princeton pour 8 langues européennes dont le français, sujet de cet étude. Un précédent article du blog peut être consulté pour plus de détails sur les ontologies et le projet EuroWordnet. Format de distribution L’ontologie EuroWordnet est distribuée sous deux formats différents (et ce quelque soit la langue choisie) : sous la forme d’une base de données et sous la forme d’un fichier texte.
Etude de l’ontologie Wordnet Libre du Français (WOLF) | Blog Onyme Etude de l’ontologie Wordnet Libre du Français (WOLF) | Blog Onyme Par: Benoît TROUVILLIEZ Cette étude concerne une version obsolète du WOLF. Veuillez vous référer à ce billet du blog pour une étude sur une version plus récente. Rappel Le WOLF (Wordnet Libre du Français) est une ontologie développée pour le français par l’Inria. Cette ontologie est en licence libre et est développé depuis 2008 à partir de la traduction du Wordnet de Princeton, développé pour la langue anglaise.
Ontologies, Wordnet, Eurowordnet et WOLF | Blog Onyme Par: Benoît TROUVILLIEZ Ontologie Une ontologie dans son sens le plus large est une structure en forme de graphe permettant d’exprimer des connaissances. Pour cela, deux types d’éléments sont utilisés : - les concepts : ce sont les nœuds du graphe. De manière général, il s’agit des éléments sur lesquels porte la connaissance. - les relations : ce sont les arcs du graphe. Ontologies, Wordnet, Eurowordnet et WOLF | Blog Onyme
TALN / Recital / DEFT 2010 : Quand le TAL s’invite à Montréal | Blog Onyme Par: Benoît TROUVILLIEZ Introduction Les conférences TALN, RECITAL et DEFT, éditions 2010, ont eu lieu à Montréal au Canada du 19 au 23 Juillet 2010. J’ai eu la chance d’y assister et d’y présenter mon article sur la fouille d’opinions. Je vous propose un petit compte-rendu de ces 5 jours riches en contenu. TALN / Recital / DEFT 2010 : Quand le TAL s’invite à Montréal | Blog Onyme
Recital 2010 : Onyme présente un article sur la fouille d’opinions | Blog Onyme Par: Benoît TROUVILLIEZ Introduction Cet article inaugure la catégorie “Conférences” du blog par la présentation de la conférence Recital 2010 à laquelle la société va participer à travers mon article “Représentation vectorielle de textes courts d’Opinions. Analyse de traitements sémantiques pour la fouille d’opinions par clustering” accepté au format poster. Recital 2010 : Onyme présente un article sur la fouille d’opinions | Blog Onyme
taln2010_submission_109