background preloader

Introduction au Text-mining

Introduction au Text-mining
Les outils de text-mining ont pour vocation d’automatiser la structuration des documents peu ou faiblement structurés. Ainsi, à partir d’un document texte, un outil de text-mining va générer de l’information sur le contenu du document. Cette information n’était pas présente, ou explicite, dans le document sous sa forme initiale, elle va être rajoutée, et donc enrichir le document. A quoi cela peut bien servir ? à classifier automatiquement des documentsà avoir un aperçu du contenu d’un document sans le lireà alimenter automatiquement des bases de donnéesà faire de la veille sur des corpus documentaires importantsà enrichir l’index d’un moteur de recherche pour améliorer la consultation des documents Bref, plusieurs usages et plusieurs services peuvent découler des solutions de text-mining. Comment çà marche ? Il y a quelques règles de base que les outils de text-mining se doivent de respecter dans leur traitement. une approche statistiqueune approche sémantique 1. 2. Les désavantages : 3.

http://www.christian-faure.net/2007/05/30/introduction-au-text-mining/

Related:  Mining Data-text-webM+J+Z+Lbo31

Recherche d'information Un article de Wikipédia, l'encyclopédie libre. La recherche d'information (RI[1]) est le domaine qui étudie la manière de retrouver des informations dans un corpus. Celui-ci est composé de documents d'une ou plusieurs bases de données, qui sont décrits par un contenu ou les métadonnées associées. Les bases de données peuvent être relationnelles ou non structurées, telles celles mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet et les intranets. Calliope - Text Mining Software Lorsque vous étudiez votre domaine d'intérêt, on peut distinguer deux phases de travail : l'acquisition, puis l'analyses des données. L'acquisition est fréquemment effectuée grâce à divers outils et techniques logiciels (moteurs de recherche, agents intelligents, push, etc) de façon systématique ou bien à la demande. L'étape suivante consiste à trier, classer et archiver l'information, en vue d'un usage immédiat ou différé.

Fouille de textes Un article de Wikipédia, l'encyclopédie libre. La fouille de textes ou "l'extraction de connaissances" dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. C'est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains. Dans la pratique, cela revient à mettre en algorithmes un modèle simplifié des théories linguistiques dans des systèmes informatiques d'apprentissage et de statistiques. Les disciplines impliquées sont donc la linguistique calculatoire, l'ingénierie du langage, l'apprentissage artificiel, les statistiques et bien sûr l'informatique.

Cluster Execution Compute clusters often run idle because of a lack of applications that can be run in the cluster environment and the enormous effort required to operate, maintain, and support applications on the grid. KNIME Cluster Execution tackles this problem by providing a thin connection layer between KNIME and the cluster, which allows every node running in KNIME and every application integrated in KNIME to be executed on the cluster. Submission of data to the cluster and collection of the results is made very simple. Long-running analysis workflows can be executed on the compute cluster, thus releasing local resources for other productive work.

Lemmatisation et Racinisation en Français : Flexion, Lemme et Racine d’un mot Par: Benoît TROUVILLIEZ Introduction Nous allons nous intéresser à deux techniques largement employées dans le cadre de l’analyse sémantique : La lemmatisation et la racinisation parfois appelée stemmatisation. Nous verrons notamment quelques outils utiles dans le cas du Français. Si vous voulez en savoir plus sur ce qu’est l’analyse sémantique, vous pouvez consulter cet article du blog qui explicite ce terme et quelques autres. Homemade Laser Rangefinder My laser range finder got a lot of interest so I thought I'd try to explain it in more detail. It's not finished yet as it still needs to be mounted on it's stepper motor with a home position switch. The sensor side has been tested on an oscilliscope. When I moved my hand in front of it, the pulse width varied to match. Below is a diagram showing how the sensor works.

Analyse de réponses à un questionnaire : exemple de pré-traitement d'une question ouverte - [Adjectif] Les réponses brutes Lors de la deuxième semaine du Mooc, un questionnaire portant sur les intentions et les motivations a été proposé aux participants. Nous allons présenter, dans ce billet, une méthode de traitement automatique pour les réponses à la question ouverte telle celle suivante : "Pouvez-vous nous préciser ce qui motive principalement votre inscription à ce MOOC ?" Créez des applications pour iPhone, iPad et iPod Touch Créer ses propres applications pour iPhone, iPad ou iPod Touch : un rêve pour beaucoup d'entre nous ! Certains disent que l'univers Apple est fermé, d'autres que les langages de programmation pour Apple sont difficiles à apprendre. Mais qu'en est-il vraiment ? En ce qui me concerne, je pense que si vous avez un peu de volonté, de temps et des idées plein la tête, vous pouvez faire des merveilles sur les périphériques portables Apple. Avec ce tutoriel, je vais vous faire découvrir l'univers merveilleux de la programmation iOS, c'est-à-dire de la programmation d'applications pour iPhone / iPod Touch / iPad, toutes versions confondues. Peu importe que vous soyez de parfaits débutants en programmation ; si tel est le cas, il vous faudra juste un peu plus de temps pour assimiler et mettre en pratique tout ce qui sera dit dans ce tutoriel.

6 solutions gratuites en ligne pour créer des nuages de mots-clés La création de nuage de mots-clés est une façon simple de cartographier des idées, des champs sémantiques, des concepts, d’évoquer des notions essentielles… Et de mettre en forme via des réglages (couleur, taille des mots, position dans l’espace, jeu de polices de caractère…) un instantané visuel qui offre une forme de représentation synthétique pour l’internaute et la personne. Ce type de mode cartographique peut être utilisé en gestion de projet, pour de la formation, de l’analyse de texte, du remue-méninges (brainstorming)… Voici 6 solutions gratuites en ligne pour créer des nuages de mots-clés : Wordle HomePage Déjà 5991 visites sur cette page. Nouveau : Une machine multi-outil facile à construire, low-cost et propulsée par Arduino, çà vous tente ? Bienvenue ! Soutenez le site www.mon-club-elec.fr !

Créer un Sondage - Comment analyser les résultats de l'enquête ? Les tris à plat : Ils consistent à établir la distribution de fréquence de chaque modalité (réponse possible) pour toutes les variables (questions). Ces tableaux de fréquence permettent de détecter les éventuelles erreurs et présentent l'avantage de donner une idée des résultats. Ils sont en général accompagnés de graphiques permettant d'avoir une vision globale des résultats.

Related: