background preloader

Text mining

Facebook Twitter

Blogs. La formation A la prA sence numA riqueledeuff2010. Comment les métadonnées permettent de vous surveiller (expliqué en patates) Le billet de Nicole Ferroni : "Métadonnées, mais t'as donné tes informations". Épisodes. Vous voulez connaître les habitudes des usagers de téléphonie mobile ? Big Data. Vous voulez rejoindre une clientèle ciblée sur le Web?

Big Data. Vous voulez décoder le secret des séries qui cartonnent sur Netflix ou savoir où réparer les nids de poule dans un quartier ? Big Data ! 2015 est l’année du Big Data. Des méga-croisements de données Des analyses statistiques, il y en a toujours eu. Aujourd’hui, on les produit par quintillions ces données. Pourtant, la véritable révolution du Big Data, ce n’est pas tant une question de grandeur que la manière dont on peut désormais croiser ces données. Catégoriser pour mieux régner Pour y voir clair dans ce fouillis d’informations, les algorithmes identifient des répétitions ou des modèles dans de larges segments de la population.

Pour que les algorithmes fonctionnent adéquatement, il faut classer les individus dans des catégories toujours plus précises. Prédictions et discriminations Faites le test Sandra Rodriguez. Extraction de données (scraping) Veille par data mining, text mining et épidémiosurveillance. Navicrawler. UPDATE: There now a portable version of Firefox with Navicrawler included: More information on these: These folders are zipped.

Navicrawler

Unzip and run “Firefox Portable”. You might have some obvious messages, and after that you have a fully functionnal Firefox 3.6 with Navicrawler installed.These are portable apps, it means that they do not interfere with other versions of Firefox that you might have. They do not install, you have to run them from their folder.Two other extensions are also installed: Flem and Greasemonkey. Regular versions: You can download the Navicrawler 1.7 or the Navicrawler 1.8b (now hosted directly on WebAtlas.fr). The Navicrawler is no longer supported.

In this “next generation Navicrawler” you will be able to dynamically change the boundaries of every website, to have graphs with pages and websites at the same time, and to declare aliases (the same website with different domain names). Documentation (in French): Quelques outils pour visualiser les réseaux sociaux. L’analyse des réseaux sociaux permet de mieux comprendre le comportement des acteurs et des communautés : quelle est la place de l’acteur au sein de l’ensemble ?

Quelques outils pour visualiser les réseaux sociaux

Est-il central ? Périphérique ? Fait-il le lien entre différentes communautés ? Comment est organisée la communauté ? En plusieurs groupes ? Cette analyse permet de comprendre en profondeur le fonctionnement des communautés en ligne. L’analyse des réseaux sociaux se fait en trois temps distincts : la récupération des données, leur analyse et leur visualisation. Sur de petits graphes, il est possible de faire la récupération des données a la main.

Les données qui sont récupérées concernent le lien : qui est lié à qui ou à quoi, mais on pourra également s’intéresser au volume d’information produits, à sa fréquence et faire quelques corrélations. Navicrawler est une extension Firefox qui explore le contenu et la structure des pages web. Guess est surtout un outil de rendu, mais il permet également de faire quelques calcul. GUESS: The Graph Exploration System. Network Workbench. CNRS 17/01/12 Les moteurs de recherche profitent aussi de la sémantique. NodeXL: Network Overview, Discovery and Exploration for Excel - Home. Gephi, an open source graph visualization and manipulation software. Outwit & co. OutWit, l'outil indispensable pour les recruteurs / sourceurs.

Je connais Michel Sarfati depuis 2010 et ma rencontre avec lui au premier #TruLondon… Nous étions les 2 seuls français présents à l’évènement.

OutWit, l'outil indispensable pour les recruteurs / sourceurs

Depuis ce fameux #TruLondon, Michel a énormément réfléchi aux questions liées au sourcing et comment avec des outils améliorer les requêtes de recherche mais aussi automatiser le recueil d’informations. Dans cet entretien, Michel nous présente un outil très populaire aux Etats-Unis, OutWit, mais créé par un français (c’est mon cocorico !) Qui aide considérablement les professionnels du recrutement. Le plus impressionnant avec cet outil est sa capacité à labourer le web et à accumuler et classer n’importe quel contenu... Je vous laisse avec Michel pour faire la connaissance de cet outil. Bonjour Michel, qui es-tu ? Je suis de formation Ingénieur (Centrale Paris 1988), et ai comme passion et spécialité l’informatique, depuis ….

En 1996, je rejoins une SSII spécialisée dans la Business Intelligence, OSIS, comme Directeur de Projet. Merci Michel ! OutWit - Harvest The Web. TUTO Apprendre l'extraction de données et le web scraping avec Web Scraping sur Tuto.com.