background preloader

OutWit - Harvest The Web

OutWit - Harvest The Web

Related:  Text mining

OutWit, l'outil indispensable pour les recruteurs / sourceurs Je connais Michel Sarfati depuis 2010 et ma rencontre avec lui au premier #TruLondon… Nous étions les 2 seuls français présents à l’évènement. Depuis ce fameux #TruLondon, Michel a énormément réfléchi aux questions liées au sourcing et comment avec des outils améliorer les requêtes de recherche mais aussi automatiser le recueil d’informations. Dans cet entretien, Michel nous présente un outil très populaire aux Etats-Unis, OutWit, mais créé par un français (c’est mon cocorico !) qui aide considérablement les professionnels du recrutement. Le plus impressionnant avec cet outil est sa capacité à labourer le web et à accumuler et classer n’importe quel contenu...

Wiki / Jobs You can select what type of results 80legs generates for you. Available options are: Unique and total count - 80legs outputs the # of unique matches and total # of matches for your content selection strings (i.e., keywords or regular expressions)Boolean array - 80legs outputs the two numbers above plus a 1 or 0 for each string, depending on whether or not that string was foundCount array - 80legs outputs the unique and total count plus the total count for each stringCode results - If you select to analyze content using code, result type will default to this option Crossfilter Fast Multidimensional Filtering for Coordinated Views Crossfilter is a JavaScript library for exploring large multivariate datasets in the browser. Crossfilter supports extremely fast (<30ms) interaction with coordinated views, even with datasets containing a million or more records; we built it to power analytics for Square Register, allowing merchants to slice and dice their payment history fluidly. Since most interactions only involve a single dimension, and then only small adjustments are made to the filter values, incremental filtering and reducing is significantly faster than starting from scratch. Crossfilter uses sorted indexes (and a few bit-twiddling hacks) to make this possible, dramatically increasing the perfor­mance of live histograms and top-K lists.

Quelques outils pour visualiser les réseaux sociaux L’analyse des réseaux sociaux permet de mieux comprendre le comportement des acteurs et des communautés : quelle est la place de l’acteur au sein de l’ensemble ? Est-il central ? périphérique ? Fait-il le lien entre différentes communautés ? Comment est organisée la communauté ?

Web-Harvest Project Home Page 1. Welcome screen with quick links 2. Navicrawler UPDATE: There now a portable version of Firefox with Navicrawler included: More information on these: These folders are zipped. Unzip and run “Firefox Portable”. Features Ready for Mission Critical Applications Simple to Use You can be up and running with Spinn3r in less than an hour. Scraping · chriso/ Wiki includes a robust framework for scraping data from the web. The primary methods for scraping data are get and getHtml, although there are methods for making any type of request, modifying headers, etc. See the API for a full list of methods. A note before you start scraping