background preloader

Web-Harvest Project Home Page

Web-Harvest Project Home Page

Web Data Harvesting: Web Scraping Software Web scraping software is an innovative tool that makes gathering lots of information relatively easy. The program has numerous implications for anyone who has the need to search for comparable information from various locations and put it into usable context. This method of finding extensive information in a short period of time is cost effective. Applications are used everyday for business, medicine, meteorology, government, and law enforcement. The software is user friendly and can be operated by anyone from non-tech data collectors to experienced Web designers. Programs are available for purchase in stores or online. A user enters the software and begins by programming an “agent”, this is the tool that will retrieve any and all information. Web scraping software provides customer information, marketing information, and competitor information. There have been legal ramifications as some have complained about intrusion and copyright infringement. Screen Scraper

Technologies méconnues pour la vie en autarcie Nombre de personnes souhaite avoir au cas où, de quoi s’en sortir un peu si quelque chose arrive, n’importe quoi: conflit majeur, grosse panne d’électricité, catastrophe naturelle, krach financier, n’importe quoi qui puisse changer notre manière de vivre de manière radicale, et en cette période d’instabilité sur la planète, toutes les options sont envisageables… Pour d’autres, le simple fait de vivre de manière plus simple et plus traditionnelle n’est pas une option, c’est devenu un but. Pourtant, qui dit sortir de ce système (volontairement ou non) dit rencontrer des difficultés, et de ce côté, chaque piste est intéressante et mérite d’être explorée. C’est pour cela que je vous relaie cette liste, peut-être certaines idées vous paraîtront intéressantes et exploitables, et peut-être même trouverez-vous des solutions auxquelles vous n’avez jamais pensé! Allez savoir… Autarcie énergétique, source de l’illustration: Retrouversonnord.be Sur le même thème dimanche 13 décembre 2015 Impensable?

Open Source Data Mining Tools | Elastic Web Mining | Bixo Labs Below is a report on the open source data mining tools session at the ACM data mining unconference this past Sunday (01 Nov 2009). This only covers tools that the panelists had used, so it’s not a survey of the available tools. See Jeff Dalton’s blog post on Java Open Source NLP and Text Mining tools for an example of a more complete list of a closely related group of tools. Weka Paul O’Rorke talked about Weka, a collection of machine learning algorithms for data mining tasks. An attendee mentioned MOA. R Language David Smith talked about R. Attendee asked about comparing Matlab & R, with respect to viability in a production environment. Attendee said many people use R for prototyping and generating models, but production uses something else. Paul mentioned that R provides a very compact representation of data mining tasks. Nicolas Cebron talked about KNIME (pronounced “naim”), a modular data exploration platform. Attendee asked about long-term viability of KNIME. Mahout Hadoop Bixo

Rand Hindi, l’homme qui veut faire disparaître les technologies « On se tutoie ? » Avant même la première poignée de main, Rand Hindi, tout juste 30 ans, se montre décontracté. Son jean gris, troué, et son t-shirt gris, échancré sur un pendentif argenté, accréditent ce côté cool. « Notre objectif est de faire disparaître les technologies à long terme. » Rien de moins ! « Context awareness » Ni prophète de malheur, ni gourou, ce passionné de maths, de gestion des données (big data) et d’informatique – il a fait une thèse en bio-informatique à l’University college de Londres – a réuni à Paris une équipe spécialisée en intelligence artificielle. « Le jour où les objets connectés seront suffisamment intelligents pour ne plus être intrusifs, on pourra en ajouter autant que l’on veut, cela n’augmentera plus les frictions mais apportera, au contraire, de la valeur », prévient-il. Magnétisme Son indéniable magnétisme et une absence de complexe sont ses premiers atouts pour servir cette grande idée. Décliner les gros chèques De quinze à trente-cinq salariés

Web Data Mining - An Introduction Innovation : la nouvelle carte du monde des dépots de brevets Accueil Si les pays de l’OCDE dominent encore l’activité brevets, certaines économies émergentes, la Chine en tête, alimentent la concurrence dans des secteurs toujours plus nombreux.(...) Cet article est réservé aux abonnés, pour en profiter abonnez-vous. Et aussi sur les Echos Les articles à la une Politique Les Républicains : NKM quitte la direction Nathalie Kosciusko-Morizet a annoncé quitter son poste de numéro deux du parti Les Républicains. Les Républicains reprennent leurs guerres intestines Au lendemain des régionales, Les Républicains ont étalé ce lundi leurs divisions. CARTE INTERACTIVE Tous les résultats ville par ville à lire également sur les echos Recommandé par Les articles les plus lus Ryad forme une vaste coalition islamique pour lutter contre le... L’Arabie saoudite annonce la formation d’une coalition islamique antiterroriste de 34 pays.... Elections régionales : combien touche un élu ? Les indemnités reçues par les élus régionaux sont encadrées par la loi et font l’objet d’un...

Carrot2 - Open Source Search Results Clustering Engine "Nous travaillons sur des modèles pour prédire ce que vous pourriez oublier", explique Eric Horvitz L’Usine Digitale : On connaît l’assistant personnel Cortana et Skype Translator, mais sur quels autres projets liés à l’intelligence artificielle travaille Microsoft Research ? Eric Horvitz : Ils sont nombreux ! Notamment dans le domaine de l’intelligence artificielle appliquée à la santé. Nous travaillons également sur la construction d’un système conversationnel riche, avec lequel les gens puissent facilement communiquer. L’intelligence artificielle aide-t-elle à rendre l’informatique plus personnelle ? Essayer de créer un système élégant pour "augmenter" les êtres humains, les aider à mieux organiser leur temps, à mieux réfléchir à leurs buts, et à mieux les atteindre, est un beau défi. Nous maîtrisons bien la vision artificielle, la reconnaissance vocale, le traitement du langage naturel, la planification… L'une des directions les plus prometteuses vise maintenant à tisser ces briques ensemble pour en faire ce que j’appelle des "symphonies" d’intelligence.

Technologie agile - Netwave L’Analyse Situationnelle Inductive Temps Réel est une technologie propriétaire et brevetée par Netwave, qui a développé sur cette base un processeur d’Intelligence Artificielle embarquant plus de 60 algorithmes spécifiques. Elle s’appuie sur les enseignements de la psychologie et de la sociologie cognitives. A l’origine : la Situation du visiteur L’Analyse situationnelle Inductive vise à reproduire les mécanismes cognitifs réflexes du cerveau. « container » de donnéesprocessus d’identification de ce que vit votre visiteurréférentiel permettant d’induire les attentes probables de votre visiteur Des données traitées de façon pragmatique La Situation est concrétisée dans une « signature situationnelle » capable d’assembler des données d’origine et de nature diverses (historique de navigation, navigation en temps réel, données CRM, réseaux sociaux….) dans un ensemble exploitable. L’Analyse Situationnelle Inductive est une technologie agile qui minimise les besoins en infrastructure.

Related: