DATA MINING

http://chirouble.univ-lyon2.fr/~ricco/data-mining/

Add-in Sipina pour Excel 2007 et 2010 - Sipina - Arbres de décision Vendredi 27 août 2010 5 27 /08 /Août /2010 13:33 La macro complémentaire sipina.xla participe largement à la diffusion du logiciel Sipina. Dans un environnement qui lui est familier, le tableur, l'utilisateur peut manipuler / transformer / recoder les données à sa guise avant de les envoyer vers le logiciel spécialisé de Data Mining. Exit les problèmes de compatibilités entre formats de fichiers, les points décimaux capricieux, etc. Il lui suffit de sélectionner les données puis de cliquer sur un nouveau menu intégré dans Excel. Nous avons décrit l'installation et l'utilisation de l'add-in dans Office 2000 (la procédure est valable jusqu'à Office 2003).

Définition : Datamining Le datamining désigne l’ensemble des techniques et méthodes dans les domaines des statistiques, des mathématiques et de l’informatique qui permettent de sortir d’un grand volume de données, des connaissances précises sur des éléments inconnus auparavant. Cette technique permet d’analyser et d’interpréter des données volumineuses, contenues dans une ou plusieurs bases de données afin de dégager des tendances. Le datamining est en mesure de créer des catégories statistiques composées d’éléments similaires afin de proposer des hypothèses.

Supports de cours Cette page recense les supports utilisés pour mes enseignements de Machine Learning, Data Mining et de Data Science au sein du Département Informatique et Statistique (DIS) de l'Université Lyon 2, principalement en Master 2 Statistique et Informatique pour la Science des donnéEs (SISE), formation en data science, dans le cadre du traitement statistique des données et de la valorisation des big data. Je suis très attentif à la synergie forte entre l'informatique et les statistiques dans ce diplôme, ce sont là les piliers essentiels du métier de data scientist. Attention, pour la majorité, il s'agit de « slides » imprimés en PDF, donc très peu formalisés, ils mettent avant tout l'accent sur le fil directeur du domaine étudié et recensent les points importants.

Définition : Data mining Ecrit par B.Bathelot, mis à jour le . Glossaires : Fidélisation / CRM /CRC | Marketing direct Dans un contexte marketing, le data mining regroupe l’ensemble des technologies susceptibles d’analyser les informations d’une base de données marketing pour y trouver des informations utiles à l’action marketing et d’éventuelles corrélations signifiantes et utilisables entre les données. Sur un plan plus général, le data mining est un processus qui permet d’extraire des informations commercialement pertinentes à partir d’une grande masse d’informations. « Le data mining client est un processus de management des données client qui opère à partir des données élémentaires pour produire de l’information, de la connaissance en vue d’une action bien déterminée vis à vis des clients »(Michel Jambu). Le data mining fait appel à des techniques très complexes.

Blog eye tracking : ergonomie web, tests utilisateur Le eye tracking comme outil pour la sécurité aérienne Le magazine belge L’écho publie aujourd’hui un article sur la technologie de eye tracking Pertech. Cet article présente l’oculomètre Pertech entre comme outil pour la sécurité aérienne. L’article est à télécharger au format pdf ici-même : Le eye tracking comme outil pour la sécurité aérienne Qu'est-ce que le data Mining ? Exploration des données Le Data Mining, qu'est-ce que c'est ? The devil is in the details. C'est un outil d'exploration des données décisionnelles Définition : Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'exploration et l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart. Les techniques mises en action lors de l'utilisation de cet instrument d'analyse et de prospection sont particulièrement efficaces pour extraire des informations significatives depuis de grandes quantités de données. À quoi ça sert ?

Big Data : pourquoi nos métadonnées sont-elles plus personnelles que nos empreintes digitales A l’occasion du colloque « la politique des données personnelles : Big Data ou contrôle individuel « organisé par l’Institut des systèmes complexes et l’Ecole normale supérieure de Lyon qui se tenait le 21 novembre dernier, Yves-Alexandre de Montjoye (@yvesalexandre) était venu présenter ses travaux, et à travers lui, ceux du MediaLab sur ce sujet (Cf. « D’autres outils et règles pour mieux contrôler les données » ). Yves-Alexandre de Montjoye est doctorant au MIT. Il travaille au laboratoire de dynamique humaine du Media Lab, aux côtés de Sandy Pentland, dont nous avons plusieurs fois fait part des travaux. Nos données de déplacements sont encore plus personnelles que nos empreintes digitales Faire correspondre des empreintes digitales n’est pas si simple, rappelle Yves-Alexandre de Montjoye.

Data centers: la donnée écolo Il y en a des milliers dans le monde. Plus d’une centaine en France. Les data centers sont la face cachée d’Internet ; on y a recours tous les jours.