background preloader

Data Mining, Data Science et Big Data Analytics

Data Mining, Data Science et Big Data Analytics
Cette page recense les supports utilisés pour mes enseignements de Machine Learning, Data Mining et de Data Science au sein du Département Informatique et Statistique (DIS) de l'Université Lyon 2, principalement en Master 2 Statistique et Informatique (SISE), formation en statistique et informatique, dans le cadre du traitement statistique des données et de la valorisation des big data. Je suis très attentif à la synergie forte entre l'informatique et les statistiques dans ce diplôme, ce sont là les piliers essentiels du métier de data scientist. Attention, pour la majorité, il s'agit de « slides » imprimés en PDF, donc très peu formalisés, ils mettent avant tout l'accent sur le fil directeur du domaine étudié et recensent les points importants. Cette page est bien entendu ouverte à tous les statisticiens, data miner et data scientist, étudiants ou pas, de l'Université Lyon 2 ou d'ailleurs. Nous vous remercions par avance. Ricco Rakotomalala – Université Lyon 2

http://eric.univ-lyon2.fr/~ricco/cours/supports_data_mining.html

Related:  IT LEARNINGData MiningjonathskateboardTECHNOLOGIES INTERNETData Analysis

Guide PL/SQL PL/SQL est un langage structuré en blocs, constitués d'un ensemble d'instructions. Un bloc PL/SQL peut être "externe", on dit alors qu'il est anonyme, ou alors stocké dans la base de données sous forme de procédure, fonction ou trigger. un bloc PL/SQL est intégralement envoyé au moteur PL/SQL, qui traite chaque instruction PL/SQL et sous-traite les instructions purement SQL au moteur SQL, afin de réduire le trafic réseau. [DECLARE … déclarations et initialisation]BEGIN … instructions exécutables [EXCEPTION … interception des erreurs]END; Le mot clé BEGIN détermine le début de la section des instructions exécutables Le mot clé END; indique la fin de la section des instructions exécutables Une seule instruction figure dans ce bloc : Null; qui ne génère aucune action Ce bloc PL/SQL ne fait donc absolument rien !

Qu'est-ce que le data Mining ? Exploration des données Le Data Mining, qu'est-ce que c'est ? The devil is in the details. C'est un outil d'exploration des données décisionnelles Définition : Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'exploration et l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart.

À New-York, un coiffeur coupe gratuitement les cheveux des sans-abris INSOLITE - Que feriez-vous si le dimanche était votre unique jour chômé? À cette question, le new-yorkais Mark Bustos répond inlassablement “je veux faire une bonne action pour vous aujourd'hui”. Depuis 2012, cet employé d'un salon de coiffure haut de gamme de New-York écume la ville pour offrir aux plus démunis la possibilité de se faire coiffer gratuitement. Apprentissage automatique Un article de Wikipédia, l'encyclopédie libre. L'apprentissage automatique ou apprentissage statistique (machine learning en anglais), champ d'étude de l'intelligence artificielle, concerne la conception, l'analyse, le développement et l'implémentation de méthodes permettant à une machine (au sens large) d'évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou impossibles à remplir par des moyens algorithmiques plus classiques. L'analyse peut concerner des graphes, arbres, ou courbes (par exemple, la courbe d'évolution temporelle d'une mesure ; on parle alors de données continues, par opposition aux données discrètes associées à des attributs-valeurs classiques) au même titre que de simples nombres. Un exemple possible d'apprentissage automatique est celui de la classification : étiqueter chaque donnée en l'associant à une classe. Différents systèmes d'apprentissage existent, listés ci-dessous.

Cartographie de l’information : gadget ou outil d’entreprise ? » Les points de même couleur et proches représentent des individus ayant des similarités (lieu de travail, entreprise par exemple) et / ou partageant un ensemble contacts en commun. Alors que l’on parle souvent de surabondance de l’information et que l’on cherche des remèdes pour diminuer ou minimiser ce flux d’information, la cartographie peut être un premier élément de réponse. Sans résoudre le fond du problème – s’il en est vraiment un – la cartographie de l’information dispose de plusieurs atouts face à des stocks et des flux d’information qui sont de plus en plus importants. Tout d’abord, la cartographie de l’information structure l’information. Qu’il s’agisse de clusteriser l’information pour « découvrir » des groupes de documents, d’objets qui ont des similarités ou bien de construire des arborescences documentaires parfois complexes, sur plusieurs niveaux et parfois imbriquées les unes dans les autres, la cartographie peut apporter un premier niveau de solution.

Débuter avec MongoDB pour Node.js Vous utilisez Node.js et vous souhaitez utiliser le gestionnaire de base de données NoSQL MongoDB ? Alors bienvenue dans ce petit cours ! Lorsque je me suis mis à utiliser MongoDB, j'ai eu quelques difficultés à rassembler certaines informations dont j'avais besoin, à savoir : Définition : Data mining Ecrit par B.Bathelot, mis à jour le . Glossaires : Fidélisation / CRM /CRC | Marketing direct Dans un contexte marketing, le data mining regroupe l’ensemble des technologies susceptibles d’analyser les informations d’une base de données marketing pour y trouver des informations utiles à l’action marketing et d’éventuelles corrélations signifiantes et utilisables entre les données. Sur un plan plus général, le data mining est un processus qui permet d’extraire des informations commercialement pertinentes à partir d’une grande masse d’informations.

Gravité! Du Big Bang aux Trous Noirs A propos du cours La gravité, qu’est-ce que c’est ? Le thème, si présent ces temps derniers dans les films d’Hollywood, est le fil rouge entre des concepts aussi intrigants que le Big Bang, les trous noirs, l’énergie sombre, l’espace-temps, les ondes gravitationnelles, l’expansion de l’Univers. Si ces questions vous intéressent, ce cours vous est destiné. Il ne demande pas de connaissances particulières en physique, juste de la curiosité pour comprendre notre Univers et la place que nous y occupons.

7 frameworks HTML5 pour créer une application web mobile Pour plus d'information sur Cr@zy WS, je vous invite à vous rendre dans la partie à propos où j'explique les grandes lignes de ce site consacré en grande partie à l'actualité Hack, Sécurité, High-Tech et Webdev. Newsletter et réseaux sociaux Pour suivre les dernières news du site, essayez les différents types d'abonnements disponibles et rejoignez-moi sur les réseaux sociaux. Cr@zy's Apps En dehors des scripts que je développe, il y a le sous-domaine Cr@zy's Apps qui est consacré aux applications externes que j'ai pu développer. Sécurité Tutoriel Hadoop Hadoop est un système distribué, tolérant aux pannes, pour le stockage de données et qui est hautement scalable. Cette capacité de monter en charge est le résultat d'un stockage en cluster à haute bande passante et répliqué, connu sous l'acronyme de HDFS (Hadoop Distributed File System) et d'un traitement distribué spécifique et robuste connu sous le nom de MapReduce. Hadoop traite et analyse une multitude de nouvelles et anciennes données pour en extraire de la connaissance significative sur les opérations commerciales. Concrètement les données sont déplacées vers un nœud de calcul.

Related:  DataMiningPresse - Documentation